La structure d'un fichier contenant des étiquettes ICRA
Les étiquettes ICRA sont contenues dans un fichier spécial, généralement appelé labels.rdf. Ce fichier se divise en plusieurs sections pour fournir aux filtres et aux autres clients les informations dont ils ont besoin. L'exemple (imaginaire) ci-dessous permet de mieux comprendre ceci :
Section 1
|
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:label="http://www.w3.org/2004/12/q/contentlabel#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:icra="https://icra.org/rdfs/vocabularyv03#">
|
Section 2
|
<rdf:Description rdf:about="">
<dc:creator rdf:resource="https://icra.org" />
<label:authorityFor>https://icra.org/rdfs/vocabularyv03#
</label:authorityFor>
</rdf:Description>
|
Section 3
|
<label:Ruleset>
<label:hasHostRestrictions>
<label:Hosts>
<label:hostRestriction>example.org</label:hostRestriction>
<label:hostRestriction>example.com</label:hostRestriction>
</label:Hosts>
</label:hasHostRestrictions>
<label:hasDefaultLabel rdf:resource="#label_1" />
|
Section 4
|
<label:rules rdf:parseType="Collection">
<rdf:Description>
<label:hasURI>photography</label:hasURI>
<label:hasLabel rdf:resource="#label_2"/>
</rdf:Description>
<label:UnionOf>
<label:hasURI>guestbook</label:hasURI>
<label:hasURI>messages</label:hasURI>
<label:hasLabel rdf:resource="#label_3" />
</label:UnionOf>
</label:rules>
</label:Ruleset>
|
Section 5
|
<label:ContentLabel rdf:ID="label_1">
<rdfs:comment>Label for all/most of website</rdfs:comment>
<rdfs:label>No nudity, no sexual content, no violence, no
potentially offensive language, no potentially harmful
activities, no user-generated content</rdfs:label>
<icra:nz>1</icra:nz>
<icra:sz>1</icra:sz>
<icra:vz>1</icra:vz>
<icra:lz>1</icra:lz>
<icra:oz>1</icra:oz>
<icra:cz>1</icra:cz>
</label:ContentLabel>
<label:ContentLabel rdf:ID="label_2">
<rdfs:comment>Label for photography section</rdfs:comment>
<rdfs:label>Exposed breasts, Bare buttocks, No sexual
content, no violence, no potentially offensive language,
no potentially harmful activities, no user-generated
content, This material appears in an artistic
context</rdfs:label>
<icra:na>1</icra:na>
<icra:nb>1</icra:nb>
<icra:sz>1</icra:sz>
<icra:vz>1</icra:vz>
<icra:lz>1</icra:lz>
<icra:oz>1</icra:oz>
<icra:cz>1</icra:cz>
<label:hasModifier><icra:xa /></label:hasModifier>
</label:ContentLabel>
<label:ContentLabel rdf:ID="label_3">
<rdfs:comment>Label for guestbook and message board</rdfs:comment>
<rdfs:label>No nudity, no sexual content, no violence, no
potentially offensive language, no potentially harmful
activities, user-generated content
(moderated)</rdfs:label>
<icra:nz>1</icra:nz>
<icra:sz>1</icra:sz>
<icra:vz>1</icra:vz>
<icra:lz>1</icra:lz>
<icra:oz>1</icra:oz>
<icra:ca>1</icra:ca>
</label:ContentLabel>
</rdf:RDF>
|
Section 1
La première section donne des informations sur la façon dont les données sont codées. Le dernier élément (xmlns:icra="https://icra.org/rdfs/vocabularyv03#"), par exemple, indique que des étiquettes ICRA sont présentes. Les autres indications se rapportent à des normes et à des méthodes Internet qui peuvent être utilisées par n'importe quel système d'étiquetage.
Note technique : les deux premiers espaces de nommage XML utilisés sont les indications standard pour RDF et RDF Schema. L'espace de nommage « étiquette » est un schéma permettant d'utiliser RDF pour étiqueter le contenu. Bien que ceci soit hébergé sur w3.org, cela ne fait pas actuellement partie des Recommandations du W3C.
Revenir à l'exemple
Section 2
Cette courte section indique que les étiquettes ont été créées par l'ICRA et que de plus amples informations sont disponibles sur icra.org
Revenir à l'exemple
Section 3
Cette section indique les sites Web pour lesquels les données sont valides. Dans le cas présent, nous avons indiqué que les étiquettes peuvent être appliquées à example.org et à example.com. Cela indique également que l'étiquette par défaut pour le contenu hébergé ici est l' « étiquette 1 » (voir section 5).
Note technique : en fait, nous avons spécifié un hôte plutôt qu'un domaine, car c'est généralement ce qui est demandé. Tous les sous-domaines de l'hôte déclaré entrent dans le champ d'application et peuvent être concernés par les règles qui suivent.
Revenir à l'exemple
Section 4
Nous indiquons à présent les règles qui déterminent les endroits où l'étiquette par défaut devrait être ignorée au profit d'une autre étiquette. Dans cet exemple, tout ce qui se trouve dans la section photographie de example.com et de example.org sera associé à l' «étiquette n° 2 », tout ce qui contient le mot guestbook ou le mot messages dans l'URL sera associé à l'étiquette 3. Sinon, l'étiquette par défaut s'applique.
Si un site Web ne possède pas son propre nom de domaine, mais fait partie d'un progiciel fourni par un FAI (du genre www.fai.com/~nom d'utilisateur), l'étiquette n° 1 ne sera associée qu'aux pages personnelles de l'utilisateur, et non pas à tout le domaine du FAI. C'est pourquoi la première question que pose le générateur d'étiquettes est « veuillez entrer l'adresse de votre page d'accueil » - à partir de cette adresse, le générateur d'étiquettes détermine ce qu'il doit faire pour s'assurer que l'étiquette ne couvre que ce qui est prévu.
Note technique : la correspondance s'effectue à l'aide des expressions habituelles Perl 5 pour faire en sorte que si une règle doit être appliquée à « toutes les URL finissant par .jpg », cela apparaisse sous la forme \.jpg$. S'il est nécessaire de limiter les étiquettes à un chemin sur les hôtes donnés, ceci est indiqué séparément dans un trait sémantique hasURI de la règle définie.
Revenir à l'exemple
Section 5
Enfin, nous indiquons les étiquettes elles-mêmes. Dans l'exemple, l'étiquette 2 indique qu'il y a une poitrine dénudée, des fesses dénudées et que le contenu apparaît dans un contexte à vocation artistique. L'étiquette 3 indique qu'il y a un contenu contrôlé généré par l'utilisateur et l'étiquette 1 indique « aucun des éléments ci-dessus » dans toutes les catégories du vocabulaire de l'ICRA.
Revenir à l'exemple
Powered by |
|
|
 |
 |
|