Reglas para procesar las etiquetas RDF de ICRA
Introducción
El sistema ICRA está diseñado para permitir a los proveedores de sitios Web etiquetar el contenido de sus páginas de forma rápida, eficiente y flexible. Para poder asegurar unos resultados fiables para los usuarios, la manera en que los diferentes tipos de filtros procesan las etiquetas debe ser homogénea. A continuación se definen las reglas de proceso recomendadas para permitir a los proveedores de contenido determinar el método más conveniente de etiquetar su propio material.1
También hay disponible un módulo de referencia e información técnica detallada para los creadores de filtros, incluyendo cómo los datos de auto-etiquetado pueden utilizarse junto con fuentes de datos procedentes de terceros.
Para cierto tipo de material (página, imagen, etc.), hay tres fuentes de etiqueta posibles2.
- Puede que exista la posibilidad de determinar una etiqueta procesando los datos ya incluidos en el caché del filtro (memoria). Estas etiquetas se identifican a continuación como etiquetas de Tipo 1.
- Un tipo de material puede incluir un enlace hacia datos que contengan reglas que pueden seguirse para identificar una etiqueta. Las etiquetas identificadas en las fuentes de datos y que han sido enlazadas a partir del material, se identifican a continuación como etiquetas de Tipo 2.
- Cierto material puede incluir un enlace directo hacia una etiqueta. Las etiquetas identificadas por un enlace directo efectuado a partir del material, se identifican a continuación como etiquetas de Tipo 3.
Tal como se describe a continuación, los filtros DEBERÍAN asignar prioridades crecientes a cada una de estas fuentes.
Pasos a seguir antes de recuperar el material
 |
Figure 1: Procesamiento que debe efectuarse antes de enviar una solicitud a Internet.
|
Si el filtro ya posee en su caché una etiqueta para la dirección URL solicitada, habrá inmediatamente disponible una etiqueta de Tipo 1. Si dicha etiqueta ha sido previamente recuperada desde el mismo sitio Web que la dirección URL que nos ocupa en este momento, se DEBERÍA considerar la etiqueta como perteneciente al Tipo 2.
Si los datos de la etiqueta en el caché han sido recuperados desde un sitio Web diferente, seguirá siendo del Tipo 1 y se deberá extraer el material para verificar sus datos.
En resumidas cuentas:
- Una etiqueta de Tipo 1 NO DEBE utilizarse para bloquear el acceso a una dirección URL antes de que haya sido extraída.
- Una etiqueta de Tipo 2 PUEDE utilizarse para bloquear el acceso a una dirección URL antes de que haya sido extraída.
Existen varias razones para esto, pero en líneas generales, la idea es que aquellas etiquetas enlazadas desde el material se "parecen más" a las de un proveedor de contenido que las etiquetas que hubieran podido ser publicadas por una persona con pocos o ningún vínculo con el contenido descrito. Este punto se desarrolla en el apartado siguiente, en el que se da una prioridad aún mayor a las etiquetas que se enlazan a partir del material propiamente dicho.
No se deberán confundir las etiquetas de Tipo 1 con el etiquetado efectuado por terceros. Si se configura un filtro para que solicite etiquetas procedentes de terceros (como una base de datos en línea o un analizador de contenido), el filtro tratará estos datos por separado. Las etiquetas de Tipo 2 sólo tienen prioridad sobre las de Tipo 1 en lo que al contexto del autoetiquetado se refiere.
Si no hay ningún dato en el caché del filtro, DEBERÁ extraerse el material existente en la dirección URL.
 |
Figure 2 Reglas de procesamiento una vez que se ha recuperado el material.
|
Cómo identificar la etiqueta correcta
Si el material incluye enlaces hacia datos de la etiqueta, puede que sea necesario extraerlos y procesarlos. (Recuerde que las etiquetas siempre se conservan por separado y nunca en el material en sí.)
Si el material incluye un enlace hacia una etiqueta específica, ésta se clasificará como perteneciente al Tipo 3. Debido a que éste es que tiene la prioridad más alta en la jerarquía, una vez que haya una etiqueta de Tipo 3 disponible, no será necesario ningún otro tipo de procesamiento para identificar la etiqueta correcta que debe utilizarse para este material.
Sin embargo, los sistemas clientes DEBERÍAN comprobar las restricciones de los sistemas anfitrión. Está claro que una etiqueta sólo podrá reconocerse como válida si el material a la que está enlazada procede del sistema o sistemas anfitrión que se han definido. Si no se indica ninguna restricción por parte del sistema anfitrión, el sistema cliente PODRÁ aceptar la etiqueta.
La prioridad otorgada a las etiquetas de Tipo 3 es la etapa crucial que permite a un proveedor de contenido trabajar con el concepto de una etiqueta definida por defecto que puede ignorarse a nivel local.
Si el material incluye un enlace hacia el mismo material que ya se había procesado anteriormente para identificar una etiqueta de Tipo 2, está claro que no será necesario efectuar ningún otro procesamiento, ya que la etiqueta correcta ha sido previamente identificada.
Sin embargo, si un enlace sirve de conexión a una fuente de datos diferente de la que ya se había utilizado para desviar una etiqueta de Tipo 2, los nuevos datos DEBERÍAN procesarse. Esto se debe a que es posible incluir cualquier número de archivos de datos en un sitio Web y asumir que aquél que se ha enlazado desde el material es precisamente el que el proveedor de contenido tenía la intención de utilizar.
Si el material no incluye ningún enlace, está claro que la única información disponible es aquella que estaba disponible antes de recuperar el material.
Si hay disponibles varias etiquetas del mismo Tipo, será indicativo de que el proveedor de contenido ha cometido un error. El filtro PUEDE utilizar cualquiera de ellas, pero por razones de eficacia, sólo utilizará la primera encontrada para un cierto tipo de etiqueta.
Modificación de la etiqueta
En esta etapa, el filtro ha comprobado si existe una etiqueta disponible y, en caso de haber etiquetas múltiples, ha seleccionado la correcta.
Si no hay etiqueta disponible para cierto tipo de material, ICRA recomienda que, por defecto, el filtro lo permita, a menos que se trate de una página Web (X)HTML. La decisión de que se puedan bloquear o permitir páginas Web (X)HTML sin etiqueta deberá estar bajo el control del usuario.
La razón para ello es que si se etiqueta una página, el autor ha querido probablemente que la etiqueta cubra todos los elementos dentro de la página. Puede incluso no ser consciente de que cada imagen, archivo de texto externo y hoja de estilo, se solicitan por separado en Internet. El acceso directo a una imagen es menos frecuente. Es decir, sin que se muestre la imagen en una página o sin que el usuario encuentre la imagen siguiendo un enlace en una página HTML o de tipo XHTML.
Finalmente, si bien es fácil que todos los administradores de sitios Web incluyan tags de enlace en páginas HTML o de tipo XHTML, enlazando por ejemplo una imagen a una fuente de datos, seguirá siendo necesario configurar el servidor. Este punto suele ser generalmente responsabilidad de los profesionales.
Impulsado por |
|
ICRA España |
 |
 |
|