MINTSERVICES

2/6 – El agregador del Proyecto Linked Heritage

Linked Heritage (2011-2013) es una iniciativa coordinada por el Instituto Central para el Catálogo Único de Bibliotecas Italiano, que depende de MiBAC, y extiende e implementa los resultados del proyecto ATHENA. Esta es una red de buenas prácticas financiada por el Séptimo Programa Marco (7PM) y que empezó en abril de 2011 y durará 30 meses. Contribuirá con nuevos contenidos en Europeana, provenientes del sector público y del privado (principalmente editores), mejorará la calidad de los contenidos en términos de riqueza de los metadatos, potencial reúso e unicidad, explorará el potencial del Linked Open Data y permitirá una mejor búsqueda, recuperación y uso de los contenidos publicados en Europeana.

Los proveedores de contenidos de Linked Heritage

Veintidós países son miembros del consorcio Linked Heritage: ministerios de cultura, agencias del gobierno, museos, bibliotecas y agregadores nacionales, centros de investigación, editoriales y PYMES, así como también otras organizaciones que contribuyen a Europeana por primera vez con 3 millones de registros de varios contenidos culturales.

Agregando contenidos

Servicio de Interoperabilidad de Metadatos (MINT)

MINT: Servicio de Interoperabilidad de Metadatos se compone de una plataforma web que fue diseñada y desarrollada para facilitar las iniciativas de agregación de contenidos del patrimonio cultural y metadatos en Europa.

Sus funciones son servir para la ingestión de contenidos y está basado en software Open Source desarrollado por la Universidad Nacional Técnica de Atenas (NTUA) en el contexto del proyecto ATHENA.

MINT permite a los proveedores de contenidos cargar, mapear, validar y entregar metadatos para ser enviados a Europeana en un entorno web.

La plataforma también provee un sistema de gestión para usuarios y organizaciones que permite el despliegue y la operación de diferentes esquemas de agregación con sus correspondientes roles y derechos de acceso.

Mapeando contenidos

Los registros de Metadatos son críticos para la documentación y mantenimiento de interrelaciones entre fuentes de información, y son usados para buscar, reunir y mantener recursos durante largos períodos de tiempo. Los metadatos descriptivos, administrativos, técnicos y de preservación contribuyen a la gestión de los recursos de información y ayudan a asegurar su integridad intelectual hoy y en el futuro.

Un esquema crosswalk provee un mapeado de elementos de metadatos desde un esquema a otro. Soporta la habilidad de recuperar contenidos iguales o similares en diferentes fuentes de datos, crosswalks soporta la llamada Interoperabilidad Semántica.

La tecnología de la plataforma Linked Heritage, MINT, implementa una infraestructura de agregación ofreciendo mecanismos crosswalk para apoyar el seguimiento de actividades críticas:

  • colecta y agregación de registros de metadatos, ya sea por estándar o esquema propietario;
  • migración de los modelos de contenidos de los propietarios a un modelo de referencia;
  • transformación de los registros del modelo de Linked Heritage a los Europeana Semantic Elements (ESE) y de Europeana Data Model (EDM).

LIDO como modelo referencia de metadatos de Linked Heritage

MINT permite el mapeado y transformación de metadatos al registro de LIDO.

LIDO defiende los Objetos de Información Descriptiva Ligeros. Este es el resultado de un esfuerzo colaborativo de stakeholders internacionales del sector museístico, que empezó en 2008, para crear una solución común para contribuir con contenidos de patrimonio cultural a las aplicaciones web.

LIDO está basado en el modelo conceptual de referencia CIDOC-CRM. Este procede de la integración entre el CDWA Lite y el esquema de metadatos Museumdat, que está basado en el estándar SPECTRUM. Siendo una aplicación del CIDOC-CRM, este provee un formato explícito para entregar información de objetos de museos de una manera estandarizada.

MINT implementó LIDO como un esquema de colecta intermedio. Inicialmente fue concebido para las necesidades del sector museístico, ahora es usado de manera transversal para contenidos culturales probando su adaptabilidad y efectividad, preservando su integridad y riqueza de metadatos.

El perfil de metadatos ESE

MINT permite convertir los registros de metadatos LIDO en Europeana Semantic Elements (ESE).

ESE es un modelo de datos basado en la esencia del núcleo del conjunto de datos de Dublin Core con 12 elementos específicos adicionales de Europeana. Los proveedores de contenidos deben conformar sus metadatos con el perfil ESE, necesario para mostrar el registro correctamente en Europeana.

ESE es un subconjunto de Europeana Data Model (EDM), el nuevo perfil de aplicación que será implementado en los próximos meses. El perfil EDM es soportado por MINT (ver: MINT screencast EDM Ingestion Tool).

Elementos de metadatos obligatorios

Los elementos de metadatos obligatorios de ESE y LIDO son los siguientes:

  • dc:title
  • dc:type
  • europeana:type
  • dc:language (mandatory if europeana:type="TEXT")
  • dc:identifier
  • europeana:dataProvider
  • dc:source
  • europeana:isShownAt
  • europeana:object
  • europeana:isShownBy
  • europeana:rights
  • dc:rights


Click para descargar (PDF)

El maping completo de la tabla LIDO v1.0 al ESE v3.4 realizado por Regine Stein (Philipps-Universitaet Marburg - Bildarchiv Foto Marburg) está disponible en Uso de contenidos en Linked Heritage y Europeana (v.5), Anexo 3, preparado por el Linked Heritage DEA Task Force (ver también Agregación de contenidos: herramientas y directrices).

Flujo de Metadatos

MINT ofrece funciones como servidor de ingesta de metadatos, permitiendo a los proveedores de contenidos:

  • cargar sus conjuntos de datos, que pueden ser estructurados en esquemas de datos heterogéneos y mapearlos en LIDO;
  • transformar los registros de metadatos en registros LIDO y convertirlos en ESE;
  • validar los contenidos a través de Europeana Content Checker;
  • y transmitir contenidos a la oficina de ingesta de Europeana vía OAI-PMH Protocol.

Sin embargo, los proveedores de contenidos pueden ser requeridos por Europeana para comprobar otra vez la calidad del contenido una vez publicado online y asesorar ante posibles incidencias.

El siguiente gráfico resume la ingestión de datos en MINT y el flujo de metadatos hacia Europeana:

.  Linked Heritage, June 2013
El flujo de trabajo. Linked Heritage, Junio 2013

Licencias de contenido

Acuerdo de Intercambio de datos en Europeana (DEA)

El acuerdo de Intercambio de datos en Europeana es la nueva licencia adoptada por Europeana en Septiembre de 2011. El DEA prevé que los metadatos descriptivos (no las miniaturas) están sujetas a la Creative Commons CC0 1.0 Universal Public Domain Dedication, lo cual significa que la divulgación del contenido, como dominio público, permite el reúso con carácter comercial de los metadatos.

Esto implica la posibilidad para Europeana de soportar el abierto re-uso de datos y publicar metadatos como Linked Open Data (LOD).

La suscripción al DEA es obligatoria para todos los proveedores de contenidos para poder poner sus colecciones a disponibles Europeana.

El Grupo de trabajo del DEA Linked Heritage

El Grupo de trabajo del DEA Linked Heritage fue establecido para presentar al consorcio de Linked Heritage maneras prácticas de completar las tareas del proyecto (lo que implica suscribirse al DEA) y mantener la integridad de sus datos.

El grupo de trabajo elaboró una estrategia que proporciona a los proveedores de contenidos 3 opciones para la publicación de metadatos:

  1. Publicar un conjunto mínimo de metadatos en Europeana: de los metadatos que son proporcionados a la herramienta de ingesta de Linked Heritage por el proveedor de contenidos, solo el LIDO y ESE son elementos obligatorios, que serán transmitidos a Europeana bajo licencia Creative Commons CC0 1.0 Universal Public Domain Dedication.



  2. Publicar un conjunto intermedio de metadatos en Europeana: de los metadatos que se proporcionan a la herramienta de ingesta de Linked Heritage por el proveedor de contenidos, todos los elementos de metadatos serán transmitidos a Europeana bajo licencia Creative Commons CC0 1.0 Universal Public Domain Dedication, excepto los elementos de LIDO resultantes en dc:descripción. Esto significa que no habrá descripción del objeto, la parte que más probablemente contiene información sensible o de valor, visible en Europeana.



  3. Publicar un conjunto completo de metadatos en Europeana: de los metadatos que se proporcionan a la herramienta de ingesta de Linked Heritage por el proveedor de contenidos, todos los elementos de metadatos serán transmitidos a Europeana bajo licencia Creative Commons CC0 1.0 Universal Public Domain Dedication.



MINT implementó una opción de filtro que permite a los proveedores de contenidos seleccionar su favorito durante el proceso de agregación (ver screencast Como establecer un filtro de metadatos en MINT).

A pesar del conjunto mínimo de metadatos obligatorios requeridos, tanto Europeana como Linked Heritage animan a los proveedores de contenidos a publicar el más amplio rango de información posible mediante el portal de Europeana, para una mejor exposición y explotación de contenidos para los usuarios y ofrecer una experiencia mucho más rica.

Hasta el momento, la mayoría de socios de Linked Heritage se han suscrito al DEA.

Proveyendo contenidos

La metodología de Linked Heritage: flujo de trabajo

Asesorando a los proveedores de contenidos de colecciones digitales de Linked Heritage (la encuesta de Linked Heritage)

El primer paso para establecer los flujos de trabajo para la agregación de contenidos en Europeana es evaluar las colecciones digitales que los proveedores de contenidos han descrito en Descripción de Trabajo (PDF), disponible en el área reservada de la web de Linked Heritage.

Esta evaluación puede realizarse fácilmente, por ejemplo, mediante una plantilla. Se pidió a los proveedores de Linked Heritage responder una encuesta con la siguiente información:

  • País
  • Datos del proveedor
  • Contacto principal
  • Contacto técnico
  • URL de la colección
  • Cantidad de metadatos a ser agregados
  • Cantidad de objetos digitales relacionados con los metadatos
  • Tipos de objeto: imagen, texto, sonido, video
  • Descripción
  • Formatos de Metadatos usados
  • Derechos

Como Europeana solo agrega metadatos, es de primordial importancia preguntar el número de metadatos y objetos digitales por separado, ya que no siempre se mantienen el ratio 1 metadato : 1 objeto digital y no puede ser una regla.

Formación y material didáctico

Sesiones presenciales de formación sobre el mapeo de LIDA usando MINT fueron organizadas con los proveedores de contenidos.

Durante el taller de formación, se entregó documentación a todos los partners del proyecto.

Además, una sección específica dedicada a herramientas y directrices para la agregación de contenidos fue publicada dentro de la web de Linked Heritage.

El servicio de Help-desk y preguntas frecuentes

Al principio del proyecto se estableció un servicio de help-desk para dar soporte a los proveedores de contenidos ante posibles problemas e incidencias. El FAQ también fue elaborado y publicado en la web de Linked Heritage.

Comunidad

El flujo de trabajo y la metodología de feedback es fundamental para dar asistencia a los proveedores de contenidos y mantener el proceso de agregación bajo control; esto también contribuye a la sensación de creación de comunidad.

Entrevistas periódicas, revisiones constantes de las cuestiones principales de agregación, el análisis de informes de datos del MINT junto con las actualizaciones de los materiales didácticos es crucial para el beneficio del éxito global del proyecto.

Flujos de trabajo de Linked Heritage y Europeana

La figura de abajo resume la manera en que los metadatos contribuyen con Europeana a través del proyecto Linked Heritage.


Los Flujos de trabajo de Linked Heritage y Europeana. Michael Hopwood (EDItEUR), Diciembre 2011