MINT-SERVICES

2/6 – Linked Heritage-projektets aggregeringsverktyg

Linked Heritage (2011-2013) är ett projekt som koordineras av Central Institute for Union Catalogue of the Italian Libraries, som är en del av MiBAC, som vidareutvecklar och implementerar resultat från tidigare Athena-projekt. Det är ett nätverk för bästa praxis som har finansierats inom FP7. Linked Heritage startade i april 2011 och är ett projekt omfattande 30 månader. Projektet bidrar med ytterligare metadata till Europeana, både från offentlig och privat sektor (främst förlag) och förbättra kvaliteten på innehållet. Vidare bidrar projektet till att utforska potentialen i länkade öppna kulturarvsdata och återanvändning av det samt och förbättra möjligheterna till sökning, hämtning och användning av metadata som publiceras via Europeana.

Projektets innehållsleverantörer

Konsortiet bakom Linked Heritage består av tjugotvå partner, däribland: kulturministerier, statliga myndigheter, museer, bibliotek, arkiv, ledande forskningscentra förlag och små företag, varav några levererar till Europeana för första gången. Målet är att dessa tillsammans skall bidra med 3 miljoner kulturarvsmetadata.

Aggregering

Metadata Interoperability Services (MINT)

MINT: Metadata Interoperability Services är en webbaserad plattform som har utformats och utvecklats för att underlätta aggregering av metadata från europeiska institutioner. Med hjälp av verktyget kan metadata transfereras till Europeana. Det och är baserat på öppen programvara som utvecklats av det nationella tekniska universitetet i Aten (NTUA) inom ramen för Athena-projektet.

Med verktyg kan man i en och samma webbmiljö: ladda upp, mappa, validera och leverera metadata som ska skickas till Europeana.

MINT möjliggör också administration av olika mappningsscheman samt användarroller och rättigheter.

Mappning

Metadataposter är viktiga för att dokumentera och hantera relationerna mellan informationsresurser. De används för att hitta, samla och bevara resurser över tid. Beskrivande-, administrativa-, tekniska- och bevarandemetadata bidrar till förvaltningen av informationsresurser och hjälper till att säkerställa deras integritet både nu och i framtiden.

En s.k. ”crosswalk” möjliggör mappning av metadata och fält från ett metadataschema till ett annat. Genom att skapa möjligheterna att ta fram samma eller liknande data från olika datakällor, stödjer man sk semantisk interoperabilitet.

I Linked Heritage-projektets har MINT en aggregeringsinfrastruktur som erbjuder en metadataväxel för att stödja följande aktiviteter:

  • skördning och aggregering av metadata i ett standardiserat eller proprietärt (tillverkarägt) schema
  • migrering från innehållsleverantörernas modell till en referensmodell
  • transformering av poster från Linked Heritage modellen (LIDO) till Europeana Semantic Elements (ESE) och Europeana Data Modell (EDM).

LIDO som Linked Heritage projektets referensmodell för metadata

MINT möjliggör aggregering och mappning av metadata till LIDO-formatet. LIDO står för Lightweight information Describing Objects. LIDO är resultat av ett samarbete mellan internationella aktörer inom museisektorn, som påbörjades 2008, med syfte att skapa en gemensam lösning för att tillföra kulturarvsinnehåll till webbapplikationer.

LIDO är baserad på CIDOC-CRMs konceptuella referensmodell och bygger på en sammansmältning mellan CDWA Lite och museumdat samt SPECTRUM. Som en tillämpning av CIDOC-CRM definierar den ett standardiserat format för att leverera objektinformationen på.

I MINT har LIDO implementerats som en mellanliggande schema för metadatskörd. Även om LIDO ursprungligen var framtagen för museisektorns behov används det idag i domänöverskridande sammanhang pga dess anpassningsförmåga och möjlighet till bevarande av integriteten hos rika metadata.

ESEs metadataprofil

MINT möjliggör mappning av metadata från LIDO till ESE (Europeana Semantic Elements).

ESE är en datamodell baserad på Dublin Core med ytterligare tolv särskilda Europeana-element. Innehållsleverantörer måste anpassa sina metadata till ESE metadataprofil för att informationen ska kunna visas korrekt i Europeana.

ESE är en del av Europeana Data Model (EDM), det nya formatet som kommer att implementeras under de kommande månaderna. MINT stödjer även EDM-metadataprofil (se: skärminspelningen EDM Ingestion Tool).

Obligatoriska metadataelement

De obligatoriska metadataelementen i ESE och LIDO är följande:

  • dc:title
  • dc:type
  • europeana:type
  • dc:language (mandatory if europeana:type="TEXT")
  • dc:identifier
  • europeana:dataProvider
  • dc:source
  • europeana:isShownAt
  • europeana:object
  • europeana:isShownBy
  • europeana:rights
  • dc:rights


Klicka för att ladda ner (PDF)

Den kompletta mappningstabellen LIDO v1.0 till ESE v3.4 av Regine Stein (Philipps-Universität Marburg - Bildarchiv Foto Marburg), återfinns i Användning av innehåll i länkade arv och Europeana (V.5), bilaga 3Content aggregation: tools & riktlinjer).

Metadataflödet från till Europeana via MINT

Med hjälp av MINT-verktyget kan metadata skördas och det möjliggör för innehållsleverantörerna att:

  • ladda upp sina data, som sedan kan mappas enligt olika metadatascheman till
  • transformera till LIDO-struktur samt konvertera till ESE
  • validera genom Europeana Content Checker
  • överföra data till Europeana ingestion office via OAI-PMH protokollet

Innehållsleverantörer kan dock bli ombedda av Europeana att kontrollera datakvaliteten i informationen som har publicerats och lösa eventuella problem.

Bilden nedan visar metadataflödet i MINT och vidare till Europeana:

.  Linked Heritage, June 2013
Arbetsflödet. Linked Heritage, juni 2013

Licensiering av innehåll

Europeana Data Exchange Agreement

Europeana Data Exchange Agreement (DEA) är en ny typ av licens som antogs av Europeana i september 2011. DEA innebär att beskrivande metadata (inte tumnagelbilder) licensieras med Creative Commons CC0 1.0 Universal Public Domain Dedication, vilket i praktiken innebär att innehållet görs fritt för användning (public domain) och att kommersiell återanvändning av metadata tillåts.

Detta innebär att metadata kan publiceras som länkad öppen data (LOD) och att Europeana får möjlighet att stödja återanvändning av data.

DEA är obligatoriskt för alla innehållsleverantörer som tillgängliggör sina samlingar i Europeana.

The Linked Heritage DEA Task Force (arbetsgrupp)

Linked Heritage DEA Task Force inrättades med syftet att utarbeta praktiker för hur projektets mål (inklusive DEA) ska kunna uppfyllas samtidigt som dataintegritet bevaras.

Arbetsgruppen utarbetade en strategi som ger innehållsleverantörer tre alternativ för publikationen av metadata:

  1. Publicera ett minimalt metadataset i Europeana, vilket innebär att endast LIDO & ESE obligatoriska element kommer att överföras till Europeana under Creative Commons CC0 1.0 Universal Public Domain Dedication (av de metadata som levereras genom MINT-verktyget av innehållsleverantören).



  2. Publicera ett ”mellanstadium” metadataset till Europeana, vilket innebär att alla metadataelement som levereras genom MINT-verktyget kommer att överföras till Europeana under Creative Commons CC0 1.0 Universal Public Domain Dedication, förutom de LIDO-element som ger upphov till ”dc: description”. Detta innebär att ingen objektbeskrivning, som inte kan göras fri, visas i Europeana.



  3. Fullständig publicering av metadata till Europeana, vilket innebär att alla metadataelement som levereras genom MINT-verktyget kommer att överföras till Europeana under Creative Commons CC0 1.0 Universal Public Domain Dedication.



För att innehållsleverantörerna ska kunna välja vilket alternativ som ska gälla under aggregeringsprocessen (se alternativ A-C ovan) har ett metadatafilter implementerats i MINT (se: ”Hur du ställer in ett metadatafilter i MINT”).

Trots att uppsättningen av obligatoriska metadataelement är minimal uppmuntrar Europeana och Linked Heritage publicering av bredast möjliga spektrum av information som kan göras tillgänglig genom Europeanas portal. Detta för att förbättra hur informationen presentateras och för att öka slutanvändarnas upplevelse genom att öka möjligheterna till forskning m m.

För närvarande har de flesta av Linked Heritage partners anslutit sig till DEA-avtalet.

Tillhandahålla

Arbetsprocessens metodik inom Linked Heritage

Uppskattning av innehållsleverantörernas digitala samlingar

Det första steget till att leverera innehåll till Europeana är att beräkna hur många digitala samlingar som deltagarna kommer att leverera, utifrån informationen i Description of Work

Linked Heritage valde att låta innehållsleverantörerna svara på en enkät för att göra en uppskattning av digitala samlingar som kommer att levereras. Följande information efterfrågades i enkäten:

  • Land
  • Innehållsleverantör
  • Kontaktperson
  • Teknisk kontaktperson
  • Samlingens URL
  • Mängden metadata som kommer att aggregeras
  • Mängden av digitala objekt kopplade till metadata
  • Objekttyper: bild, text, ljud, video
  • Beskrivning
  • Metadataformat
  • Upphovsrätter

Då Europeana endast tar emot metadata är det av största vikt att det görs en separat bedömning av mängden metadata respektive mängden digitala objekt, eftersom förhållandet 1 metadata = 1 digitalt objekt inte alltid är tillämplig.

Utbildning och utbildningsmaterial

Det anordnades utbildningsseminarier med projektets innehållsleverantörer för att utbilda dem i Lido-mappning och användning av MINT. Efter utbildningarna sändes dokumentation till alla deltagare.

Vidare har det skapats en särskild sida på Linked Heritage-projektets webbplats där riktlinjerna för insamling av innehåll finns publicerade samt verktyg kan nås.

Help-desk och FAQ

En help-desk tjänst inrättades i början av projektet för att stödja innehållsleverantörerna och besvara olika frågor. En s k FAQ (vanligt förekommande frågor) har också utarbetas och publicerats på Linked Heritage webbplats.

Intressenätverk

En beskrivning av arbetsprocesser och feedback är grundläggande för att stödja innehållsleverantörerna under aggregeringsprocessen. Det bidrar också till att bygga upp en känsla av gemenskap.

Framgångsfaktorerna bakom nyttan med och framgången hos projektet är en ständig genomlysning av de viktigaste aggregeringsfrågorna, regelbunden dialog med innehållsleverantörerna, analys av datarapporter från MINT samt den pågående uppdateringen av undervisningsmaterialet.

Arbetsprocessen inom Linked Heritage/Europeana

Figuren nedan sammanfattar hur metadata går vidare till Europeana genom Linked Heritage-projektet.


Linked Heritage & Europeana Workflows. Michael Hopwood (EDItEUR), december 2011