UsługiMINT

2/6 – Agregator projektu Linked Heritage

Linked Heritage (2011-2013) to projekt koordynowany przez Centralny Instytut Katalogu Włoskich Bibliotek i Informacji Bibliograficznych (Istituto Centrale per il Catalogo Unico, ICCU) oraz wspierany przez włoskie Ministerstwo Dziedzictwa Kulturowego (Ministero dei Beni e delle Attività Culturali, MiBAC). Zajmuje się rozwijaniem i implementowaniem wyników prac projektu ATHENA . Projekt – realizowany w oparciu o dobre praktyki – finansowany jest z programu FP7. Rozpoczął się w kwietniu 2011 r. i jest zaplanowany na 30 miesiący. Jego zadaniem jest przekazanie nowego zasobu do Europeany ze źródeł publicznych i prywatnych (głównie od wydawców), podniesienie jakości danych odnośnie bogactwa, niepowtarzalności i możliwości ponownego wykorzystania metadanych, zbadanie możliwości Linked Open Data, wreszcie poprawienie mechanizmów wyszukiwania i wykorzystania zasobu publikowanego w Europeanie.

Dostawcy danych projektu Linked Heritage

Członkami projektu Linked Heritage są podmioty z 22 krajów, w tym: ministerstwa kultury, agencje rządowe, muzea, biblioteki, agregatorzy krajowi, główne ośrodki naukowe, wydawcy, przedstawiciele MŚP, wreszcie instytucje, które na początku współpracy z Europeaną mają dostarczyć 3 mln rekordów z szeroko rozumianego zasobu kulturowego.

Agregowanie danych

Metadata Interoperability Services (MINT)

Usługi MINT ( Metadata Interoperability Services) składają się na internetową platformę, którą zaprojektowano i rozwijano, by wspierać europejskie projekty agregacji zasobów i metadanych z zakresu dziedzictwa kulturowego.

MINT funkcjonuje jako serwer do przesyłania danych w oparciu o oprogramowanie “open source” stworzone przez Narodowy Uniwersytet Techniczny w Atenach (NTUA) w ramach projektu ATHENA.

MINT umożliwia dostawcom danych ładowanie, mapowanie, walidację i dostarczanie metadanych do Europeany wyłącznie poprzez sieć.

Platforma MINT oferuje również użytkownikom i instytucjom współpracującym z Europeaną system zarządzania, który pozwala im na korzystanie z różnych modeli agregacji danych, odpowiednich dla poszczególnych rodzajów użytkowników i z różnymi prawami dostępu.

Mapowanie danych

Rekordy metadanych są bardzo ważne dla dokumentowania i utrzymywania wzajemnych powiązań pomiędzy zasobami informacji i są wykorzystywane do wyszukiwania, gromadzenia i przechowywania zasobów przez dłuższy okres czasu. Metadane opisowe, administracyjne, techniczne i metadane przechowywania pozwalają na zarządzanie zasobami informacji i zapewniają ich integralność zarówno teraz, jak i w przyszłości.

Tzw. crosswalk stanowi mapowanie elementów metadanych z jednego modelu metadanych do drugiego i zapewnia tzw. semantyczną interoperacyjność, dając możliwość wyszukania tej samej bądź podobnej treści z innego źródła.

Platforma MINT projektu Linked Heritage implementując infrastrukturę do agregacji danych oferuje mechanizm zw. crosswalk przy następujących czynnościach krytycznych:

  • pozyskiwanie (ang. harvesting) i agregowanie rekordów metadanych zarówno według standardów, jak i praw własności,
  • migracja z modelu dostawcy danych do modelu referencyjnego,
  • transformacja rekordów z modelu projektu Linked Heritage do modeli ESE (Europeana Semantic Elements) i EDM (Europeana Data Model).

LIDO jako model referencyjny metadanych w projekcie Linked Heritage

MINT umożliwia zmapowanie i transformację metadanych do postaci rekordów modelu LIDO.

LIDO (Lightweight Information Describing Objects) jest efektem międzynarodowej współpracy podmiotów z branży muzealnictwa, rozpoczętej w 2008 r. z zamiarem stworzenia ogólnego rozwiązania służącego przekazywaniu treści dziedzictwa kulturowego do aplikacji internetowych.

Koncepcyjnym modelem referencyjnym dla LIDO jest CIDOC-CRM. Dalej LIDO powstał z integracji modeli metadanych CDWA Lite i museumdat, i opiera się na standardzie SPECTRUM. Jako aplikacja modelu CIDOC-CRM, LIDO ma jasno określony format, by w sposób standaryzowany dostarczać informacje o obiektach muzealnych.

MINT wprowadził LIDO jako pośredni model pozyskiwania danych. Mimo, że na początku LIDO było przeznaczone tylko na potrzeby muzeów, obecnie używane jest w szerszym kontekście dowodząc swojej zdolności adaptacji, jak i skuteczności w zachowywaniu integralności ogromnej ilości metadanych.

Model metadanych ESE

MINT umożliwia przekonwertowanie rekordów metadanych modelu LIDO do modelu ESE (Europeana Semantic Elements).

ESE to model danych oparty na standardzie Dublin Core, gdzie do standardowych pól dodano 12 elementów charakterystycznych dla Europeany. Dostawcy danych muszą dostosować swoje metadane do profilu ESE, który jest niezbędny do tego, by rekordy wyświetlały się właściwie w Europeanie.

ESE to podzbiór modelu EDM (Europeana Data Model), czyli nowego modelu, który będzie implementowany w nadchodzących miesiącach. EDM również opiera się na usługach MINT (zobacz MINT screencast EDM Ingestion Tool).

Elementy obowiązkowe metadanych

Elementy obowiązkowe metadanych modeli ESE i LIDO:

  • dc:title
  • dc:type
  • europeana:type
  • dc:language (obowiązkowy jeśli europeana:type="TEXT")
  • dc:identifier
  • europeana:dataProvider
  • dc:source
  • europeana:isShownAt
  • europeana:object
  • europeana:isShownBy
  • europeana:rights
  • dc:rights


Ściągnij plik PDF

Kompletna tabela odwzorowania danych z LIDO v1.0 do ESE v3.4 autorstwa Regine Stein (Philipps-Universitaet Marburg - Bildarchiv Foto Marburg) jest dostępna w dokumencie Use of Content in Linked Heritage and Europeana (v.5), Annex 3, przygotowanym w ramach projektu Linked Heritage przez grupę roboczą ds. DEA (Data Exchange Agreement) (zobacz również Content aggregation: tools & guidelines).

Przepływ metadanych

MINT działa jako serwer do przesyłania danych, dzięki któremu dostawcy danych mogą:

  • załadować swoje zbiory danych zorganizowane w heterogenicznych modelach metadanych oraz zmapować je do modelu LIDO,
  • przetransformować rekordy metadanych do rekordów LIDO i przekonwertować je do profilu ESE,
  • zwalidować zasób za pomocą Europeana Content Checker,
  • umieścić zasób na serwerach Europeany za pomocą protokołu OAI-PMH.

Należy pamiętać, iż dostawcy danych mogą zostać poproszeni przez Europeanę o ponowne sprawdzenie jakości swoich zasobów już po fakcie ich publikacji online oraz o wskazanie możliwych do zaistnienia problemów.

Poniższa ilustracja podsumowuje przepływ metadanych w MINT oraz przepływ metadanych do Europeany:

.  Linked Heritage, czerwiec 2013
Przepływ danych. Linked Heritage, czerwiec 2013

Licencjonowanie danych

Data Exchange Agreement (DEA)

Umowa o wymianie danych zw. Data Exchange Agreement jest nową licencją zaadoptowaną przez Europeanę we wrześniu 2011 r. Umowa ta przewiduje, że metadane opisowe (nie miniaturki!) podlegają licencji Creative Commons CC0 1.0 Universal Public Domain Dedication, co faktycznie oznacza publikację danego zasobu w domenie publicznej i zgodę na komercyjne wykorzystanie metadanych.

W ten sposób Europeana wspiera otwarte korzystanie z danych i publikuje metadane jako Linked Open Data (LOD).

Podpisanie umowy DEA jest obowiązkowe dla wszystkich dostawców danych przed publikacją ich kolekcji w Europeanie.

Grupa robocza ds. DEA projektu Linked Heritage

Grupa robocza ds. DEA działająca w ramach projektu Linked Heritage została zorganizowana z zadaniem zapoznania członków projektu z praktycznymi sposobami wypełniania projektowych obowiązków (wymagany podpis pod DEA) oraz w celu zachowania integralności ich danych.

Z myślą o dostawcach danych grupa opracowała 3 sposoby publikacji metadanych:

  1. publikacja minimalnej ilości metadanych w Europeanie: spośród metadanych dostarczanych przez dostawców do projektu Linked Heritage tylko elementy obowiązkowe modeli LIDO i ESE zostaną przekazane do Europeany na podstawie licencji Creative Commons CC0 1.0 Universal Public Domain Dedication;



  2. publikacja średniej ilości metadanych w Europeanie: spośród metadanych dostarczanych przez dostawców do projektu Linked Heritage wszystkie elementy metadanych zostaną przekazane do Europeany na podstawie licencji Creative Commons CC0 1.0 Universal Public Domain Dedication z wyjątkiem elementów modelu LIDO dających w wyniku dc:description. Oznacza to, że opisy obiektów – zawierające zazwyczaj treści wrażliwe bądź wartościowe – nie zostaną w Europeanie pokazane;



  3. publikacja całego zbioru metadanych w Europeanie: spośród metadanych dostarczanych przez dostawców do projektu Linked Heritage wszystkie elementy metadanych zostaną przekazane do Europeany na podstawie licencji Creative Commons CC0 1.0 Universal Public Domain Dedication.



MINT wprowadził dla dostawców danych możliwość wyboru odpowiedniego filtra podczas procesu agregacji danych (zobacz screencast pt. Ustawianie w MINT filtra do przesyłania metadanych).

Mimo obowiązywania minimalnych ilości metadanych, jakie trzeba przekazać do Europeany, sama Europeana, jak i Linked Heritage zachęcają swoich dostawców do przekazywania jak najszerszych zbiorów informacji do publikacji, dla celów bogatszej ekspozycji danych na portalu Europeany, jak i ich pełniejszego wykorzystania przez użytkowników końcowych.

Obecnie większość partnerów projektu Linked Heritage podpisała się pod umową DEA.

Dostarczanie danych

Metodologia projektu Linked Heritage: przepływ danych

Ocena kolekcji cyfrowych pochodzących od dostawców danych projektu Linked Heritage (ankieta projektu Linked Heritage)

Pierwszym krokiem przy pobieraniu treści do Europeany jest ocena cyfrowych kolekcji, które dostawcy danych opisali w dokumencie pt. Description of Work (PDF), dostępnym na stronie projektu Linked Heritage w zakładce „Reserved area”.

Oceny można dokonać w sposób bardzo prosty, np. za pomocą szablonu. Dostawcy danych projektu Linked Heritage zostali poproszeni o wypełnienie ankiety i dostarczenie następujących informacji:

  • kraj,
  • dostawca danych,
  • kontakt główny,
  • kontakt techniczny,
  • adres URL kolekcji,
  • ilość metadanych do zagregowania,
  • ilość obiektów cyfrowych połączonych z metadanymi,
  • rodzaje obiektów: tekst, obraz, dźwięk, film,
  • opis,
  • formaty metadanych,
  • prawa.

Pamiętając, że Europeana agreguje jedynie metadane, istotne jest, aby osobno ustalić ilość metadanych oraz ilość obiektów cyfrowych z nimi związanych, ponieważ proporcja 1 jednostka metadanych : 1 obiekt cyfrowy nie jest regułą.

Szkolenia i materiały szkoleniowe

W celu przeszkolenia dostawców danych z mapowania w LIDO i korzystania z MINT zorganizowano dla nich specjalne sesje szkoleniowe.

Po zakończeniu warsztatów szkoleniowych rozesłano do wszystkich partnerów projektu stosowne dokumenty.

Ponadto na stronie internetowej projektu Linked Heritage stworzono specjalną zakładkę, w której opublikowano programy narzędziowe oraz poradniki przydatne przy agregacji danych.

Usługi Helpdesk i FAQ

Usługę Helpdesk uruchomiono na początku projektu, by pomóc dostawcom danych przy pojawiających się problemach. Na stronie projektu Linked Heritage opublikowano również tradycyjne Frequently Asked Questions.

Społeczność projektu

Metodologia przepływu danych i formułowania opinii (feedback) ma fundamentalne znaczenie przy asystowaniu dostawcom danych w ich pracy i kontrolowaniu całego procesu agregacji; poza tym pomaga ona w budowaniu poczucia wspólnoty w ramach projektu.

Cykliczne ankiety, regularny przegląd głównych aspektów procesu agregacji, analiza raportów z MINT, wreszcie konsekwentna aktualizacja materiałów szkoleniowych to ważne zadania wpływające na ogólny sukces projektu.

Przepływ danych w projektach Linked Heritage & Europeana

Diagram umieszczony poniżej podsumowuje, w jaki sposób metadane są dostarczane do Europeany dzięki projektowi Linked Heritage.


Przepływ danych w projektach Linked Heritage & Europeana. Michael Hopwood (EDItEUR), grudzień 2011