TRWAŁE IDENTYFIKATORY:
ZASTOSOWANIE W KULTURZE I PRZEDSIĘWZIĘCIACH KOMERCYJNYCH

4/9 – STUDIUM PRZYPADKU 2: ISBN-A, czyli wykorzystanie numeru ISBN w sieci

W skrócie

Poniższe studium przypadku bada, w jaki sposób system ISBN jest wciąż użyteczny, tym razem w odniesieniu do ebooków i środowiska internetowego, oraz jakie nowe możliwości wyszukiwania i sprzedaży książek przez Internet pojawiają się dzięki zastosowaniu identyfikatora ISBN-A.

System ISBN stworzono w latach 60. i 70. ubiegłego wieku po to, by zapewnić niezawodną i efektywna wymianę informacji do celów tworzenia bibliografii, kontroli stanu magazynów, zamawiania tytułów i raportowania o sprzedaży.

System odniósł sukces już w pierwszych dniach istnienia skomputeryzowanej działalności handlowej, niemniej jednaj nigdy nie był zaprojektowany na potrzeby globalnej sieci internetowej.

Mimo to wciąż zdaje egzamin w nowym kontekście sieci WWW. I tak ostatnio:

  • nowe wytyczne dla biur rejestracji ISBN-ów odnośnie ebooków jasno określiły jakim publikacjom elektronicznym należą się nowe numery ISBN po to, by sprzedawcy i ostateczni nabywcy mogli rozróżnić poszczególne – ale nie takie same – produkty oferowane w ramach łańcucha dostaw;
  • dopasowanie numerów ISBN do większej przestrzeni nazw standardu GTIN-13 oznacza, że do wykorzystania będzie większa ilość numerów; są one potrzebne, ponieważ:
    • dzięki technologii cyfrowej będzie powstawało więcej publikacji, oraz
    • pojedyncza publikacja będzie dostępna w większej ilości wersji i formatów – chodzi zwłaszcza o różne formaty plików oraz o ich „pakiety” z ograniczonymi prawami korzystania z danego ebooka.

Z numerów ISBN wciąż korzysta się dzięki sieci biur rejestracji, których organizacja i sprzęt pochodzą jeszcze z czasów przed-internetowych. W wielu przypadkach usługa sprawdzania informacji o produkcie i zamawiania go (tak jak zaleca to standard ISO) nie została ostatecznie opracowana.

System ISBN-A (ang. Actionable ISBN) ma za zadanie udostępnić wydawcom i innym podmiotom z branży centralną i znormalizowaną platformę oferującą tą nie opracowaną dotąd usługę w oparciu o dotychczasowy system ISBN. Nowy system korzysta z możliwości Internetu dzięki zintegrowaniu starego system ISBN z systemem DOI.

Kontekst systemu DOI

Poniżej kilka podstawowych informacji o Internecie, zanim zostanie wyjaśnione, co to jest system DOI:

  • Internet to infrastruktura informatyczna, czyli sieć komputerów połączonych razem w celu wymiany informacji; składa się ze:
    • sprzętu komputerowego należącego do instytucji rządowych, innych instytucji publicznych, firm i organizacji prywatnych, wreszcie osób prywatnych;
    • zbioru ścisłych reguł (zw. protokołami, w tym HTTP, FTP itd.) na temat tego, jak komputery wymieniają się informacją cyfrową (system zero-jedynkowy); są one neutralne dla znaczenia informacji i sposobu jej kodowania;


      prostą analogią może być tutaj dany system stacji kolejowych i torów łączących ze sobą miasta i kraje; transport na szynach korzysta z systemu, ale nie wiadomo, jakich wagonów się w nim używa, jaki jest ich rozkład jazdy i co przewożą (tylko pasażerów, tylko towar, czy i pasażerów i towar); połączenie ze sobą kolejnych systemów zależy np. od rozstawu torów, stosowanego systemu sygnalizacyjnego, antykolizyjnego itd…
  • sieć WWW składa się z dokumentów (i innych plików cyfrowych), dostępnych po wysłaniu za pomocą protokołu HTTP żądania udostępnienia ich w Internecie, oraz z połączeń (adresów URL) między nimi;


    w analogii kolejowej jest to siatka wszystkich połączeń (w znaczeniu możliwych do odbycia podróży) danej sieci kolejowej wraz z przystankami i przesiadkami; z tym, że analogia ta jest niedoskonała, ponieważ pociągi przewożą osoby z charakteru swojego niepowtarzalne, podczas gdy Internet i sieć WWW przesyłają pomiędzy komputerami zaledwie kopie plików cyfrowych;
  • tak, jak po torach kolejowych jeżdżą zarówno pociągi pasażerskie, jak i towarowe, tak sieć WWW nie jest jedyną, która korzysta z infrastruktury Internetu; również inne usługi korzystają z niego w tym samym czasie (np. usługi poczty elektronicznej);
  • adres URL (ang. Uniform Resource Locator) w sieci WWW jest identyfikatorem wskazującym na lokalizację (wyłącznie) pliku cyfrowego (tj. kawałka cyfrowego zasobu danego komputera znajdującego się w sieci); może on również zawierać polecenie skierowane do oprogramowania działającego pod tą lokalizacją, ale nie będzie tu mowy o tym skomplikowanym przypadku;

    w związku z powyższym można zadać dwa podstawowe pytania odnośnie wyszukiwania informacji w sieci:
    • skąd wiadomo, że konkretny plik (lub jakikolwiek plik) oczekiwany pod danym adresem URL naprawdę jest pod tą lokalizacją?
    • jaką wiarygodną informację o pliku (np. o jego treści merytorycznej, formacie kodowania, historii zmian) można uzyskać jeszcze przed jego pobraniem?
    oczywiście odpowiedzi na te pytania zależą przede wszystkim od poziomu zarządzania plikami i informacją na ich temat (w tym ich treścią) a dopiero na drugim miejscu są pochodną rozwiązań technicznych;

Ważne jest, by zacząć od zrozumienia ograniczeń protokołu HTTP. I tak istnieją dwa podstawowe rodzaje „rzeczy”, które można zidentyfikować/rozpoznać w sieci:

Rzeczy rozpoznawalne w sieci
Rzeczy, które można pobrać przez HTTPRzeczy, których nie można pobrać przez HTTP
Kopie plików cyfrowych dostępnych w Internecie. I to wszystko!Pojęcia (np. teorie, historie, nazwy, tematy dokumentów, instrukcje obsługi…, w tym są pojęcia opisujące pliki cyfrowe!)

Niepowtarzalne obiekty fizyczne (np. dana osoba, budynek Tadź Mahal, czyjś laptop, mózg Einsteina, obraz „Mona Lisa”…)

Również: pliki cyfrowe nie udostępniane w Internecie…
Nb. niektóre z tych plików cyfrowych mogą traktować o innych plikach cyfrowych lub o rzeczach, które nie są plikami cyfrowymi – ale o tym nie wiadomo, dopóki się ich nie pobierze i nie sprawdzi.Nb. większość rzeczy rozpoznawalnych w realu nie jest dostępna przez HTTP!


We wczesnych latach Internetu i sieci WWW istniał pomysł wykorzystania trzech różnego rodzaju identyfikatorów do plików cyfrowych (“obiektów”) i związanej z nimi informacji, tj.:

  • URN (ang. Uniform Resource Name) – trwałego identyfikatora obiektu niezależnego od jego lokalizacji,
  • URL (ang. Uniform Resource Location) – adresu obiektu, który zawiera wystarczającą ilość informacji, by zidentyfikować protokół i wyszukać obiekt,
  • URC (ang. Uniform Resource Characteristics) – jakiejkolwiek kombinacji jednego lub więcej identyfikatorów URN lub adresów URL z metadanymi. 1

A zatem URN jest identyfikatorem tego, co chce się znaleźć, URL powinno być lokalizacją, pod którą można to znaleźć, a URC jest pomiędzy nimi podając informację o poszukiwanym pliku i gdzie go można znaleźć.

Lokalizacja w sieci (URL) pliku cyfrowego (identyfikowanego/rozpoznawalnego dzięki URN) jest sama w sobie cechą charakterystyczną (URC) tego pliku.

Ostatecznie URC się nie sprawdziła i obecnie używa się terminu URI (ang. Uniform Resource Identifier) dla URN i URL razem. Ważne, by pamiętać, iż URN dotyczy tożsamości dokumentu lub zasobu niezależnie od ich lokalizacji, podczas gdy URL dotyczy lokalizacji dokumentu lub zasobu (w jakiś sposób niezależnie od ich tożsamości).

Za cel postawiono sobie połączenie lokalizacji w sieci (adresów URL) wszystkich kopii danego pliku z pojedynczą i niepowtarzalną nazwą (URN) tego pliku, jak również bieżącą aktualizację informacji o lokalizacjach (którą miała być URC).

  • I URN, i URL zostały połączone wysiłkiem bibliotek narodowych na rzecz ich kolekcji cyfrowych i narodowych bibliografii (jak przedstawiono to w studium przypadku na temat URN dotyczącym Węgierskiej Biblioteki Narodowej).
  • Wynikiem ich prac jest swego rodzaju katalog rejestrujący numery ISBN, jak i zwyczaj, że dana kopia przechowywana jest w konkretnej bibliotece.

Pozostałe szczegóły dotyczące danego pliku, tj. wykraczające poza kwestię „gdzie go można znaleźć”, są trudne do znormalizowania, ponieważ wymagałoby to kooperacji w ramach całej branży, jak i poza nią.

System DOI

W odpowiedzi na powyższe wyzwanie stworzono system DOI, który oferuje:

Numery DOI są numerami niepowtarzalnymi, zbudowanymi i zarządzanymi przez biura rejestracji w podobny sposób, jak w przypadku numerów ISBN. Dzięki platformie ich usług są one automatycznie i dużo szybciej zdolne do identyfikacji obiektów i kojarzenia ich z danymi w warunkach sieci WWW:

Schemat. DOI Handbook.  http://www.doi.org/doi_handbook/3_Resolution.html
2

Użytkownik numeru DOI wysyła żądanie do systemu DOI na http://dx.doi.org, system DOI odpowiada w formie pewnej ilości metadanych przechowywanych dla tego numeru lub w formie kopii pliku zidentyfikowanego przez ten numer – w zależności od rodzaju obiektu, jaki dany numer identyfikuje oraz od rodzaju dostępu (np. jeśli wymagana jest opłata, użytkownik może zobaczyć stronę z prośbą o subskrypcję). Przeglądarka internetowa może zautomatyzować część tego procesu.

Właściciel numeru DOI powinien czynnie zarządzać jego linkami po to, by numer nieprzerwanie i właściwie identyfikował wybrany obiekt i kojarzył go z najnowszymi danymi, nawet jeśli lokalizacja obiektu się w międzyczasie zmieniła.

Do specyficznych dla poszczególnych branż implementacji systemu DOI należą:

  • ISBN-A dla książek (patrz tekst poniżej),
  • DataCite dla zbiorów danych badawczych (patrz studium przypadku nr 3),
  • CrossRef dla publikacji akademickich (zwykle artykułów):
    • identyfikuje publikacje akademickie na poziomie artykułu prasowego: rozwiązanie niezwykle praktyczne do celów precyzyjnego cytowania,
    • może identyfikować książki akademickie w całości, rozdziały książek, jak i inne elementy treści (np. tabele, wykresy),
    • cytaty mogą zostać podłączone do sieci, za pośrednictwem metadanych, po to, by stały się częścią procesu badawczego,
  • EIDR dla filmów i materiałów TV:
    • identyfikator dla istniejących danych audiowizualnych,
    • identyfikuje filmy i programy telewizyjne (w tym seriale) na każdym poziomie abstrakcji:
      • definiuje istotne cechy charakterystyczne każdego z poziomów,
      • różne wersje (np. reżyserska) i zapisy (np. na nośniku DVD lub w cyfrowym pliku do pobrania) mogą zostać zlinkowane.

Obecnych implementacji systemu DOI używa się do publikowanych (zwykle komercyjnych) utworów. Niemniej jednak i inne rodzaje obiektów mogą być identyfikowane i sprawdzane za pomocą tego sytemu.

DataCite jest tutaj dobrym przykładem, jako że zbiory danych badawczych nie za bardzo pasują do kategorii publikacji komercyjnych.

  • Model techniczny, organizacyjny i finansowy systemu DOI jest na tyle elastyczny, że może być on wykorzystywany przez organizacje non-profit:
    • platforma techniczna to repozytorium identyfikatorów zw. Handle System (jest to otwarte oprogramowanie autorstwa amerykańskiej organizacji CNRI),
    • niektóre zadania biura rejestracji mogą być zlecane bądź dzielone z innym podmiotem,
    • model biznesowy biura rejestracji numerów DOI może zawierać pobieranie opłat dla zysku bądź przynajmniej dla odzyskania poniesionych kosztów.
  • Model danych podstawowych dla metadanych systemu DOI w sposób oczywisty jest kompatybilny z modelami używanymi do danych z dziedziny ochrony dziedzictwa kulturowego (czyli np. z CIDOC-CRM).

DOI może być stosowany do identyfikacji obiektów muzealnych (patrz część pt. “Identyfikatory cyfrowe sektora ochrony dziedzictwa kulturowego”).

ISBN-A a ISBN

System ISBN–A (ang. Actionable ISBN) jest innowacyjnym narzędziem marketingowym, dzięki któremu z numeru ISBN można korzystać w sieci WWW. Dotychczas wszystkie inicjatywy związane z systemem ISBN-A na terenie Europy prowadzone są przez biura rejestracji numerów ISBN (agencje ISBN) z Włoch i Niemiec; wspiera je również biuro rejestracji numerów DOI mEDRA (multilingual European DOI Registration Agency), które jest partnerem projektu Linked Heritage.

ISBN-A udostępnia specjalną platformę do zarządzania metadanymi i do wykorzystywania ich w celu wprowadzenia książki na rynek elektroniczny. Każda agencja ISBN oferuje tę usługę zgodnie ze swoim modelem biznesowym i własną strategią marketingową. W ogóle usługi systemu ISBN-A możliwe są dzięki metadanym i linkom dostarczanym przez samych wydawców, a ci robią to, by uzyskać numer ISBN-A.

Aby tradycyjny numer ISBN stał się jednym z identyfikatorów systemu DOI, dołącza się go zwyczajnie do składni numeru DOI.

Weźmy na przykład numer 978-88-07-70168-9. W systemie DOI jako numer ISBN-A wygląda on następująco:

Elementy numeru ISBN-A. http://www.medra.org/
3

Odpowiedni link internetowy tworzy się z numeru przez dodanie do niego adresu HTTP centralnego serwisu DOI. W ten sposób powstaje http://dx.doi.org/10.978.8807/701689. Link taki może być następnie zidentyfikowany przez każdą przeglądarkę lub aplikację internetową. Oczywiście to gdzie taki link prowadzi - tj. czy do strony internetowej opisującej książkę, czy do strony, gdzie można ją kupić, czy do strony autora książki – zależy od tego, jak wydawca książki zarządza danymi DOI.

ISBN-A we Włoszech

Biuro rejestracji numerów DOI jest zorientowane na konkretną branżę, natomiast biuro rejestracji numerów ISBN ma zazwyczaj charakter krajowy. Zatem system ISBN-A (przynajmniej w Europie) opiera się na Włoszech (gdzie rejestruje się numery DOI) plus na dodatkowym kraju, jeśli numery ISBN rejestrowane są poza Włochami.

  • mEDRA stanowi wsparcie techniczne dla włoskiego biura rejestracji numerów ISBN, zatem we Włoszech system ISBN-A jest w pełni zintegrowany z systemem ISBN.
  • Narzędzia rejestracji numerów ISBN-A opracowane dla biura przez mEDRA:
    • usługa internetowa, która umożliwia wydawcom zgłaszanie w formacie ONIX próśb o rejestrację numeru ISBN-A,
    • platforma internetowa zintegrowana z bazą danych bibliograficznych biura, która pozwala wydawcom na dodanie metadanych danego obiektu do odpowiednich rekordów bibliograficznych.
  • Usługa “indirection” – udostępniana przez mEDRA – pozwala na znalezienie linków do licznych sprzedawców danej książki dzięki identyfikacji jej numeru ISBN-A:
    • mEDRA zaprojektowała interfejs użytkownika (stronę docelową),
    • usługa przeglądania metadanych (ang. “view metadata” service) korzysta z danych bibliograficznych przechowywanych w bazie danych lokalnego biura rejestracji numerów ISBN,
    • okładka książki może zostać wyeksponowana na podstawie zdjęcia załadowanego na platformę agencji ISBN.
  • Ceny za rejestrację i obsługę numeru zależą od ilości rejestrowanych produktów i wahają się od ok. €100 za 10 numerów do €1500 za 500 numerów.

Usługa B2B to główny kierunek rozwoju dla platformy ISBN-A. Jego sukces zależy od:

  • zainwestowania przez wydawców środków na obsługę i rozbudowę danych i linków,
  • poszerzenia zakresu opcji oferowanych na „stronie tytułowej” dostarczanej przez mEDRA – być może w partnerstwie z:
    • mediami społecznościowymi,
    • analitykami sieciowymi,
    • lub nawet dystrybutorami treści (sprzedawcami hurtowymi ebooków).

Wykorzystanie możliwości identyfikatora ISBN-A – który jest pojedynczym linkiem do danej książki z dużą ilością dodatkowych funkcji do wyboru – na stronach internetowych, w wynikach wyszukiwarek, mediach społecznościowych i aplikacjach mobilnych niesie ze sobą oczywiste korzyści.

Obecny sposób prezentowania danych użytkownikom końcowym jest bardzo prosty, jak pokazuje przykład poniżej, i oparty głównie na materiałach tekstowych:

W zasadzie format metadanych ONIX obsługiwany przez identyfikator ISBN-A mógłby oferować linki do niemal każdego rodzaju obiektów, pod warunkiem, że linki te byłyby dostarczane i obsługiwane przez wydawców.

ISBN-A w Niemczech

Niemcy są pierwszym krajem poza Włochami, który w pełni wprowadził system ISBN-A. Jednostka zależna Związku Wydawców i Księgarzy Niemieckich MVB prowadzi niemiecką agencję ISBN oraz oferuje wiele platform online takich, jak sklep internetowy czy baza danych wydanych tytułów.

Ponieważ MVB prowadzi również sklep internetowy “Libreka!”, łatwo może dodawać linki „sprzedażowe” do danych systemu ISBN-A.

Dzięki dużej ilości materiałów marketingowych, jakie MVB może zebrać prowadząc sklep internetowy, oraz dzięki prowadzeniu bazy danych wydanych tytułów VLB, instytucja ta ma silną pozycję do budowania kontaktów handlowych, dzięki którym może wprowadzać na rynek książki dla indywidualnego klienta, co ostatecznie dodatkowo wzbogaca dane systemu ISBN-A.

Proszę kliknąć na poniższy numer ISBN-A obsługiwany przez MVB, aby zobaczyć jak funkcjonuje system:

10.978.37639/35147

Wnioski

  • Sukces systemów identyfikatorów takich, jak ISBN trwa dalej w epoce i warunkach Internetu.
  • Koszty zarządzania identyfikatorami w sieci WWW są takie same jak koszty obsługi „tradycyjnych” identyfikatorów.
  • Trwała identyfikacja może być usługą bardzo oszczędną dzięki platformom usług takim, jak DOI.
  • Numerów DOI można użyć do „wprowadzenia” istniejących systemów takich, jak ISBN do sieci.
  • Usługi internetowe oparte na identyfikatorach takich, jak DOI potrzebują dodatkowego wysiłku związanego z zarządzaniem tymi identyfikatorami oraz dodatkowych inwestycji.
  • Wszystko powyższe może dotyczyć i innych branż poza omawianą branżą wydawniczą, np. ochrony dziedzictwa kulturowego, jeśli tylko wyraża ona zainteresowanie.
Dowiedz się więcej

DOI Handbook (1) i topical Factsheets (2)
Przewodnik po systemie DOI (1) daje ogólny zarys techniczny systemu, natomiast zestawienie aktualnych problemów (2) wprowadza w konkretne kwestie.

DOI® System and the ISBN System (DOI Factsheet on ISBN-A)
Podsumowanie na temat systemu ISBN-A, który jest realizacją systemu DOI zawierającą istniejący już wcześniej standard ISBN.