PROCESDIGITALIZACJI

2/5 – Zakres prac

Selekcja

Przy selekcji dokumentów do celów digitalizacji zazwyczaj bierze się pod uwagę rozmiar całej kolekcji, jej wyjątkowość, stan zabezpieczenia, możliwości techniczne przeprowadzenia digitalizacji, wreszcie zdolność udźwignięcia długoterminowych kosztów procesu digitalizacji. Tymczasem selekcji powinno dokonywać się w oparciu o bardziej różnorodne kryteria.

Kryteria te powinny obejmować:

  • wartość historyczną i kulturową dokumentu,
  • jego niepowtrzalną bądź rzadką naturę,
  • jego znaczenie dla odbiorców,
  • brak ograniczeń prawnych do wykorzystania (takowe wygasły bądź uzyskano pozwolenie na digitalizację),
  • ograniczony dostęp do dokumentu z powodu złego stanu zachowania, dużej wartości lub kłopotliwej lokalizacji,
  • możliwość udostępnienia dokumentu on-line i tworzenia wirtualnych kolekcji,
  • możliwość zainteresowania dokumentem mało do tej pory znanym.

W niektórych przypadkach warto przeprowadzić wstępne badanie dokumentów przeznaczonych do digitalizacji, by ustalić ich rozmiar, typ, format i stan zachowania. Informacje te mogą być bardzo przydatne podczas ich późniejszego zabezpieczania, katalogowania (opracowywania) i digitalizowania.

Aspekty prawne

Podczas procesu digitalizacji dokumentów szczególną uwagę należy zwrócić na kwestię praw autorskich do oryginalnych materiałów jak i do ich cyfrowych kopii.

W związku z tym należy zbadać następujące fakty: rodzaj dokumentu, który ma być zdigitalizowany; właściciel praw do niego (czy dokument jest w ogóle chroniony – rodzaj ochrony prawnej – kto jest właścicielem praw?), jakie czynności trzeba podjąć, by digitalizacja była legalna (czynności – jakie prawa trzeba uzyskać – czy uzyskano pozwolenie właściciela praw?), możliwe problemy i dostępne rozwiązania.

Należy z pewnością pominąć dokumenty chronione prawami autorskimi oraz te już zdigitalizowane w ramach innych kolekcji i udostępnione on-line (w drugim przypadku chodzi o to, by nie powielać niepotrzebnie pracy i kosztów).

Przechowywanie obiektów fizycznych

Digitalizacja nie jest zwolnieniem od odpowiedzialności za odpowiednie przechowywanie i dbanie o oryginalne dokumenty.
Ważne jest, aby przed rozpoczęciem digitalizacji ocenić stan zachowania oryginałów i upewnić się, że dalsze procedowanie z nimi odbywa się wyłącznie po ich uprzednim zbadaniu przez ekspertów.

Digitalizacja

Aby zagwarantować bezpieczeństwo oryginałów, jak i odpowiednią jakość digitalizacji, w sposób przemyślany należy dobrać sprzęt do digitalizacji (skanery, aparaty, oświetlenie, oprogramowanie) i jej metodę.

Przy wyborze odpowiednich aparatów i oświetlenia decydujące znaczenie będzie miał rodzaj i wymiary oryginału.

Sprzęt i oprogramowanie należy też dobrać stosownie do jakości cyfrowych kopii, jakie chce się uzyskać, pamiętając, że jakość ta wpływa na czas całej czynności digitalizacji (czas na zreprodukowanie i opracowanie cyfrowych zdjęć) oraz na ilość miejsca potrzebnego do przechowywania uzyskanych plików.

Podstawową zasadą jest, że optymalną jakość reprodukcji nie otrzymujemy poprzez zeskanowanie jej w maksymalnej do uzyskania rozdzielczości, ale poprzez dostosowanie rozdzielczości do informacji zawartej w oryginale.

Podstawowym celem digitalizacji jest stworzenie tzw. cyfrowych kopii głównych przeznaczonych do długotrwałego przechowywania. Kopie przeznaczone do upublicznienia w sieci tworzone są z kolei z cyfrowych kopii głównych.

Digitalizacja in-house lub outsourcing

Decyzja co do tego, czy dokumenty powinny być zdigitalizowane przez instytucję dysponującą tymi dokumentami (in-house), czy raczej należy je przekazać podmiotowi zewnętrznemu, który oferuje takie usługi (outsourcing) będzie zależała od zalet i wad obu opcji.

In-houseOutsourcing
Zalety
  • bezpośrednia kontrola nad całym procesem
  • zdobywanie doświadczenia na użytek własny
  • doskonalenie standardów czynności w trakcie jej wykonywania, a nie wyłącznie określenie celów czynności przed jej podjęciem bez ich późniejszej weryfikacji
  • zapewniony stały dostęp do materiałów i prawidłowe obchodzenie się z nimi, a zatem ich bezpieczeństwo
  • zleceniodawca płaci za produkt końcowy generalnie według ustalonej stawki za pojedynczy obiekt
  • koszty są niskie a ryzyko ograniczone
  • zleceniobiorca może zająć się na raz dużą partią materiału
  • zleceniobiorca ponosi koszty zatrudnienia profesjonalnego zespołu, jego szkolenia, oraz wykorzystania nowoczesnego sprzętu
  • dostęp do szerszej oferty usługowej
Wady
  • zamiast płacić tylko za produkt, instytucja sama ponosi koszty szkolenia personelu, dodatkowego sprzętu i ewentualnego czasu przestoju w pracy
  • możliwa konieczność zakupu i utrzymania nowego sprzętu
  • potrzebni na miejscu odpowiednio wykwalifikowani pracownicy
  • koszt digitalizacji pojedynczego obiektu nie jest sprecyzowany
  • nie wykonując digitalizacji samodzielnie, instytucja zlecająca tę czynność nie nabiera wiedzy na jej temat
  • ryzyko związane z transportem oryginalnych obiektów i złym odchodzeniem się z nimi
Rekomendacje Digitallizację in-house poleca się gdy:
  • danej kolekcji nie można wynieść z instytucji, w której jest przechowywana na stałe
  • sama digitalizacja jest prosta
  • na miejscu znajduje się już profesjonalny zespół i sprzęt
Outsourcing poleca się gdy:
  • z jakiegokolwiek powodu czynności digitalizacji nie można wykonać na miejcu
  • harmonogram przewiduje digitalizację dużej ilości materiału w krótkim czasie
  • instytucja dysponująca materiałem do digitalizacji nie ma do tego odpowiednich ludzi, sprzętu i pracowni

Jeśli podjęto decyzję o powierzeniu wykonania czynności digitalizacji podmiotowi zewnętrznemu, zleceniodawca musi:

  • określić odpowiednie parametry digitalizacji,
  • sporządzić szczegółowe Zaproszenie do składania ofert,
  • oszacować usługi i produkt końcowy zainteresowanych zleceniobiorców,
  • określić w stosownej umowie zakres odpowiedzialności zleceniodawcy i zleceniobiorcy,
  • przeprowadzić końcową kontrolę jakości otrzymanego produktu.

Koszt digitalizacji zależy od różnych zmiennych, w tym od rodzajów i rozmiarów obiektów przeznaczonych do digitalizacji oraz od późniejszego przeznaczenia cyfrowych kopii; dzięki tym zmiennym można go oszacować samemu bazując na wcześniejszych projektach bądź poprosić o to zleceniobiorcę. Pomocna w tej sprawie można okazać się również literatura.

Wybór sprzętu

Ogólne zalecenia odnośnie sprzętu:

  • skanery wolnostojące (płaskie) służą do skanowania pojedynczych dokumentów bądź dokumentów zszytych, ale możliwych do płaskiego rozłożenia na szybie skanera o rozmiarze nie większym niż A3 (420 x 297 mm).
    Należą do nich: drobne druki (np. ulotki, plakaty, broszury), rękopisy (np. listy), mapy w dobrym stanie fizycznym, partytury, ilustracje (np. grafiki, sztychy, litografie), rysunki piórkiem bez akwareli czy tempery (np. karykatury, komiksy), fotografie (np. czarnobiałe i kolorowe odbitki żelatynowe, albuminy);
  • skanery do klisz i przezroczy służą do skanowania klisz, pojedynczych negatywów i przezroczy (in. diapozytywów);
  • skanery planetarne i aparaty cyfrowe służą do skanowania dokumentów zszytych, dokumentów szczególnego rodzaju bądź dokumentów o rozmiarze większym niż A3.
    Należą do nich: woluminy (np. książki, albumy, partytury, atlasy), dokumenty w złym stanie fizycznym, obrazy olejne, większość dzieł sztuki na papierze (np. akwarele, rysunki), rysunki stworzone przy użyciu materiału łuszczącego się bądź kruchego (np. kredki, węgiel, miekki ołówek), akwarele kładzione grubą warstwą w połączeniu z temperą lub werniksem, mapy bardzo duże lub w złym stanie fizycznym, rękopisy (np. szyte dzienniki, oprawione dokumenty), pergaminy, fotografie (np. odbitki dużych rozmiarów, dagerotypy, ambrotypy), obiekty trójwymiarowe (np. tkaniny, rzeźby, przedmioty).

W przypadku oryginałów antycznych bądź z dziedziny sztuk pięknych zastosowane przy digitalizacji oświetlenie musi być wygenerowane przy użyciu lamp emitujących światło zimne oraz ultraniski poziom promieniowania IR i UV.

Reprodukcja cyfrowa

Decyzję co do pożądanej jakości reprodukcji cyfrowej należy podjąć pamiętając o dostępnych środkach finansowych oraz biorąc pod uwagę potrzeby przyszłych użytkowników, sposób upowszechnienia i rodzaje wykorzystania reprodukcji, wreszcie charakterystykę obiektu fizycznego, który ma być zdigitalizowany (rodzaj obiektu, rozmiar, format, kolor, itp.).
Cyfrową kopię główną wysokiej jakości tworzy się do długotrwałego przechowywania oraz po to, by nie powtarzać już czynności digitalizacji w przyszłości (unikając w ten sposób problemów z dostępem do oryginału i kosztem ponownej digitalizacji). Taka cyfrowa kopia główna służy następnie do tworzenia plików o mniejszych rozmiarach i w innych formatach w zależności od potrzeb. Przy czym zawsze należy korzystać z formatów standardowych.

Zalecenia dotyczące pliku cyfrowej kopii głównej:

  • jest to plik tworzony i przechowywany dla pojedynczego obiektu cyfrowego, z którego można następnie tworzyć pliki pochodne (w formatach JPEG, PDF, itd.); umożliwia drukowanie odbitek wysokiej jakości;
  • plik oddaje treść oryginału tak dokładnie, jak to tylko możliwe;
  • oryginał musi być uchwycony w całości; pewien margines musi być zachowany wokół oryginału tak, aby można go było łatwo zidentyfikować;
  • jeśli oryginał fotografii znajduje się na spodzie zawierającym jakąś informację, spód ten również należy zdigitalizować;
  • plik cyfrowej kopii głównej archiwizuje się jako reprodukcję stworzoną bezpośrednio przy użyciu sprzętu digitalizującego;
  • plik powinien być zachowany w jednym ze standardowych formatów (np. TIFF);
  • nazwa pliku powinna być wyczerpująca;
  • jeśli oryginał jest digitalizowany razem z wzornikiem kolorów, szarości i linijką, powinny być one umieszczone poza obszarem oryginału.

Zalecenia dotyczące plików pochodnych:

  • to one są upubliczniane on-line zamiast pliku cyfrowej kopii głównej, a ich rozmiary zależą od tego, do czego mają służyć;
  • pliki pochodne udostępniane on-line powinny być skompresowane tak, aby dostęp do nich był szybki; ich rozmiary powinny być na tyle małe, aby można je było łatwo ściągnąć bez konieczności dostępu do szybkiego internetu; a ich jakość powinna być wystarczająca do podstawowego zapoznania się z obiektem;
  • powszechnymi w użyciu formatami są JPEG lub PDF.

Nazwa pliku

Przed rozpoczęciem czynności digitalizacji należy ustalić kryteria nazewnictwa plików. Generalnie nazwa pliku powinna składać się z ciągu słów zawierających informacje niezbędne do bezbłędnego zidentyfikowania elementu kolekcji reprezentowanego przez dany plik. W związku z tym nazwa musi być niepowtarzalna i jednoznaczna. Jej dopełnieniem jest odpowiednie rozszerzenie, np. ".tif", “.jpg”, itd.

Przechowywanie cyfrowych danych

Kolekcję cyfrowych reprodukcji, zawierającą pliki i katalogi, zapisuje się na optycznych lub magnetycznych nośnikach danych, takich jak płyty CD, DVD i dyski przenośne.
Ważne jest, by dane zapisać przynajmniej na dwóch różnych nośnikach przechowywanych w dwóch różnych miejscach; dane powinny być również regularnie aktualizowane. Ponadto pamiętać trzeba, że na żywotność nośników danych wpływają różne czynniki (standardy ISO 18923:2000 i 18925:2002 podają parametry odpowiedniego przechowywania nośników danych).

Kontrola jakości

Kontrola jakości powinna być prowadzona i dokumentowana w trakcie całego etapu digitalizacji, ze szczególnym uwzględnieniem plików cyfrowych kopii głównych.

Planując kontrolę jakości należy:

  • przygotować środowisko pracy (skonfigurować sprzęt, oprogramowanie, sprawdzić warunki zew.),
  • ustalić a priori, jakie cechy reprodukcji są dopuszczalne, a jakie nie z punktu widzenia jakości,
  • wyznaczyć zakres weryfikacji (cała kolekcja czy pojedyncze pliki, wyłącznie cyfrowe kopie główne czy również pliki pochodne, jakość wizualna widziana na ekranie czy równiż w druku, itd.).

Metadane

Metadane to dane o danych, czyli zorganizowana informacja na temat dowolnego zasobu, używana w celu jego identyfikacji, opisu, zarządzania nim i udostępniania go.

Nie ma takiego standardu metadanych, który pasowałby do wszystkich rodzajów kolekcji i do wszystkich rodzajów instytucji je przechowujących.
Ogólnie rzecz biorąc modele metadanych zawierają następującą informację:

  • metadane opisowe: dane opisujące zawartość merytoryczną zasobu i umożliwiające jej wyszukiwanie,
  • metadane administracyjne: dane na temat zarządzania i administrowania zasobem (np. zarządzanie prawami, metadane przechowywania, metadane techniczne),
  • metadane strukturalne: dane opisujące relacje pomiędzy poszczególnymi obiektami cyfrowymi (np. układ stron w e-książce).

Fragmenty z informatora Good practices handbook (wyd. Minerva Working Group 6):

"Właściwe standardy metadanych

Definicja

Istnieją już podstawowe standardy metadanych. W bibliografii (coraz częściej i w innych naukach humanistycznych), bardzo ważny jest ogólny standard metadanych Dublin Core.

Wskazówki

  • Sprawdź istniejące już standardy i modele metadanych zanim zdecydujesz się na własny model.
  • Nie powinno się tworzyć zupełnie nowego modelu metadanych dla kolekcji kulturalnych.
  • Praca nad metadanymi wykonana w ramach wcześniejszych projektów kulturalnych może okazać się użyteczna dla nowego projektu, tym bardziej, że modele metadanych z powodzeniem transponuje się pomiędzy projektami z dziedziny kultury.
  • Model metadanych dla danego projektu powinien zawierać pola standardu Dublin Core, chyba że istnieją uzasadnione powody by ich nie umieścić. Mimo, że muzea mogą częściej wybierać model CIMI dla swoich zasobów, należy dążyć do tego, by instytucje kulturalne różnego typu korzystały z modeli zaopatrzonych przynajmniej w podstawowy zestaw wspólnych atrybutów, co ułatwi potem wyszukiwanie danych między kolekcjami.
  • W przypadku, gdy ma być użyty model metadanych prawnie zastrzeżony, należy przygotować mapowanie z tego modelu do standardu Dublin Core.
  • Podczas gdy zwykły system nazewnictwa może być użyteczny, to jednak pełen model metadanych jest lepszy, i to zarówno jeśli chodzi o ilość danych, jakie można przechowywać na temat pojedynczego obiektu, jak i możliwości funkcji wyszukiwania i późniejszą interoperatywność pomiędzy różnymi projektami i krajami.”

Przechowywanie reprodukcji cyfrowych

Wszystkie zasoby cyfrowe tworzone z takim wysiłkiem przez lata powinny być przechowywane w taki sposób, aby nie trzeba było powtarzać uciążliwych czynności digitalizacyjnych. W związku z tym każda stosowna instytucja powinna przyjąć odpowiednie procedury, aby móc zapewnić użytkowników swoich zbiorów, iż obiekty cyfrowe będące w ich dyspozycji pozostaną dostępne bez względu na jakiekolwiek przyszłe rewolucje technologiczne.

Dostępność obiektów cyfrowych w dłuższym okresie czasu gwarantowana jest przez parametry techniczne plików (standardowe formaty, rozmiary, szybkość przesyłu, metody podglądu), sposoby archiwizowania i cyfrowe repozytorium (obiekty cyfrowe z ich metadanymi będą archiwizowane i przechowywane w cyfrowym repozytorium). Fundamentalną rzeczą jest, aby używać tzw. otwartych standardów, by umożliwić interoperatywność z innymi systemami i udostępnić metadane poprzez innych usługodawców (np. Europeanę).