DIGITALISERINGENS LIVSCYKEL

2/5 – Arbetsprocess

Urval

Urvalet av dokument tar normalt hänsyn till samlingens tillväxt, ökat värde, ökat skydd för materialet, tekniska möjligheter och utsikterna att långsiktigt finansiera digitaliseringen. Bäst görs urvalet på basis av en kombination av dessa kriterier.

Urvalskriterierna är i huvudsak de följande::

  • historiskt och kulturellt värde
  • unicitet
  • efterfrågan
  • objekt utan legala begränsningar eller där tillstånd för digitalisering redan finns
  • begränsningar i åtkomst pga fysiskt skick, värde och lokalisering
  • förväntat ökat värde vid publicering on-line och skapande av virtuell samling
  • förväntat ökat publikt intresse för ett okänt eller delvis okänt material

I vissa fall kan det vara mödan värt att genomföra en undersökning för att fastställa dokumentens kvalitet, typ och format samt fysiska skick (state of preservation). Denna information kan visa sig värdefull under det efterföljande bevarandearbetet, katalogiseringen och digitaliseringen.

Legala överväganden

Vid digitalisering av dokument måste stor uppmärksamhet ägnas frågan om upphovsrätt, såväl ifråga om originalmaterial som digitala resurser.

Kontrollpunkter är: beskaffenhet hos det material som ska processas, upphovsrätt (vem har ev. rättighet och vilken typ av rättighet?), vilka åtgärder kräver materialet ur legalt perspektiv (vilka rättigheter berörs, har tillstånd inhämtats?)?, vilka problemområden kan identifieras och vilka lösningar finns?

Material som måste uteslutas, är de som berörs av upphovsrätt (copyright) och de som digitaliserats i andra sammanhang och samlingar och publicerats via Internet. Detta för att undvika dubbletter och onödiga kostnader.

Bevarande av dokument/objekt

Digitalisering kan inte ersätta vård och bevarande av originaldokument.
Det är viktigt att bedöma bevarandeläget innan digitaliseringen vidtar och försäkra sig om att originaldokument blir föremål för vårdinsatser först sedan de granskats av expertis.

Digitalisering

För att säkerställa dokumentens säkerhet och en hög kvalitet vid digitaliseringen, måste särskild omsorg ägnas valet av metod och utrustning (digitaliseringshårdvara, ljussättning och mjukvara).

Beskaffenheten hos och dimensionen på originalen måste avgöra valet av utrustning och ljussättning.

Hård- och mjukvarukraven på systemet för bildfångst avgörs av den kvalitetsnivå man förväntar sig, liksom förväntad processtid för bildframställningen samt tillgången till utrymme, för lagringen av bilddata.

En tumregel är, att kvalitet inte är avhängigt av den maximala upplösning som en skanning kan åstadkomma, utan att man väljer en nivå som står i relation till den information som ska fångas.

Det övergripande målet med en digitalisering bör vara att framställa arkivfiler som lämpar sig för långtidsbevarande. Olika former av påsiktbilder genereras sedan ur arkivfilerna.

Digitalisering i egen regi eller inköp av tjänsten

Beslutet om huruvida dokument ska digitaliseras i egen regi eller om arbetet ska anförtros en extern tjänsteutförare, är avhängigt av fördelarna respektive nackdelarna med de två alternativen.

Egen regiInköpt tjänst
Fördelar
  • möjlighet till direktkontroll av processen
  • möjlighet till "lära genom att göra"
  • möjlighet till förbättringar av standarder under arbetets gång, snarare än att fixera mål i förväg
  • möjlighet att trygga säkerhet samt god hantering av och tillgång till materialet
  • institutionerna betalar endast för slutprodukten, normalt baserat på t.ex. pris per bild
  • kostnader och risker kan hållas nere
  • den som utför tjänsten kan ofta hantera stora volymer av material
  • den som tillhandahåller tjänsten axlar kostnader för kunskapsuppbyggnad, lärande och investeringar i teknik
  • en rad valmöjligheter och typer av tjänster finns tillgängliga
Nackdelar
  • snarare än att bara betala för en produkt, betalar institutionerna även för upplärning, investeringar i teknik och ev. driftavbrott
  • utlägg för inköp och underhåll av utrustning
  • behov av speciellt utbildad personal
  • kostnaden per bild är inte definierad
  • genom att ett steg i processen elimineras, kan institutionerna inte utvecklas kunskapsmässigt i fråga om digitalisering
  • det uppstår problem med säkerhet, transporter och hantering av originaldokument
Rekommendationer I egen regi är bäst om:
  • samlingen inte kan flyttas utanför institutionen
  • digitaliseringen utgör en enkel process
  • man kan utnyttja redan befintlig personal och utrustning
Extern tjänst är bäst om:
  • originaldokumenten inte kan digitaliseras i egen regi av något skäl
  • upplägget innebär att stora volymer ska hanteras på kort tid
  • institutionerna inte har utrymmen, infrastruktur och adekvat personal att tillgå

Om det beslutas att en extern utförare ska anförtros att utföra tjänsten, måste institutionen:

  • upprätta en detaljerad kravspecifikation
  • upprätta en anbudsförfrågan
  • utvärdera erbjudna produkter och tjänster
  • definiera vilka skyldigheter som åligger institutionen respektive den externa utföraren och ska upptas i kontraktet
  • utföra den slutliga kvalitetskontrollen av den levererade produkten

Digitaliseringens kostnader är avhängigt av en rad variabler, nämligen dokumentens storlek, typ och beskaffenhet. Det önskade användningsområdet för den digitala kopian är en lika viktig faktor. På basis av dessa uppgifter och liknande projekt, kan den som utför tjänsten uppskatta kostnaderna.

Val av utrustning

Generella krav på fångssystemet/digitaliseringssystemet:

  • Flatbäddsskannrar används för enstaka ensidiga dokument eller bundna dokument som kan öppnas helt utan svårighet och där dokumentstorleken inte överstiger A3 (420x297 mm).
    Detta inkluderar: trycksaker (t.ex. flygblad, affischer, broschyrer), manuskript (t.ex. brev), vissa kartor, notark, tryck (t.ex. graveringar, etsningar, littografier), teckningar utförda i bläck utan tillagda vattenfärger eller tempera (t.ex. teckande serier i original), fotografiskt material (gelatin- eller albuminfoton i svart-vitt eller färg).
  • Skannrar för film och transparanter används för film, negativ och transparanter.
  • Planetarskannrar eller digitalkameror används för bundna dokument, dokument av särskilt slag och i de fall att de är större än A3.
    Dessa dokument inkluderar: bundna volymer (t.ex. böcker, album, notark, atlaser), sköra dokument, oljemålningar, det mesta av konst på papper (t.ex. vattenfärger), grafiskt material och konstarbeten utförda med flagiga och sköra substanser (t.ex. crayon, kol, eller mjuk penna), vattenfärger som applicerats i tjocka lager, tempera, större eller ömtåliga kartor, manuskript (t.ex. bundna dagböcker och vikta dokument), pergamentdokument, fotografiskt material (t.ex. större bilder, bilder som åstadkommits äldre metoder, som daguerreotyper och ambrotyper), tredimensionella objekt (t.ex. tyger, skulpturer och andra föremål).

I fråga om antika objekt och andra konstföremål måste ljussättning speciellt arrangeras med sk kallt ljus och låga nivåer av IR- och UV-strålning.

Digital fångst

Samtidigt som man måste betänka vilka resurser som står till buds, bör beslutet om bildkvalitet baseras på användarnas behov, metoder för distribuering och användning av bilderna samt beskaffenhet hos de dokument som skall digitaliseras (storlek, format, typ av material, färger osv).
Det finns flera olika skäl varför högkvalitativa digitala arkivexemplar (masters) bör skapas: bevarande, tillgänglighet och kostnad samt behovet av att säkra att digitaliseringen inte behöver göras om i framtiden. Arkivexemplaren ska kunna användas för att framställa filer av mindre storlek och i alternativa format för olika framtida behov. Standardformat bör alltid nyttjas.

Krav på arkivfilerna eller mastrarna:

  • detta är den fil som bevarar informationen om varje enskilt objekt och från vilken olika derivat kan genereras (JPEG, PDF etc); den tillåter också högkvalitativ utskrift
  • arkivfilen återger originalets informationsinnehåll så troget som möjligt
  • originalet måste "fångas" i sin helhet. En marginal måste lämnas runt dokumentet, så att dess yttre avgränsningar framträder tydligt
  • om originalet är monterat på någon form av material som bär på ytterligare information, bör digitaliseringen inkludera även denna
  • arkivfilen ska arkiveras exakt som den uppstod ur fångstsystemet
  • arkivfilen bör vara av standardiserat format, såsom TIFF
  • filnamnet bör innehålla en hänvisning till en färgprofil
  • om originalet avbildas tillsammans med sk färgkilar, ska dessa placeras utanför det reproducerade objektets yttre kanter, men inom den digitala bildens yttre kanter

Krav på derivatfilerna:

  • dessa används istället för arkivfilen för t.ex. tillhandahållande via nätverk, varför kraven ska anpassas efter avsedd användning
  • derivatfilerna ska tillåta snabb nedladdning, utan att det krävs höghastighetskapacitet vid överföringen, menvara av acceptabel kvalitet för normal forskning samt vara av ett komprimerat format för ökad snabbhet i accessen
  • vanliga format är JPEG och PDF

Namngivning av filer

Innan digitaliseringen kan ta sin början måste konventioner för namngivning av filer fastställas. Generellt ska varje fil innehålla en sträng av tecken som måste innehålla den nödvändiga information som krävs för att identifiera det objekt som avbildas, unikt och otvetydigt. Filnamn ska följas av rätt filändelse, t.ex. ".tif", ".jpg" etc.

Storage of data

Samlingen av bilder (digitala), som består av kataloger och filer, ska sedan lagras på optiska eller magnetiska medier, såsom CD, DVD eller externa hårddiskar.
Det är viktigt att datat bevaras på minst två sådana databärare, på två olika fysiska platser och att datat kontrolleras och uppdateras regelbundet. Databärarnas livslängd påverkas av en rad olika faktorer (standarderna ISO 18923:2000 och 18925:2002 innehåller uppgifter om hur lagringsmedia lämpligen bevaras).

Kvalitetskontroll

Kvalitetskontroller ska dokumenteras och genomföras under hela digitaliseringsprocessen, på allt fångat material och i synnerhet på arkivfilerna.

Planeringen av kvalitetskontrollen bör inkludera:

  • förberedelse av en lämplig miljö för kontrollerna (hårdvarukonfiguration, mjukvara för visning, visningsförhållanden etc)
  • utvecklade definitioner av vad som kännetecknar "acceptabelt" respektive "icke acceptabelt"
  • kontrollprocedurer (hela samlingen eller stickprov, alla filer eller endast arkivfiler, visuell kvalitet vid skärmvisning, vid utskrift etc)

Metadata

Metadata är strukturerad information relaterad till olika slags material och används för identifiering och beskrivning samt underlättar åtkomst till materialet i fråga.

Det finns ingen metadatastandard som uppfyller alla typer av behov för alla typer av samlingar.
Generellt innehåller olika metadatamodeller följande information:

  • Beskrivande metadata: data som beskriver innehåll i en källmaterialresurs och underlättar åtkomst till ytterligare information
  • Administrativa metadata: data innehållande uppgifter om hantering och administration av källmaterialresursen (t.ex. rättigheter, bevarandemetadata och teknisk information)
  • Strukturella metadata: data som beskriver relationen mellan digitala objekt (t.ex. sidordningen i en digitaliserad bok)

Från Good practices handbook (redigerad av Minerva Working Group 6)

"Lämpliga metadatastandarder

Beskrivning vid utgivning

Vissa viktiga standarder för metadata finns redan. Inom den bibliografiska domänen (och i allt högre grad inom övriga kultursektorer), spelar Dublin Core en allt mer framträdande roll.

Pragmatiska förslag

  • Inventera existerande metadatamodeller och standarder innan du skapar en egen ny.
  • Man bör undvika att skapa helt nya metadatamodeller för kulturarvssamlingar.
  • Det metadataarbete som redan utförts av tidigare och liknanade projekt är troligen relevanta även i ditt fall - inom kulturarvssektorn kan metadatamodeller ofta återanvändas.
  • Såvida ditt projekt inte har goda skäl att inte göra det, bör fält från Dublin Core inkluderas i metadatamodellen. Även om muséer kan finna att CIMI-modellen är bättre lämpad för deras samlingar, börman sträva efter en gemensam kärna av attribut, vilket möjliggör sökningar som spänner över olika samlingar.
  • Om en proprietär modell för metadatat ska användas, bör också en mappning mot Dublin Core utvecklas samtidigt.
  • Även om lokala eller nationella konventioner och scheman för metadata kan vara användbara, är en fullständig datamodell bättre, både i fråga om mängden data som kan lagras om ett objekt och i fråga om möjligheterna att utföra kraftfulla sökningar och interagera med andra projekt och länder."

Digitalt bevarande

Vid alla digitaliseringsprojekt är det viktigt att bevara digitala resurser, på ett sådant sätt att betungande nydigitaliseringar kan undvikas. Därför måste institutionerna skapa rutiner som säkrar de digitala objektens användbarhet och åtkomsten till dem, oavsett vilka teknologiska förändringar som sker i framtiden.

Användbarheten av och åtkomsten till de digitala objekten över tid, garanteras av filformatet (standard för format, filstorlek, nätöverföringskapacitet, metoder för visning av bilder...) och av använt arkivaringsmedia och den digitala lagringen (digitala objekt med kopplade metadata arkiveras och hanteras i ett digitalt lager). Det är av grundläggande vikt att öppna standarder används, varigenom interoperabilitet med andra system underlättas. Även tillgång till metadata via andra tjänsteutförare (t.ex. Europeana) möjliggörs på detta sätt.