Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal

From Tracks
Jump to navigation Jump to search
This page contains changes which are not marked for translation.
Other languages:
English • ‎Nederlands • ‎français

Het digitaliseren van analoog tekst- en beeldmateriaal kan veel voordelen bieden, bijvoorbeeld voor raadpleegbaarheid. Digitalisering is echter een intensief proces dat veel tijd en middelen vraagt. Een goede planning en aanpak zijn dan ook cruciaal.
In deze tool leer je het volgende:

  • Waar moet je je gedigitaliseerde beelden opslaan?
  • Hoe beschrijf je je gedigitaliseerde beelden?
  • Hoe zorg je voor een goede beeldkwaliteit van de gedigitaliseerde beelden?
  • Welke bestandsformaten moet je gebruiken voor je gedigitaliseerde beelden?

Digitaliseren is het omzetten van analoog materiaal, zoals papier of foto’s, naar een digitale vorm. Dit kan zo eenvoudig zijn als een foto onder een scanner leggen, maar wanneer je een grote collectie structureel wil digitaliseren, is het aanbevolen om voldoende aandacht te hebben voor de kwaliteit van de digitalisering. Collecties digitaliseren is immers een proces dat veel tijd en middelen vraagt. Zorg er dus voor dat het resultaat duurzaam is en in de toekomst voor zoveel mogelijk doeleinden kan worden (her)gebruikt. In deze tool gaan we verder in op de zaken waarmee je rekening moet houden om delen van je archief en collectie(s) kwaliteitsvol te digitaliseren.

De kwaliteit van je gedigitaliseerd collectiestuk wordt bepaald door vier zaken, waar we verder in deze tool meer uitleg over geven:

  • de locatie waar je gedigitaliseerde collectiestukken opslaat;
  • de gegevens (metadata) die je registreert over het bestand;
  • de beeldende kwaliteit van de opname;
  • de kwaliteit van het bestandsformaat waarin je de beeldinformatie opslaat.
Een boekscanner in actie. Boekscanners zijn optimaal ontworpen voor het inscannen van boeken

Goed om te weten voor het lezen

In dit onderdeel lees je meer over het digitaliseren van tekst- en beeldmateriaal, zoals foto’s, affiches en tekeningen. Heb je ander materiaal, zoals audiotapes of filmspoelen, ga dan naar de tool Digitaliseren van geluidsopnames en video's.

Voor je digitaal geboren archiefmateriaal (d.w.z. de bestanden die op computer zijn gemaakt) verwijzen we naar de tools over Digitaal bewaren.

Digitalisering kan je ook uitbesteden aan een professioneel bedrijf. Zij hebben vaak meer expertise in huis om kwaliteitsvol te digitaliseren. Maar beoordeel hun expertise en de kwaliteit van hun expertise ook op basis van de hogergenoemde zaken. Meer info hierover vind je in Een digitaliseringsopdracht uitbesteden.

Als je beslist om zelf te digitaliseren, denk dan goed na over wie welke taken op zich zal nemen. Wat kan je realiseren met de tijd en vaardigheden van de werknemers? Waarvoor schakel je eventueel externe consultants in? Werk je met studenten of vrijwilligers? Soms kan het nuttig zijn om mensen de mogelijkheid te geven om bepaalde vaardigheden te laten ontwikkelen. Wanneer je plant om vrijwilligers of studenten in te schakelen, lees dan zeker ook de tool (Vrijwilligers-)werk in de archiefzorg.

De opslaglocatie

Stel je voor dat je maandenlang je hele fotocollectie digitaliseert en de foto's bewaart op je computer. En dan wordt je computer gestolen! Of je morst er koffie over. Of na een systeemupdate blijken al je beelden gewist.

Er kan vanalles misgaan met je gedigitaliseerd archief. Zorg er daarom voor dat je digitale bestanden goed worden opgeslagen. Dit houdt minstens een goede back-upstrategie in. Lees hierover meer in de tool Hoe maak je een back-up?.

De flatbedscanner, met het typische deksel, is wellicht de meest bekende vorm van scanner. Kan geschikt zijn voor het digitaliseren van tweedimensionale objecten zoals documenten, foto's en tekeningen, maar ook transparante dragers als dia's kunnen ermee worden gescand. Formaten gaan van A4 tot A0 en meer.

De beschrijving

Een digitale reproductie waarvan je niet weet wat het origineel is en wanneer of door wie de kopie is gemaakt, verliest heel wat waarde. Documenteer daarom goed wat gedigitaliseerd is en waar het origineel zich bevindt.

Het verdient de voorkeur om de collectie die je gaat digitaliseren te registreren of te beschrijven voor je begint te digitaliseren. Een andere optie is dat je het doet tijdens het digitaliseren, maar zorg er voor dat je op voorhand goed hebt nagedacht over hoe je dat zult doen. De beschrijving kan je maken in een spreadsheet zoals Excel ofin een database. Gebruik liever geen Word of andere ongestructureerde tekstformaten.

Idealiter is er al een plaatsingslijst of inventaris aanwezig van de collectie die je kunt gebruiken als basis voor de registratie van je digitaliseerwerk. Is die er niet, maar wil je toch al een selectie van materiaal digitaliseren, noteer dan steeds goed bij elk bestand wat het is en waar de analoge bron in jouw collectie terug te vinden is. Zo weet je steeds waar het origineel zich bevindt.

Een spreadsheet voor het digitaliseren

Een spreadsheet dient om een overzicht op je digitaliseerwerk te verkrijgen en om de band tussen digitale reproductie en origineel te behouden. Om dit te bekomen registreer je minimaal volgende zaken:

Kolom Inhoud van de kolom
Uniek nummer Een uniek nummer zorgt voor een eenduidige identificering van de reproductie en het origineel. Het is erg belangrijk dat je dit nummer in de bestandsnaam van de reproductie noteert. Vaak wordt het ook op het origineel aangebracht (in potlood bv.) Het unieke nummer kan een combinatie zijn van je inventarisnummer in combinatie met een oplopend nummer (bv. voor fotoalbums)
Type document Indien je collectie uit verschillende soorten materiaal bestaat, kun je dat hier aangeven, bijvoorbeeld: "foto", "tekstdocument", "affiche"...
Korte omschrijving Een beknopte inhoudelijke omschrijving over het origineel, bijvoorbeeld: "Foto genomen tijdens een studiereis in Praag", "Affiche van een voorstelling in de Beursschouwburg"...
Plaatscode Indien je met het inventarisnummer alleen niet voldoende informatie hebt over waar je het origineel kunt terugvinden, kun je dit in dit veld terugvinden, bv. het nummer van de doos waar het origineel zich in bevindt.

Deze kolommen zijn het minimum en volstaan om te starten met kwalitatieve digitalisering. Naargelang het materiaal of je noden, kan je natuurlijk kolommen naar eigen keuze toevoegen. Het meest typisch zijn kolommen:

  • voor begin- en einddatum
  • voor een project waarmee de foto verband houdt (bv. tentoonstellingen voor kunsthuizen, producties voor podiumorganisaties)
  • voor personen op het beeld.

Algemeen geldt: hoe simpeler, hoe vlotter de digitalisering zelf zal verlopen. Bedenk dat je inhoudelijke beschrijving ook kunt toevoegen na digitalisering, op basis van de reproducties.

Denk ook goed na of je extra beschrijvende metadata gaat noteren in je spreadsheet of in je inventaris en plaatsingslijst.

De bestandsnaam en folderstructuur voor je reproducties

Naast een beschrijving in een spreadsheet of database, is het ook belangrijk dat je nadenkt over de bestandsnaam van je digitale reproductie. Zoals gezegd moet er altijd een verband zijn met je bestandsnaam en het unieke nummer in je spreadsheet. Het unieke nummer staat bij voorkeur vooraan (al dan niet voorafgegaan door een unieke code die verwijst naar je organisatie). Achter een underscore kan je desgewenst nog tekst noteren.

Bekijk hiervoor ook de tool Naamgeving van mappen en bestanden.

Wanneer je documenten digitaliseert waarvoor je meerdere reproducties moet maken (zoals fotoalbums, boeken of tijdschriften) moet je extra goed nadenken over de bestandsnaam. Zorg ervoor dat de bestandsnaam de juiste volgorde van de paginering weergeeft.

Voor een origineel waarvoor je voor- en achterkant moet digitaliseren wordt vaak gebruikt gemaakt van de codes "-r" (recto) en "-v" (verso) in bestandsnamen.

Tijdschriften zijn nog ingewikkelder. Ze hebben jaargangen, edities en soms ook supplementen... Je zal dus moeten nadenken over hoe je die logica opslaat via je bestandsnaam of folderstructuur. Je kunt zelfs helemaal niet ordenen en volledig vertrouwen op je spreadsheet om de tijdschriftstructuur op te bouwen.

Moeilijk is het allemaal niet, maar zorg dat er een eenduidige manier is waarop de bestanden worden geordend.

De beeldende kwaliteit van de opname

De beeldende kwaliteit van de opname start met de kwaliteit van de opnameapparatuur. Hoe beter je fototoestel of camera, hoe beter je afbeeldingen zijn. Maar hoe beter je apparatuur, hoe meer kennis je als gebruiker nodig hebt om de apparatuur goed af te stellen.

Of je scanner of fototoestel voldoende scherpte haalt en de kleuren exact reproduceert, hangt af van de mate waarin deze zijn gekalibreerd (zie verder). Veel hangt ook af van je reproductieomgeving, zeker wanneer je gaat fotograferen. De lichtinval moet steeds goed kunnen worden gecontroleerd. Tot slot zullen veel opnames nadien nog bewerkingen moeten ondergaan zoals rechttrekken en croppen.

Een goede basishandleiding over het afstellen van de apparatuur vind je terug op de website van FARO.

Een documentscanner, waarbij grote hoeveelheden documenten automatisch kunnen worden gescand m.b.v. een document feeder. Voor kwaliteitsvolle scans worden dit soort doorvoeroplossingen met document feeders meestal afgeraden. Oude, fragiele en waardevolle stukken lopen bovendien risico om te worden beschadigd.

Vuistregels

Neem altijd volgende vuistregels in acht:

  • Scan het volledige document met een rand van ongeveer een halve cm rond het document. Zo heb je het bewijs dat je het volledige document hebt gedigitaliseerd. De rand kan je later altijd nog weghalen, bv. bij een publicatie.
  • Het beeld moet op ware grootte een resolutie hebben van minimum 300 ppi. Ppi staat voor pixels per inch. Dat wil zeggen dat er voor iedere inch (een Engelse afstandsmaat) van je document 300 beeldpunten worden opgenomen. Hoe meer beeldpunten, hoe hoger de scherpte en hoe meer je het beeld kan inzoomen zonder kwaliteitsverlies voor het oog. Digitaliseer je documenten waarvan je weet dat je moet kunnen inzoomen (bv. pasfoto’s of dia’s), dan is de standaardwaarde van 300 PPI niet voldoende. Wil je het document standaard 2x kunnen inzoomen, ga dan voor 600 ppi. Voor 4x uitzoomen reken je 1200 ppi, enzovoort.
  • Scan of fotografeer je in kleur, ga dan voor een bitdiepte van 24 bit. Dat is het aantal bits (de nulletjes en eentjes) dat wordt gebruikt om de kleur per pixel te registreren. Hoe groter de bitdiepte, hoe groter het gamma aan kleuren dat kan worden opgeslagen.
  • Scan of fotografeer je in grijswaarden, ga dan voor een bitdiepte van 8 of 16 bit.
  • Zorg dat de kleur van de opnames wordt opgeslagen in een voldoende rijk kleurprofiel. Bij digitaliseringsprojecten is een RGB-kleurenprofiel gebruikelijk. In de erfgoedwereld wordt meestal geopteerd voor de kleurprofielen ECI RGB v2 of Adobe RGB. Een veel voorkomend kleurprofiel is sRGB. Gebruik dit niet voor je archiverings- of moederbestanden (zie onder). Het gamma van kleuren dat sRGB kan opslaan is niet rijk genoeg. Voor meer informatie over kleurenprofielen, zie Wat zijn kleurprofielen?.

De opnameapparatuur kalibreren

Indien je bovenstaande vuistregels volgt, dan ben je al goed bezig, maar alleen zijn ze niet voldoende. Om hoogwaardige reproducties te creëren is een goede kalibratie van je opnameapparatuur en beeldscherm vereist. Bovendien moeten omgevingsfactoren zoals belichting optimaal zijn.

Om dit goed uit te werken, moet je bereid zijn om je in de materie te verdiepen, tenzij je het uitbesteedt aan een professional. (Zie hiervoor de tool Een digitaliseringsopdracht uitbesteden) Wil je het toch zelf doen, neem dan de handleidingen door en experimenteer. Volg eventueel een cursus. Hou alleszins rekening met de vuistregels zoals hoger vermeld.

Opnameapparatuur kalibreren en de standaarden van hoogwaardig digitaliseren behalen is een vrij technische aangelegenheid. Heb je geen tijd om je hierin te verdiepen en wil je gewoon reproducties maken die standaard van een behoorlijk niveau zijn (zonder dat je veel belang hecht aan exacte kleurenreproductie), dan kan dat natuurlijk. Beter een digitale opname dan helemaal geen opname. Probeer je wel altijd te houden aan de vuistregels.

Apparatuur

Wat voor apparatuur moet ik aankopen? Een scanner of een fototoestel? Koop je apparatuur van goede kwaliteit, dan kun je in principe in beide scenario's de normen voor een kwaliteitsvolle scan halen.

Voor beginners is een scanner vaak eenvoudiger in gebruik. Met een goed fototoestel heb je meestal meer mogelijkheden om goede opnames te maken, omdat je meer parameters kan instellen. Hou er wel rekening mee dat dit een steile leercurve met zich meebrengt en dat een goede omgeving nodig is waarin je het licht kan controleren. Foto's die je maakt zonder kennis van fotograferen of in slechte omstandigheden, leveren minder goede beelden op dan scanners.

Als je een scanner koopt, zorg dan dat de software toelaat dat je minstens de resolutie, bitdiepte en kleurprofiel kan instellen. Let er ook op dat de scanner de bestanden kan aanleveren in ongecomprimeerde TIFF-bestanden (zie verder). Tip! Lees de user reviews over het toestel, vraag advies aan verkopers of ga te raden bij de TRACKS-partners.

Een fotografische opstelling. Voor kwaliteitsvolle foto's is er controle van belichting nodig.

Software

Goede beeldbewerkingssoftware om bestanden te bewerken en in het juiste bestandsformaat op te slaan (zie verder) is een aanrader. Zeer bekend en heel geschikt is Adobe Photoshop. In combinatie met Lightroom, een tool waarmee je Photoshopacties over meerdere afbeeldingen tegelijkertijd kan uitvoeren, kan je veel bereiken. Een andere software die vaak wordt gebruikt door professionals, is Capture One.

Er zijn ook gratis alternatieven. Voor Photoshop is dat Gimp. Voorbeelden van gratis software om beelden in batch te bewerken (zonder dat we deze in het bijzonder willen aanraden), zijn onder andere XnView en Faststone Image Viewer.

De kwaliteit van het bestandsformaat

Welk bestandsformaat kies je: JPEG, TIFF of PNG? Het antwoord is dat je je bestand in meer dan één kopie opslaat. Creëer minstens een archiveringsbestand en een raadplegingsbestand. Indien je dat wenst kan je ook nog het moederbestand opslaan.

Het archiveringsbestand

Het archiveringsbestand is de kopie waarin je al je informatie zo hoogwaardig mogelijk opslaat, zonder risico op informatieverlies. De archiefkopie dient als je backup waar je altijd weer naar terug kan grijpen wanneer je de hoogste kwaliteit nodig hebt.

Kies als archiefkopie voor ongecomprimeerde TIFF van het type Uncompressed Baseline TIFF v 6.0. Dit bestandsformaat neemt meer opslagruimte in dan de andere, maar het is wel het formaat dat wereldwijd gebruikt wordt voor de opslag van hoogwaardige beelddata. Zorg ervoor dat je géén compressie kiest in je archiefbestanden. Compressie wordt vaak gerealiseerd door bepaalde informatie weg te knippen die niet meteen zichtbaar is voor het oog, maar die wel zichtbaar wordt wanneer je het bestand gaat bewerken in Photoshop (bv. bewerking voor boekpublicatie).

Zorg ervoor dat de kleuren in het archiveringsbestand gecodeerd worden in de kleurruimte ECI RGB v2 of Adobe RGB. Je kan dit instellen met Photoshop.

Controleer de TIFF. Niet iedere TIFF is een goedgemaakte TIFF. De TIFF wordt gemaakt door de software van je scanner en die software is mensenwerk. Er kan dus iets fout lopen. Om te controleren of je TIFF goed gecodeerd is kun je de gratis tool DPF Manager gebruiken.

Het raadplegingsbestand

De niet-gecomprimeerde TIFF is meestal te zwaar voor dagelijks gebruik en publicatie op het web. Hiervoor gebruik je een kopie in JPEG. Deze kopie noemen we het raadplegingsbestand. Zo’n bestand maak je het makkelijkst aan met software als Adobe Lightroom of alternatieven, waarbij je TIFFs in batch kan converteren naar JPEG.

Het moederbestand

Als je dat wenst kan je ook nog een onderscheid maken tussen moederbestand (of master) en archiefbestand. Beiden zijn TIFF en van hoge kwaliteit, maar je moederbestand bevat de info onbewerkt, zoals ze uit de scanner of het fototoestel komt. Je archiefbestand is dan een bewerkt beeld, mooi rechtgezet, bijgesneden tot op de rand enz.

Wanneer je een moederbestand, archiefbestand en raadpleegbestand bewaart, ben je zeker dat je de opname voor alle mogelijke functies kan gebruiken. Het betekent wel dat je tweemaal een zware tiff moet opslaan.

Meer lezen

Auteurs: dit artikel is oorspronkelijk gebaseerd op een tekst van Wim Lowet (Vlaams Architectuurinstituut), in samenwerking met Nastasia Vanderperren en Bart Magnus (meemoo).