10 augustus 2006
Het initiatief van de Koninklijke Bibliotheek om een klein gedeelte van hun zeven kilometer krantenarchief, ongeveer een kilometer (15 % van het totaal) te gaan digitaliseren, kan niet het enthousiasme opbrengen van iedere belanghebbende. De grote krantenconcerns weten nog niet of ze aan het project gaan meewerken; het toegankelijk maken van hun eigen archief kan namelijk commercieel voordeel voor ze opleveren en een gratis beschikbaarstelling via Internet, wat de Koninklijke Bibliotheek (KB) met de gescande kranten wil doen, ligt niet in de lijn van hun bedoelingen. Desalniettemin: het project gaat door, want een overheidssubsidie van 12,5 miljoen euro is via het Innovatieplatform ondertussen al verstrekt.
De kranten van de KB liggen opgeslagen in een ondergronds depot, verpakt in grote zuurvrije dozen op hoenderden meters aan stellingkasten. Titels die al jaren geleden het leven hebben gelaten liggen hier te wachten op hun vergankelijkheid. Want wie leest nu nog De Locomotief of De Java-Bode of de Nieuwe Courant. En ga zo door. Het zoeken erin is een schier onmogelijke taak, ondanks alle toegangen en inventarissen die beschikbaar zijn. Wil de onderzoeker echt iets vinden dan moeten er talloze mappen worden doorgewerkt, moet de onderzoeker het monnikenwerk verrichten waarvoor hij is opgeleid, maar waarvoor nauwelijks nog de tijd is. De digitalisering van de geselecteerde kranten tussen 1618 en 1995 moet de doorzoekbaarheid vereenvoudigen; de gratis ter beschikking stelling zal in ieder geval de mogelijkheid daartoe voor ieder soort onderzoeker vergroten. In 2008 moeten de eerste titels digitaal toegankelijk zijn. In 2011 moet de klus geklaard zijn. Hans Jansen, directeur Research & Development, leidt het project. 'Helaas kunnen we niet al onze kranten scannen. Daarvoor is er te weinig geld. We hebben zeven kilometer kranten staan, waarvan ongeveer 15 procent kan worden gedigitaliseerd. Dan hebben we het over acht miljoen pagina’s, zo’n dertig miljard woorden'. De KB heeft op haar site al 350.000 gescande pagina's staan van kranten uit de periode 1910-1945. Dit nieuwe project kan niet op dezelfde manier worden aangepakt als dat oudere project. 'We moeten nu een beredeneerde selectie gaan maken: welke kranten we wél en welke kranten we niét aan de vergetelheid gaan ontrukken'. In periode vanaf 1618 zijn in het gebied wat we nu Nederland noemen meer dan 7000 verschillende kranten verschenen. 270 van die kranten waren gericht op het hele land. Die moeten in het project in ieder geval allemaal worden gedigitaliseerd. Uit de andere titels moet een keuze worden gemaakt. De selectie van die kranten is nog niet zo simpel, want iedere keuze is subjectief. Naast de scans van de kranten blijven ook de originelen bewaard. Maar gezien het feit dat vele kranten na verloop van tijd conservering benodigen dankzij het slechte papier dat gebruikt werd is deze digitaliseringsoperatie een zeer belangrijk project voor het behoud van belangrijk cultuur-historisch erfgoed. Het belangrijkste is de doorzoekbaarheid van de tekst. 'Als je een zoekterm invult, moet die relevante resultaten opleveren. Dat betekent dat aan sommige delen van de krant, zoals artikelen op de voorpagina en koppen, meer waarde moet worden toegekend dan aan andere delen. Maar wat doe je met de oude kranten waarin helemaal geen koppen boven de stukken staan?' Het kranten-digitaliseringsproject is naar alle waarschijnlijkheid het grootste project ter wereld van die soort. 'We kunnen natuurlijk de software gebruiken die Google gebruikt bij het inscannen van de boeken voor Google Library, maar een krant is toch wat anders dan een boek. Aan de universiteiten van Tilburg en Nijmegen wordt nu gewerkt aan de ontwikkeling van text mining software die wij misschien gaan gebruiken'. Het project leidt tot gefronste wenkbrauwen bij de grote Nederlandse krantenconcerns. De Telegraaf en PCM zijn niet direct enthousiast. De Telegraaf heeft haar oude jaargangen al gedigitaliseerd en wil die commercieel gaan uitbaten; het project van de KB wordt dan ook niet ondersteund. Ton Boerma van die krant vindt het 'een geweldig idee' van de KB. 'Maar laat ze maar even met de oude, niet meer bestaande titels beginnen. Dan kunnen we rustig om de tafel gaan zitten om te praten over wie wat gaat doen met kranten die nog verschijnen'. De PCM-woordvoerder laat zich in dezelfde bewoordingen uit. 'In het verleden hebben we altijd met de KB meegewerkt, maar nu het gaat om al onze oude jaargangen, moeten we nog eens goed nadenken of we die niet zelf commercieel willen exploiteren'. En tegenstand van deze rechthebbenden kan het project nog aardig in de wielen rijden….