29 november 2007
Bijna een decennium gelden startten een aantal computerwetenschappers van de Carnegie Mellon University een project met een verbazingwekkend ambitieus doel: het digitaliseren van de gepubliceerde werken van de mensheid om deze gratis online ter beschikking te stellen. De architecten van het Universal Library project stelden dat zij hun laatste doel hadden overtroffen: het scannen van 1,5 miljoen boeken, waarvan een groot gedeelte in het Chinees. Dagelijks werden er aan dat totaal nog duizenden toegevoegd. 'Anyone who can get on the Internet now has access to a collection of books the size of a large university library', zegt Raj Reddy, een hoogleraar in computerwetenschap en robotica aan de Carnegie Mellon University. Veel van het werk in het Million Book Project is uitgevoerd door arbeiders in scancentra in India en China, geholpen door een financiele subsidie van 2,3 miljoen euro van de U.S. National Science Foundation en bijna even hoge tegemoetkomingen van hard- en softwareleveranciers. Ook China en India hebben gezamenlijk zo'n 3 miljoen euro gesubsidieerd.
De Zhejiang Universiteit, het Indian Institute of Science en de Bibliotheek van het Egyptische Alexandria zijn als partners van de Carnegie Mellon University in het project gestart en hebben substantieel bijgedragen in de digitaliseringsinspanningen. Bijna de helft van alle gescande boeken heeft geen last van het auteursrecht, omdat dat al lang is verlopen, of is gescand met toestemming van de rechthebbenden. Uittreksels van auteursrechterlijk beschermde werken zijn toegevoegd, hoewel de organisatoren verwachten dat de complete teksten van deze boeken uiteindelijk beschikbaar komen. Het project is niet het eerste in zijn soort. Zowel Google als Microsoft hebben gelijksoortige projecten opgestart, hoewel Carnegie Mellon stelt dat de de Universal Digital Library de grootste universitair-ondersteunde bibliotheek is van vrije boeken en dat het doel niet-commercieel is. Dat laatste is vergelijkbaar met de projecten van The Internet Archive en Project Gutenberg, die qua omvang ween stuk minder omvangrijk zijn. 'It is a step toward the creation of an online library that would make traditionally published books available to all', zegt Reddy. 'The economic barriers to the distribution of knowledge are falling', zo geeft hij in een verklaring te kennen. Michael Shamos, eveneens hoogleraar computerwetenschap aan Carnegie Mellon en tevens gespecialiseerd als advocaat in intellectueel eigendom, stelt dat 'the library's mission included making vast amounts of information freely available and preserving rare and decaying texts, among other things'. Boeken zijn voor het scannen geleend van verschillend einstituten en individuele personen uit de gehele wereld, hoewel Europese instituten weigerden om mee te werken, zo stelt Shamos. De bibliotheek heeft boeken gescand in 20 talen, waaronder 970.000 boeken in het Chinees, 360.000 in het Engels, 50.000 in de Indiase taal Telugu en 40.000 in het Arabisch. 'Many of the books, particularly those in Chinese and English, have been digitized — their text converted by optical character recognition methods into computer readable text. That allows these books to be searched and, eventually, reformatted for access by PDAs and other devices', zo vervolgt Shamos. 'We greatly value the participation of Bibliotheca Alexandrina. Scholars everywhere regret the destruction of the Alexandria Library at various points in history, and we’re willing to go to great lengths to see that no such destruction is ever possible in the future. Once books are on the Internet, they become immortal'. Het beschermen en preserveren van teksten is het belangrijkste doel van het project, zo zegt Pan Yunhe, de leider van het project in China. 'Paper gets old and brittle, so books soon become so delicate that no one can read them without damaging them', zegt de vice president van de Chinese Academy of Engineering. 'Artwork fades. But once we have digitized texts and illustrations, we can keep them in circulation indefinitely. And by storing them at multiple sites, we can minimize the risk that they be destroyed, as occurred in Alexandria'. 'This collection of books in multiple languages opens up unparalleled opportunities to bring Indian cultural material to everyone, and offers a huge range of possibilities in natural language research', zegt N. Balakrishnan, directeur van het Indian Institute of Science in Bangalore.