De Belezen Kater: Project Gutenberg

zondag 30 mei 2010

Project Gutenberg

http://www.gutenberg.org/

De oudst gekende digitale bibliotheek is het [Project Gutenberg] dat [Michael Hart] in 1971 lanceerde. Project Gutenberg draait op het voluntarisme van een schare internetgebruikers die boeken en documenten digitaliseren met volgend procédé.

Een origineel boek wordt ingescand om een digitale facsimile te bekomen van het werk. Deze digitale facsimile wordt vervolgens met tekstherkenningsoftware (OCR) omgezet tot een tekstbestand. Proeflezers kijken vervolgens het tekstbestand na en vergelijken het met de digitale facsimile en corrigeren de mogelijke tekstfouten. Het tekstbestand wordt gearchiveerd als een zip-bestand en beide versies kunnen gedownload worden van de website. In een tweede stap wordt het tekstbestand in HTML opgemaakt waarbij afbeeldingen op hun plaats in de tekst gezet worden en paginamarkeringen toegevoegd. Ook de HTML versie wordt dan als download aangeboden. Uit deze handelswijze blijkt vooral een zorg om de bestandsomvang van de digitale boeken zo beperkt mogelijk te houden om het downloaden voor offline gebruik zoveel mogelijk te faciliteren. Zelf herinner ik me dat de eerste gedigitaliseerde boeken die ik zo in handen kreeg Dracula van Bram Stoker en de Ilias van Homeros waren, beide in de engelse taal.

Er is op Project Gutenberg thans ook een [belangrijke deelcatalogus met nederlandstalige werken] aanwezig. Project Gutenberg richt zich tot werken die vrij zijn van auteursrechten. Dit wil zeggen dat men er boeken zal aantreffen van schrijvers die reeds meer dan zeventig jaar overleden zijn, dan wel officiele verdragen, oorkondes en redevoeringen voor of door gestelde lichamen die uit hun aard vrij zijn van auteursrechten.

De Belezen Kater

zondag 30 mei 2010

Project Gutenberg

Geen opmerkingen:

Een reactie posten