De la presse de Gutenberg au Project Gutenberg (2nde partie)

Par Actualitté
Le premier livre numérique date de juillet 1971. Il s'agit du eText #1 du Projet Gutenberg, un projet visionnaire lancé par Michael Hart pour créer des versions électroniques d'oeuvres littéraires et les diffuser dans le monde entier.
Au 16e siècle, Gutenberg avait permis à chacun d'avoir des livres imprimés pour un prix relativement modique. Au 21e siècle, le Projet Gutenberg permettrait à chacun d'avoir une bibliothèque numérique gratuite. Ce projet trouve un second souffle et un rayonnement international avec l'apparition du web en 1990 puis la création de Distributed Proofreaders en 2000, pour partager la relecture des livres entre des milliers de volontaires. En 2010, le site originel du Projet Gutenberg compte 3 millions de téléchargements par mois, sans compter les téléchargements des 38 sites miroirs répartis sur toute la planète. (retrouver la 1ere partie de ce dossier)

De 10.000 à 20.000 ebooks

En décembre 2003, les collections approchent les 11.000 livres. Plusieurs formats sont désormais présents, par exemple les formats HTML, XML et RTF, le format principal - et obligatoire - restant l’ASCII. Le tout représente 46.000 fichiers, soit une capacité totale de 110 Go (giga-octets).
En mai 2004, les 12.500 livres disponibles représentent 100.000 fichiers dans vingt formats différents, soit une capacité totale de 135 Go, destinée à doubler chaque année avec l’ajout d'environ 300 livres par mois (338 livres en 2004).
Parallèlement, le Project Gutenberg Consortia Center (PGCC), qui avait été lancé en 1997 pour rassembler des collections de livres numériques déjà existantes et provenant de sources extérieures, est officiellement affilié au Projet Gutenberg en 2003.
Par ailleurs, un projet européen est lancé à l’instigation du Projet Rastko, basé à Belgrade, en Serbie. Distributed Proofreaders Europe débute en décembre 2003, et le Projet Gutenberg Europe en janvier 2004. Les livres sont en plusieurs langues pour refléter la diversité linguistique prévalant en Europe, avec cent langues prévues sur le long terme.
En janvier 2005, le Projet Gutenberg fête ses 15.000 livres, avec la mise en ligne de The Life of Reason de George Santayana (paru en 1906).
En juin 2005, le nombre de livres s’élève à 16.000. Si 25 langues seulement étaient présentes en février 2004, 42 langues sont représentées en juin 2005, dont le sanscrit et les langues mayas. En décembre 2006, on compte 50 langues.
En décembre 2006, le Projet Gutenberg franchit la barre des 20.000 livres. Le 20.000e livre est un livre audio, Twenty Thousand Leagues Under the Sea, version anglaise de Vingt mille lieues sous les mers de Jules Verne (publié en 1869). 345 nouveaux livres par mois sont numérisés en moyenne en 2006.
S'il a fallu 32 ans, de juillet 1971 à octobre 2003, pour numériser les 10.000 premiers livres, il n’aura fallu que trois ans et deux mois, d’octobre 2003 à décembre 2006, pour numériser les 10.000 livres suivants.

De 20.000 à 30.000 ebooks

Le Projet Gutenberg Canada (PGC) voit le jour le 1er juillet 2007, le jour de la fête nationale, à l'instigation de Michael Shepard et David Jones. Il est suivi de Distributed Proofreaders Canada (DPC), avec une production qui débute en décembre 2007, avec des livres en anglais, en français et en italien.
Distributed Proofreaders (DP), lancé en octobre 2000, comptabilise 52.000 volontaires en janvier 2008, avec un nombre total de 11.950 livres traités en sept ans et trois mois. Distributed Proofreaders Europe (DP Europe), lancé en décembre 2003, comptabilise 1.500 volontaires. Distributed Proofreaders Canada (DPC), lancé en décembre 2007, comptabilise 250 volontaires.
Le Projet Gutenberg franchit la barre des 25.000 livres en avril 2008. Le 25.000e livre est English Book Collectors, de William Younger Fletcher (publié en 1902). Le Projet Gutenberg Europe atteint les 500 livres en octobre 2008.
Le Projet Gutenberg comptabilise 30.000 ebooks en octobre 2009. Le 30.000e livre est The Bird Book, par Chester A. Reed (publié en 1915).

Du passé vers l'avenir

En juillet 1971, l’envoi d’un fichier de 5 Ko à cent personnes aurait fait sauter l’embryon de réseau disponible à l’époque. En novembre 2002, le Projet Gutenberg peut mettre en ligne les 75 fichiers du Human Genome Project - à savoir le séquençage du génome humain -, chaque fichier se chiffrant en dizaines sinon en centaines de méga-octets. Ceci peu de temps après la parution initiale du Human Genome Project en février 2001, puisqu’il appartient d’emblée au domaine public.
En 2004, la capacité de stockage des disques durs est telle qu’il serait possible de faire tenir l’intégralité de la Library of Congress au format texte sur un support de stockage coûtant 140 dollars US. Et quelques années seulement nous sépareraient d’une clé USB permettant de stocker l’intégralité du patrimoine écrit de l’humanité.
La demande est énorme. En témoigne le nombre de téléchargements, qui se comptent désormais en dizaines de milliers par jour. À la date du 31 juillet 2005, on compte 37.532 fichiers téléchargés dans la journée, 243.808 fichiers téléchargés dans la semaine et 1.154.765 fichiers téléchargés dans le mois. À la date du 6 mai 2007, on compte 89.841 fichiers téléchargés dans la journée, 697.818 fichiers téléchargés dans la semaine et 2.995.436 fichiers téléchargés dans le mois. Courant mai, ce nombre atteint les 3 millions.
À la date du 15 mars 2010, on compte 103.422 fichiers téléchargés dans la journée, 751.037 fichiers téléchargés dans la semaine et 3.033.824 fichiers téléchargés dans le mois.
Ceci uniquement pour bibiblio.org, le principal site de téléchargement (basé à l’Université de Caroline du Nord, aux États-Unis), qui héberge aussi le site du Projet Gutenberg. Le deuxième site de téléchargement est l’Internet Archive, qui est le site de sauvegarde et qui met à la disposition du Projet Gutenberg une capacité de stockage illimitée. Le Projet Gutenberg dispose de 38 sites miroirs répartis dans de nombreux pays, et il en cherche d’autres. La circulation des fichiers se fait aussi en mode P2P (peer-to-peer), qui permet d’échanger des fichiers directement d’un utilisateur à l’autre.
Un Top 100 recense les cent titres et les cent auteurs les plus téléchargés dans la journée, dans la semaine et dans le mois.
Un petit pas numérique, chaque jour un peu plus
Les livres du Projet Gutenberg peuvent aider à combler la fracture numérique. Ils sont aisément téléchargeables sur PDA. Un ordinateur ou un PDA d’occasion ne coûte que quelques dollars ou quelques dizaines de dollars, en fonction du modèle. Certains PDA fonctionnent à l’énergie solaire, permettant la lecture dans des régions pauvres ou reculées.
Chose souvent passée sous silence, Michael Hart est le véritable inventeur de l’ebook. Si on considère l’ebook dans son sens étymologique, à savoir un livre numérisé pour diffusion sous forme de fichier électronique, celui-ci aurait bientôt quarante ans et serait né avec le Projet Gutenberg en juillet 1971. Une paternité beaucoup plus réconfortante que celle d'Amazon ou de Google Books, qui se sont engouffrés dans un chemin défriché par d'autres.
38 ans après les débuts du Projet Gutenberg, Michael Hart se définit toujours comme un fou de travail dédiant toute sa vie à son projet, qu’il voit comme étant à l’origine d’une révolution néo-industrielle. Il se définit aussi comme altruiste, pragmatique et visionnaire. Après avoir été traité de toqué pendant de nombreuses années, il force maintenant le respect.
Au fil des ans, la mission du Projet Gutenberg reste la même, à savoir changer le monde par le biais de l’ebook gratuit indéfiniment utilisable et reproductible, et favoriser ainsi la lecture et la culture pour tous à moindres frais, sur tous les supports électroniques possibles.

Copyright © 2010 Marie Lebert. Tous droits réservés. Avec diffusion en ligne par ActuaLitté.