Magazine High tech

Google vous utilise à votre insu pour numériser des livres

Publié le 19 octobre 2011 par Brokenbird @JournalDuGeek

Google Books (lancé en 2004) et ses quinze millions de livres numérisés représentent de loin la plus grande bibliothèque numérique du monde. Une prouesse que la firme Californienne n’aurait en réalité pas accompli seule.

En effet, tout commence en 2009 lorsque Google se décide à acheter reCaptcha, une start-up spécialisée dans (vous l’aurez deviné): les captchas, ces petites images à déchiffrer et qui servent à distinguer les robots des humains.

Un captcha est toujours composé de deux mots dont le premier est un mot « test » utilisé pour vérifier si vous êtes un humain ou une machine. Tandis que le second est en réalité un mot contenu dans un livre numérisé que Google n’est pas parvenu à déchiffrer. Soumis à de nombreux utilisateurs, ce mot est enregistré par l’algorithme Google au bout de plusieurs réponses identiques de façon à ce que, par la suite, le système puisse plus facilement le reconnaître. Et c’est ainsi que nous, petits internautes, nous contribuons involontairement à parfaire la numérisation des livres de Google Books.

Selon le magazine américain Science, si tous les captchas utilisées sur la toile étaient mis à profit, nous pourrions retranscrire environ 160 livres par jour.

recaptcha capture ecran 0 Google vous utilise à votre insu pour numériser des livres

Source


Retour à La Une de Logo Paperblog

A propos de l’auteur


Brokenbird 953528 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte

Magazine