Google s’offre reCaptcha
La technologie antispam de la société servira également au projet de numérisation des livres de Google.
Habitués du Web, vous n'avez pu échapper aux Captcha ces mots bizarroïdes que les sites Internet vous demandent de taper à chaque inscription. Google vient de mettre la main sur la société à l'initiative de ce brevet pour un montant non communiqué.
Les Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart) ont pour objectif d'empêcher les robots d'envoyer automatiquement des e-mails aux adresses des services qu'ils auront repéré sur la Toile. Luis von Ahn, spécialiste en cryptographie et co-inventeur de Captcha, a eu l'idée d'étendre cette technologie à la numérisation de livres. reCaptchas était née.
« Les mots dans la plupart des Captcha fournis par reCaptcha proviennent de scans d'archives de journaux ou de livres anciens. Les ordinateurs ont du mal à reconnaître ces mots parce que l'encre et le papier ont été dégradés par le temps Mais en les tapant comme des Captcha, on apprend aux ordinateurs à scanner le texte », expliquent conjointement sur le blog du moteur de recherche Luis von Ahn et Will Cathcart, chef produit chez Google.
Ainsi, Google n'envisage pas uniquement de se servir des Captchas dans la protection antispam, mais aussi pour des projets de plus grande envergure comme Google Books, sa bibliothèque numérique. Depuis plusieurs années déjà, le moteur de recherche, au grand dam des éditeurs, a entrepris unilatéralement de numériser des livres et de les mettre à disposition des internautes.
Récemment, l'américain a entrepris un lobbying féroce auprès de la Commission européenne. Selon le ministère de la Culture français, Google Books ne respecterait pas les droits d'auteurs.
Malins!
de
GuillaumeN
, posté le 18 septembre 2009 à 02h48
Ou comment s'offrir de la main d'œuvre très bon marché.
Ils sont vraiment malins chez Google, y'a pas à dire!
Peut-être est-ce là le salut de notre civilisation? Mettre un peu de notre force au service de tous.
Combien de temps nous prends le remplissage d'un captcha? 30 secondes maximum si on se tord la tête dans tous les sens pour comprendre une lettre.
Alors bien sûr, Google est une société privée, ils ont sans doute des arrières pensées. Mais c'est tout de même une belle initiative.
Je m'en vais faire du lobying auprès des webmasters pour ne plus inclure que du re-captcha dans leurs sites.
Ils sont vraiment malins chez Google, y'a pas à dire!
Peut-être est-ce là le salut de notre civilisation? Mettre un peu de notre force au service de tous.
Combien de temps nous prends le remplissage d'un captcha? 30 secondes maximum si on se tord la tête dans tous les sens pour comprendre une lettre.
Alors bien sûr, Google est une société privée, ils ont sans doute des arrières pensées. Mais c'est tout de même une belle initiative.
Je m'en vais faire du lobying auprès des webmasters pour ne plus inclure que du re-captcha dans leurs sites.
IDEM
de
Mauchrist
, posté le 18 septembre 2009 à 09h13
Vous n'aimez pas M$ ?
Ce sera pire avec Google car eux "sont partout" !!
Ce sera pire avec Google car eux "sont partout" !!
malins ?
de
tux20090918
, posté le 18 septembre 2009 à 12h28
Et comment on peut controler un captcha si on ne connais pas la signification de l'image ?
Je trouve ça tordu comme raisonnement...
Par contre les algorithmes qui servent à modifier l'image, ça c'est surement précieux. Mais ce n'est surement pas la seule formule mathématique utilisable, même si c'est peut être la plus efficace.
Je trouve ça tordu comme raisonnement...
Par contre les algorithmes qui servent à modifier l'image, ça c'est surement précieux. Mais ce n'est surement pas la seule formule mathématique utilisable, même si c'est peut être la plus efficace.
Bien sûr!
de
GuillaumeN
, posté le 20 septembre 2009 à 02h31
Et pourtant oui, on pioche dans la base de données des livres, des lettres incompréhensibles pour le programme d'OCR, et on la fait écrire par les internautes au sein d'un captcha.
Cette lettre pourra être zappée de la vérification du captcha. Le programme ne connaissant pas sa signification, il ne va pas en tenir compte.
Au fil du temps, il suffit de prendre la correspondance lettre-image pour laquelle on trouve le plus d'occurrence, et le tour est joué.
Cette lettre pourra être zappée de la vérification du captcha. Le programme ne connaissant pas sa signification, il ne va pas en tenir compte.
Au fil du temps, il suffit de prendre la correspondance lettre-image pour laquelle on trouve le plus d'occurrence, et le tour est joué.
solution
de
theppeht
, posté le 29 septembre 2009 à 17h11
Et c'est pour ça aussi qu'on propose deux mots, un pour contrôler et un pour enrichir la base de connaissance.
à lire aussi
SUR LES MÊMES THÈMES 


nos newsletters











agrandir la photo





alerter le modérateur