🍾 Bonne année 2019 ! 🥂


16 janvier : Glass 📽
17 janvier : Star Trek : Discovery - 2x01 📺
18 janvier → : Marvel’s The Punisher - Saison 2 (Netflix) 📺

Petite histoire des « Captcha », ces tests d’identification en pleine mutation


  • Admin

    Ou comment Google nous fait travailler gratuitement 500 000 heures par jour.

    0_1546092255291_Signature-1.gif


    Google a échappé à un recours collectif qui l’accusait de « tirer profit » des internautes au travers des « Captcha », les tests d’identification prouvant qu’ils sont bien humains.

    Les « Captcha », ces petits tests d’identification prouvant qu’un internaute est bien humain et non un robot, ont bien failli coûter une « class action » à Google. Le 3 février, la justice américaine a rejeté la plainte d’une femme qui souhaitait attaquer Google dans un recours collectif, accusant l’entreprise de « tirer profit » de « la main d’œuvre gratuite » que représentent les internautes.

    En effet, en remplissant les Captcha utilisés par Google, les internautes ne se contentent pas de prouver leur humanité : ils participent, souvent sans le savoir, à des projets plus larges. Dans le cas de cette plainte, était visé reCAPTCHA, ce test contribuait à numériser des livres pour l’immense bibliothèque numérique de Google.

    text alternatif

    Le premier mot de ce Captcha sert à vérifier que l’internaute est bien humain ; le second, à numériser un livre. ReCaptcha

    Ce Captcha ressemble à première vue à tous les autres : des mots déformés, illisibles pour une machine, mais pas par un humain. Si l’internaute est capable de les déchiffrer, c’est donc qu’il ne s’agit pas d’un robot risquant de « spammer » (envoyer des messages indésirables) le site sur lequel le captcha est affiché.

    Mais dans le cas de reCAPTCHA, seul le premier mot sert en réalité cet objectif. Le deuxième est en fait issu d’un des millions de livres ou journaux numérisés par Google. Les logiciels de reconnaissance de caractères ayant leurs limites, certains termes n’ont pas pu être déchiffrés automatiquement. Google se sert donc des internautes pour le faire « à la main » ; ce dont il ne s’est jamais caché. « La plaignante n’a pas donné d’éléments permettant de suggérer de façon plausible que les quelques secondes nécessaires pour taper un second mot mériteraient, pour des consommateurs raisonnables, de recevoir une compensation », a estimé la justice américaine.

    « Rentabiliser » le temps des utilisateurs

    Une péripétie de plus dans la courte histoire des Captcha, marquée par l’inventivité de leurs développeurs pour les faire évoluer, afin de contrer les progrès des nouveaux programmes cherchant à les tromper.

    Le terme « captcha » est né au début des années 2000, dans les locaux de l’université Carnegie-Mellon à Pittsburgh, en Pennsylvanie. Sa signification : Completely Automated Public Turing test to tell Computers and Humans Apart, soit « test de Turing complètement automatique et public pour distinguer les ordinateurs des humains ». Ce nom fait référence au célèbre test censé déterminer si un logiciel est assez intelligent pour se faire passer pour un humain. Le Captcha fait l’inverse : vérifier que l’internaute est bien humain en le forçant à se montrer plus intelligent que la machine, incapable de déchiffrer certaines images.

    Si au départ, la plupart des Captcha se contentaient d’afficher l’image d’un mot déformé, l’équipe de l’université Carnegie-Mellon décide d’aller plus loin. En 2006, le groupe de recherche travaillant sur le sujet estime que 200 millions de Captcha sont déchiffrés chaque jour. Si l’on considère que cela prend dix secondes par personne, cinq cent mille heures sont ainsi, chaque jour, consacrées à cette tâche. « On s’est donc demandé “pouvons-nous faire quelque chose de ce temps ?” », explique Luis von Ahn, à la tête de cette équipe, au New York Times. C’est ainsi que naît en 2007 l’idée de numériser des livres en utilisant reCAPTCHA, société rachetée par Google en 2009.

    Ce principe sera adapté plus tard, en 2012, à Google Street View : l’internaute se voit proposer de déchiffrer les textes photographiés dans la rue, comme les panneaux routiers ou les numéros de maison. Une tâche là aussi complexe pour une machine, mais facile pour un humain. Objectif, là encore, profiter de la masse des internautes et de leur temps pour enrichir l’outil de Google.

    text alternatif

    Avec ce Captcha, l’internaute déchiffre une image issue de Google Street View, illisible par un programme informatique. ReCaptcha

    Critiques et parodies

    […]

    Source et suite : https://www.lemonde.fr/pixels/article/2016/02/10/petite-histoire-des-captchas-ces-tests-d-identification-en-pleine-mutation_4862727_4408996.html



  • Tiens donc, j’ai toujours cru que CAPTCHA signifiait CAPTURE en phonétique.



  • text alternatif
    :badtsumtss:



  • @ratonhnhakéton Très instructif merci!

    Il y a aussi une valeur gratificative quand on réussi : “Bravo vous n’êtes pas un robot”

    VICTOIRE :love: