Plaidoyer pour des captchas éthiques

Enquête collaborative sur l’envers des captchas, ces tests censés départager les humains des robots.

ge-raldine-captcha
Et si la logistique s’employait plutôt à relier les solidarités ? Et si les captchas étaient éthiques ? Et si le travail invisible était montré ? Et si l’avenir s’écrivait par ses luttes ? Et si l’air était à refaire ?

Autant de thèmes, autant de pistes, propositions, jeux, expériences, nées des savoirs et de l’imagination des personnes (journalistes, artistes, chercheurs/euses, activistes et hacktivistes) rassemblées du 12 au 14 novembre derniers par la Berliner Gazette dans le cadre de la Winter School 2020. Prévus dans l’ancienne Maison des statistiques, non loin de la vibrante AlexanderPlatz, au centre de la capitale allemande, les ateliers se sont finalement tenus à distance, le télétravail devenant non seulement outil mais aussi objet des réflexions échangées.

Intitulées Silent Works, ces rencontres 2020 ont été consacrées au « travail caché dans le capitalisme fondé sur l’intelligence artificielle », dans la droite ligne des travaux d’Antonio Casilli sur ces invisibles « travailleurs du clic ». Pandémie oblige, l’organisation a été remodelée et l’ensemble débats-ateliers-exposition transformé en « école d’hiver ». Pour que l’usine (ou l’open space) devienne une école, pour que le travail devienne un apprentissage. Tous les travaux réalisés pendant les ateliers rejoindront les nombreuses ressources déjà disponibles sur le site du projet (lire aussi sur Mediapart le blog en anglais de Krystian Woznicki).

L’atelier auquel j’ai participé depuis Paris – sans passer par la « Haus der Statistik » – était consacré aux captchas, ces images que tout le monde connaît et qui parsèment nos navigations dans l’Internet. C-A-P-T-C-H-A, ou Completely Automated Public Turing test to tell Computers and Humans Apart, autrement dit : comment différencier de manière automatisée un humain d’un robot ? 

Très vite après nos premières discussions, notre groupe, baptisé Captcha Factory, a fait le constat que, loin de départager les hommes des robots, les captchas bien au contraire les réunissaient dans une forme unique… et pas celle de l’humain. 

Captcha créé dans notre atelier. © Silent Works, Berliner Gazette. Captcha créé dans notre atelier. © Silent Works, Berliner Gazette.

Le captcha, tel que nous le pratiquons vous et moi, c’est une petite corvée, une friction dans notre navigation. Au pire pourrions-nous nous plaindre d’un micro-travail effectué gratuitement – le plus souvent pour Google, leader du marché. Le marché consiste à vendre à une organisation cette petite barrière qui doit protéger l’accès à son site contre les robots. Son autre face est de vendre à d’autres entreprises la description de leurs images, afin d’alimenter des bases de données.

Mais pour des milliers (millions ?) de personnes à travers le monde, principalement en Amérique Latine et en Asie du sud, le captcha est un moyen de subsistance.  Car il existe un autre marché, celui de la résolution des captchas. Un des fleurons en est la société anti-captcha. Voici ce qu’on peut voir sur sa page d’accueil :

Capture d’écran de la page d’accueil de la plateforme anti-captcha.com. © anti-captcha.com Capture d’écran de la page d’accueil de la plateforme anti-captcha.com. © anti-captcha.com

Julian Posada est doctorant à l’université de Toronto (Canada) et consacre ses recherches aux travailleurs des plateformes. Je l’ai interrogé par téléphone. Pour ses travaux, il a établi une liste de 95 plateformes de micro-travail et observé le trafic généré par chacune d’elles. C’est ainsi qu’il a pu constater l’importance des plateformes de captchas. 

La plupart d’entre elles sont établies en Russie, m’a-t-il expliqué, même celles qui ont des adresses dans d’autres pays comme Chypre ou ailleurs en Europe. Le trafic, lui, vient principalement d’Amérique latine, en particulier du Venezuela, puis ensuite du sud de l’Asie (Inde, Bangladesh, Thaïlande, Philippines, Indonésie). Enfin une part du trafic vient d’Ukraine et de Russie.

Parmi toutes les tâches que l’on trouve sur le web, la résolution de captchas est l’une des moins payées, avec mille tâches à effectuer pour obtenir 0,5 à 3 dollars, selon la difficulté. Il faut quelques secondes, 10 en moyenne, pour résoudre un Captcha typique. Les personnes les plus rapides sont capables d’en résoudre 20 à 25 par minute. Mais encore faut-il qu’il y ait de la matière : on doit parfois attendre 20 à 30 secondes pour l'apparition d'un nouveau captcha, et c’est autant de temps de perdu. 

A mesure que le marché des services de résolution de captcha s’est développé, les rémunérations ont diminué. Un article de l’Université de Californie (San Diego) a examiné les petites annonces sur le site getafreelancer.com et constaté qu'en 2007, on pouvait gagner jusqu'à 10 dollars pour un millier de captchas résolus.

« C’est une régression par rapport à la plateforme Mechanical Turk d’Amazon qui arrivait à nourrir des gens des Etats-Unis », constate le chercheur. Pour s’y retrouver dans ces tonnes d’emplois (entre guillemets), on trouve des guides des meilleures plateformes (un exemple), celles où l’on gagne de l'argent le plus rapidement. Les Venezueliens sont attirés par le paiement en dollars US.  

Nous avons testé une de ces plateformes : 

 

Une question restée sans réponse à l’issue de nos travaux est la suivante : qui achète ce travail ? Qui a recours à des entreprises pour franchir des barrières de captchas? « Je n’ai pas la réponse », nous a répondu Julian Posada. « Le trafic est très important, d’où vient tout l’argent pour payer tous ces travailleurs ? », s'interroge-t-il.

S’il peut s’agir, comme nous l’ont confié des spécialistes, de développeurs voulant tester des applications, il peut aussi s’agir de piratage, voire de blanchiment d’argent sur un marché qu’un de nos interlocuteurs qualifie de “semi-légal”. Les fermes à clic, ces entreprises qui fournissent des likes ou des vues sur Youtube, Facebook et autres, seraient aussi les clientes des “captchas factories”. 

A l’origine des captchas

Lorsque le captcha a été inventé, au début des années 2000, il visait, et c'est toujours le cas aujourd'hui, à faire en sorte qu’hommes et femmes utilisent les infrastructures et les services web essentiels. Ce faisant, il s’appuie sur la reconnaissance des formes, qui au contraire de l’intelligence artificielle et de l’apprentissage machine, n’est pas du tout nouvelle pour les humains.

Le captcha, en effet, ne se contente pas de sécuriser les services web : il apprend aux machines à percevoir, à sentir et à savoir comme nous le faisons, en extrayant des modèles de notre captcha-bilité. La reconnaissance des formes, que les humains appliquent dans leur vie quotidienne sans effort, est mise en service pour former les machines. Ainsi nous nous sommes largement habitués à cliquer sur des feux de circulation et des passage piétons, pour apprendre à les reconnaître aux voitures autonomes.  

Comment faire en sorte que les captchas n’alimentent pas les algorithmes en biais de toutes sortes ? « Prendre l’histoire au sérieux », écrit notre équipe, « signifie reconnaître que le racisme, le sexisme, le validisme, le classisme et toutes les formes de discrimination sont basés sur des modèles qui simplifient trop nos relations complexes ». Notre atelier a donc tenté de définir ce que serait un captcha éthique. 

Voulons-nous améliorer la reconnaissance des soldats? © Silent Work / Berliner Gazette Voulons-nous améliorer la reconnaissance des soldats? © Silent Work / Berliner Gazette
 

Comment imaginer un captcha qui contribue à un monde meilleur ? La première affirmation de notre « manifeste » consacre la nécessaire transparence : « Nous pouvons choisir librement les captcha à résoudre et l'utilisation de notre travail est basée sur un consentement éclairé. Le résultat est pour la communauté, pas pour l’entreprise, et est donc toujours open source ». Deuxième principe : le captcha respecte notre intégrité et ne reproduit pas le validisme : tout le monde doit pouvoir résoudre des captchas. Enfin, il sera bénévole, amusant, sans biais et sans oppression. 

* Un grand merci à toute l’équipe, Jose Miguel Calatayud et Sotiris Sideris qui l’ont animé, Monisha Caroline Martins qui a travaillé avec moi sur le business des captchas, et Julia Molin, Rebecca Puchta, Lira Ramadani, André Rebentisch, Sotiris Sideris, Cagri Taskin.

* Retrouver ici en anglais la page créée à l’issue de l’atelier.

* L’intégralité du projet Silent Works

* Sur la Maison des statistiques et sa transformation, regarder ce reportage d’Arte réalisé en novembre 2019 et le très beau travail photographique d’Andi Weiland au cours de cette Winter School 2020. 

Le Club est l'espace de libre expression des abonnés de Mediapart. Ses contenus n'engagent pas la rédaction.