Géraldine Delacroix
Journaliste.
Journaliste à Mediapart

63 Billets

43 Éditions

Billet de blog 18 nov. 2020

Géraldine Delacroix
Journaliste.
Journaliste à Mediapart

Plaidoyer pour des captchas éthiques

Enquête collaborative sur l’envers des captchas, ces tests censés départager les humains des robots.

Géraldine Delacroix
Journaliste.
Journaliste à Mediapart

Et si la logistique s’employait plutôt à relier les solidarités ? Et si les captchas étaient éthiques ? Et si le travail invisible était montré ? Et si l’avenir s’écrivait par ses luttes ? Et si l’air était à refaire ?

Autant de thèmes, autant de pistes, propositions, jeux, expériences, nées des savoirs et de l’imagination des personnes (journalistes, artistes, chercheurs/euses, activistes et hacktivistes) rassemblées du 12 au 14 novembre derniers par la Berliner Gazette dans le cadre de la Winter School 2020. Prévus dans l’ancienne Maison des statistiques, non loin de la vibrante AlexanderPlatz, au centre de la capitale allemande, les ateliers se sont finalement tenus à distance, le télétravail devenant non seulement outil mais aussi objet des réflexions échangées.

Intitulées Silent Works, ces rencontres 2020 ont été consacrées au « travail caché dans le capitalisme fondé sur l’intelligence artificielle », dans la droite ligne des travaux d’Antonio Casilli sur ces invisibles « travailleurs du clic ». Pandémie oblige, l’organisation a été remodelée et l’ensemble débats-ateliers-exposition transformé en « école d’hiver ». Pour que l’usine (ou l’open space) devienne une école, pour que le travail devienne un apprentissage. Tous les travaux réalisés pendant les ateliers rejoindront les nombreuses ressources déjà disponibles sur le site du projet (lire aussi sur Mediapart le blog en anglais de Krystian Woznicki).

L’atelier auquel j’ai participé depuis Paris – sans passer par la « Haus der Statistik » – était consacré aux captchas, ces images que tout le monde connaît et qui parsèment nos navigations dans l’Internet. C-A-P-T-C-H-A, ou Completely Automated Public Turing test to tell Computers and Humans Apart, autrement dit : comment différencier de manière automatisée un humain d’un robot ? 

Très vite après nos premières discussions, notre groupe, baptisé Captcha Factory, a fait le constat que, loin de départager les hommes des robots, les captchas bien au contraire les réunissaient dans une forme unique… et pas celle de l’humain. 

Captcha créé dans notre atelier. © Silent Works, Berliner Gazette.

Le captcha, tel que nous le pratiquons vous et moi, c’est une petite corvée, une friction dans notre navigation. Au pire pourrions-nous nous plaindre d’un micro-travail effectué gratuitement – le plus souvent pour Google, leader du marché. Le marché consiste à vendre à une organisation cette petite barrière qui doit protéger l’accès à son site contre les robots. Son autre face est de vendre à d’autres entreprises la description de leurs images, afin d’alimenter des bases de données.

Mais pour des milliers (millions ?) de personnes à travers le monde, principalement en Amérique Latine et en Asie du sud, le captcha est un moyen de subsistance.  Car il existe un autre marché, celui de la résolution des captchas. Un des fleurons en est la société anti-captcha. Voici ce qu’on peut voir sur sa page d’accueil :

Capture d’écran de la page d’accueil de la plateforme anti-captcha.com. © anti-captcha.com

Julian Posada est doctorant à l’université de Toronto (Canada) et consacre ses recherches aux travailleurs des plateformes. Je l’ai interrogé par téléphone. Pour ses travaux, il a établi une liste de 95 plateformes de micro-travail et observé le trafic généré par chacune d’elles. C’est ainsi qu’il a pu constater l’importance des plateformes de captchas. 

La plupart d’entre elles sont établies en Russie, m’a-t-il expliqué, même celles qui ont des adresses dans d’autres pays comme Chypre ou ailleurs en Europe. Le trafic, lui, vient principalement d’Amérique latine, en particulier du Venezuela, puis ensuite du sud de l’Asie (Inde, Bangladesh, Thaïlande, Philippines, Indonésie). Enfin une part du trafic vient d’Ukraine et de Russie.

Parmi toutes les tâches que l’on trouve sur le web, la résolution de captchas est l’une des moins payées, avec mille tâches à effectuer pour obtenir 0,5 à 3 dollars, selon la difficulté. Il faut quelques secondes, 10 en moyenne, pour résoudre un Captcha typique. Les personnes les plus rapides sont capables d’en résoudre 20 à 25 par minute. Mais encore faut-il qu’il y ait de la matière : on doit parfois attendre 20 à 30 secondes pour l'apparition d'un nouveau captcha, et c’est autant de temps de perdu. 

A mesure que le marché des services de résolution de captcha s’est développé, les rémunérations ont diminué. Un article de l’Université de Californie (San Diego) a examiné les petites annonces sur le site getafreelancer.com et constaté qu'en 2007, on pouvait gagner jusqu'à 10 dollars pour un millier de captchas résolus.

« C’est une régression par rapport à la plateforme Mechanical Turk d’Amazon qui arrivait à nourrir des gens des Etats-Unis », constate le chercheur. Pour s’y retrouver dans ces tonnes d’emplois (entre guillemets), on trouve des guides des meilleures plateformes (un exemple), celles où l’on gagne de l'argent le plus rapidement. Les Venezueliens sont attirés par le paiement en dollars US.  

Nous avons testé une de ces plateformes : 

Une question restée sans réponse à l’issue de nos travaux est la suivante : qui achète ce travail ? Qui a recours à des entreprises pour franchir des barrières de captchas? « Je n’ai pas la réponse », nous a répondu Julian Posada. « Le trafic est très important, d’où vient tout l’argent pour payer tous ces travailleurs ? », s'interroge-t-il.

S’il peut s’agir, comme nous l’ont confié des spécialistes, de développeurs voulant tester des applications, il peut aussi s’agir de piratage, voire de blanchiment d’argent sur un marché qu’un de nos interlocuteurs qualifie de “semi-légal”. Les fermes à clic, ces entreprises qui fournissent des likes ou des vues sur Youtube, Facebook et autres, seraient aussi les clientes des “captchas factories”. 

A l’origine des captchas

Lorsque le captcha a été inventé, au début des années 2000, il visait, et c'est toujours le cas aujourd'hui, à faire en sorte qu’hommes et femmes utilisent les infrastructures et les services web essentiels. Ce faisant, il s’appuie sur la reconnaissance des formes, qui au contraire de l’intelligence artificielle et de l’apprentissage machine, n’est pas du tout nouvelle pour les humains.

Le captcha, en effet, ne se contente pas de sécuriser les services web : il apprend aux machines à percevoir, à sentir et à savoir comme nous le faisons, en extrayant des modèles de notre captcha-bilité. La reconnaissance des formes, que les humains appliquent dans leur vie quotidienne sans effort, est mise en service pour former les machines. Ainsi nous nous sommes largement habitués à cliquer sur des feux de circulation et des passage piétons, pour apprendre à les reconnaître aux voitures autonomes.  

Comment faire en sorte que les captchas n’alimentent pas les algorithmes en biais de toutes sortes ? « Prendre l’histoire au sérieux », écrit notre équipe, « signifie reconnaître que le racisme, le sexisme, le validisme, le classisme et toutes les formes de discrimination sont basés sur des modèles qui simplifient trop nos relations complexes ». Notre atelier a donc tenté de définir ce que serait un captcha éthique. 

Voulons-nous améliorer la reconnaissance des soldats? © Silent Work / Berliner Gazette

Comment imaginer un captcha qui contribue à un monde meilleur ? La première affirmation de notre « manifeste » consacre la nécessaire transparence : « Nous pouvons choisir librement les captcha à résoudre et l'utilisation de notre travail est basée sur un consentement éclairé. Le résultat est pour la communauté, pas pour l’entreprise, et est donc toujours open source ». Deuxième principe : le captcha respecte notre intégrité et ne reproduit pas le validisme : tout le monde doit pouvoir résoudre des captchas. Enfin, il sera bénévole, amusant, sans biais et sans oppression. 

* Un grand merci à toute l’équipe, Jose Miguel Calatayud et Sotiris Sideris qui l’ont animé, Monisha Caroline Martins qui a travaillé avec moi sur le business des captchas, et Julia Molin, Rebecca Puchta, Lira Ramadani, André Rebentisch, Sotiris Sideris, Cagri Taskin.

* Retrouver ici en anglais la page créée à l’issue de l’atelier.

* L’intégralité du projet Silent Works

* Sur la Maison des statistiques et sa transformation, regarder ce reportage d’Arte réalisé en novembre 2019 et le très beau travail photographique d’Andi Weiland au cours de cette Winter School 2020. 

Bienvenue dans le Club de Mediapart

Tout·e abonné·e à Mediapart dispose d’un blog et peut exercer sa liberté d’expression dans le respect de notre charte de participation.

Les textes ne sont ni validés, ni modérés en amont de leur publication.

Voir notre charte

À la Une de Mediapart

Journal
Comment le gouvernement veut rattraper le retard français
Dans un contexte de risque élevé de tension sur le réseau électrique cet hiver, l’Assemblée nationale examine, à partir du lundi 5 décembre, le projet de loi visant à accélérer le déploiement de l’éolien et du solaire en France.
par Mickaël Correia
Journal — Santé
Dans les Cévennes, les femmes promises à la misère obstétricale
Le 20 décembre, la maternité de Ganges suspendra son activité jusqu’à nouvel ordre, faute de médecins en nombre suffisant. Une centaine de femmes enceintes, dont certaines résident à plus de deux heures de la prochaine maternité, se retrouvent sur le carreau.
par Prisca Borrel
Journal
Affaire Sarkozy-Bismuth : les enjeux d’un second procès à hauts risques
Nicolas Sarkozy, l’avocat Thierry Herzog et l’ex-magistrat Gilbert Azibert seront rejugés à partir de lundi devant la cour d’appel de Paris dans l’affaire de corruption dite « Paul Bismuth », et risquent la prison.
par Michel Deléan
Journal — Corruption
Pourquoi les politiques échappent (presque toujours) à l’incarcération
Plusieurs facteurs expliquent la relative mansuétude dont bénéficient les politiques aux prises avec la justice, qui ne sont que très rarement incarcérés, malgré les fortes peines de prison encourues dans les affaires de corruption.
par Michel Deléan

La sélection du Club

Billet de blog
L'électricité est-elle un bien commun ?
[Rediffusion] L'électricité est-elle un bien commun, comme Yannick Jadot l'a fait récemment ? La formule produit un effet électoraliste garanti. Mais cette opération rhétorique est sans intérêt s’il s’agit, à partir de la fonction sociale actuelle de l’électricité, de faire apparaître dans le système énergétique des options qui méritent un positionnement politique.
par oskar
Billet de blog
Nationalisation d’EDF : un atout pour la France ?
Le jeudi 24 novembre, c’est dans un contexte bien particulier que le nouveau PDG d’EDF Luc Rémont prend ses fonctions. De lourds dossiers sont sur la table : renationalisation du groupe, relance du parc nucléaire et des renouvelables, négociation avec Bruxelles sur les règles du marché de l’électricité et gestion de la production avant les trois mois d’hiver.
par Bernard Drouère
Billet de blog
Les coupures d'électricité non ciblées, ce sont les inégalités aggravées
Le gouvernement prévoit de possibles coupures d'électricité cet hiver : j'ai vraiment hâte de voir comment seront justifiées l'annulation de trains et la fermeture d'écoles pendant que les remontées mécaniques de Megève ou Courchevel continueront à fonctionner. Non ciblées sur les activités « non essentielles », ces coupures d'électricité pourraient aggraver les inégalités.
par Maxime Combes
Billet de blog
À Brioude, itinéraire d'une entreprise (presque) autonome en énergie
CN Industrie vit en grande partie grâce à l'électricité produit par ses panneaux solaires. Son modèle énergétique est un bon éclairage de ce que pourrait être un avenir largement éclairé par les énergies renouvelables. Rencontre avec son patron précurseur, Clément Neyrial.
par Frédéric Denhez