spectrumnews.org Traduction de "Scammers threaten quality of research survey data"
Shaena Montanari - 24 08.2023

Agrandissement : Illustration 1

Par une soirée pluvieuse d'octobre 2022, Simone Dufresne, étudiante diplômée à l'université Tufts de Medford, dans le Massachusetts, examinait avec consternation les données de son enquête sur les adultes autistes. Il y avait des signes révélateurs de fraude, notamment dans les réponses aux questions ouvertes.
"Certaines d'entre elles étaient formulées de manière étrange", dit-elle, et certains mots étaient orthographiés en anglais britannique alors qu'il s'agissait d'une étude basée aux États-Unis. Mais comme elle ne voulait pas faire de suppositions sur les participants, elle s'est tournée vers Scamalytics, un site web qui scanne les adresses IP et estime si leur trafic web est légitime.
Les résultats ? "Fraude, fraude, fraude", affirme Mme Dufresne. Sur les 17 réponses que Mme Dufresne avait reçues pour son enquête, 13 étaient fausses. C'était déjà assez grave que ces personnes fassent semblant d'être autistes, mais en plus, elle avait proposé une compensation pour les personnes ayant répondu à l'enquête, et ces personnes avaient déjà été payées. La petite bourse qu'elle avait obtenue pour cette recherche était maintenant plus qu'à moitié épuisée.
Mme Dufresne a envoyé un courriel à sa conseillère, la professeure de psychologie Eileen Crehan, et lui a fait part de sa découverte.
Crehan, pour sa part, "a eu un creux dans l'estomac" en lisant le message de Dufresne, se souvient-elle. C'était un revers pour le projet dans son ensemble, mais surtout une mauvaise nouvelle pour Dufresne - la jeune chercheuse avait prévu d'utiliser l'étude pour se qualifier en tant que candidate au doctorat à Tufts.
Ce n'était pas la première fois que Crehan et son équipe étaient confrontés à des fraudes dans le domaine de la recherche en ligne - elles existent depuis longtemps dans le monde universitaire - mais elles se sont intensifiées ces dernières années et sont aggravées par les escrocs qui infiltrent désormais les entretiens Zoom. Cette combinaison amène certains chercheurs à s'interroger sur l'avenir du travail d'enquête.
Dans un article de 2015 intitulé "Detecting, preventing, and responding to 'fraudsters' in internet research : Ethics and tradeoffs", une équipe de chercheurs en santé a écrit qu'elle avait été alertée en 2011 du problème croissant des participants à des enquêtes frauduleuses. En 2019, les chercheurs dans le domaine de l'autisme ont été confrontés à des escroqueries dans les réponses, et cette tendance semble s'être accentuée avec l'augmentation de la criminalité sur internet pendant la pandémie de COVID-19 : Le Federal Bureau of Investigation des États-Unis, par exemple, signale que les plaintes pour cybermenaces sont passées de 467 000 en 2019 à plus de 800 000 en 2022.
Robert Klitzman, professeur de psychiatrie à l'université de Columbia et principal auteur de l'article de 2015, affirme que l'on ne connaît pas l'ampleur du phénomène des "fraudeurs" dans la recherche et que davantage de données sont nécessaires pour évaluer l'étendue du problème. En effet, il est difficile d'obtenir des données spécifiques. Le FBI ne distingue pas la fraude aux enquêtes de la criminalité sur l'internet, et bien que le ministère américain de la justice inculpe des personnes dans le monde entier pour des fraudes sur l'internet ou par courrier électronique qui escroquent de grosses sommes aux Américains, il n'a jamais poursuivi de fraude aux enquêtes et n'a pas voulu s'exprimer sur cette escroquerie en particulier.
J'ai parlé à d'autres chercheurs qui se sont dit : "Ça nous tue". Eileen Crehan
Des anecdotes émanant de chercheurs spécialisés dans l'autisme et le handicap suggèrent toutefois que l'escroquerie aux enquêtes est en augmentation. Kathleen Bogart, professeur de psychologie à l'université d'État de l'Oregon à Corvallis, étudie le handicap. Pendant plus de 15 ans, elle a pu faire confiance aux méthodes de recrutement basées sur l'internet. Les personnes handicapées, en particulier celles atteintes de maladies rares, peuvent être difficiles à trouver, et l'internet a été un "outil crucial".
Mais en 2021, elle a publié un questionnaire à choix multiples et à questions ouvertes sur le syndrome de Moebius, une maladie rare qui affecte les muscles du visage. Mme Bogart est bien connue de cette communauté car elle est également atteinte de cette maladie et elle sait qu'il y a "probablement moins de 1 000 personnes en Amérique" qui en sont également atteintes.
Lorsque l'enquête a été diffusée sur Twitter par une organisation de défense des droits, 2 000 réponses ont été reçues en l'espace d'une journée. "Nous ne savons pas s'il s'agit de personnes ou de robots", explique-t-elle. Cela a été un "cauchemar" d'essayer de distinguer les répondants légitimes, dit Mme Bogart, et bien qu'elle soit "relativement certaine" que l'échantillon restant est utilisable, il est possible que certaines réponses non frauduleuses aient été rejetées au cours du processus de sélection.
Crehan a également reçu récemment un grand nombre de réponses à une enquête ouverte. Cette enquête portait sur les expériences liées à l'autisme et à la sexualité, et elle a également reçu près de 2 000 réponses en une nuit. Avec son laboratoire, elle a passé en revue les réponses, ce qui a pris des mois, avant d'en retenir trois qui étaient peut-être authentiques. Elle a payé ces personnes, mais a jeté les données et abandonné le questionnaire.
J'ai parlé à d'autres chercheurs qui se disaient : "C'est en train de nous tuer"", raconte Mme Crehan. Les données d'enquête provenant d'Internet ont déjà fourni de riches ensembles de données que ses étudiants de troisième cycle ont pu exploiter, mais "c'est une autre histoire aujourd'hui".
Selon Gang Wang, professeur d'informatique à l'université de l'Illinois Urbana-Champaign, un afflux rapide de réponses à des enquêtes peut signifier que des robots ou des robots guidés par l'homme ont contourné les mesures de sécurité. En collaboration avec des chercheurs de l'université d'État de Pennsylvanie, il a évalué l'année dernière 22 tests anti-fraude qui pourraient aider à prévenir les robots dans les enquêtes en ligne. Les chercheurs soupçonnent qu'il y avait des humains qui aidaient les robots à passer les tests de sécurité les plus difficiles.
Bogart et Crehan ont tous deux utilisé le logiciel Qualtrics comme plateforme pour leurs enquêtes faussées. Pour lutter contre les fausses réponses aux enquêtes, Qualtrics propose, moyennant un supplément, un service de détection des fraudes en complément de la licence. Ce service peut aider à filtrer les données en "signalant" les réponses frauduleuses et suspectes, a indiqué un porte-parole de Qualtrics à Spectrum dans une déclaration envoyée par courriel, tout en permettant aux clients de les examiner et d'en déterminer eux-mêmes la validité. Le porte-parole a refusé de répondre à d'autres questions sur la sécurité des enquêtes.
Mme Bogart a utilisé les outils de sécurité de Qualtrics pour son enquête, mais elle affirme qu'ils n'étaient pas parfaits et qu'elle a choisi d'analyser elle-même les résultats. En général, les fonctions de sécurité intégrées du logiciel Qualtrics sont "une partie de la solution, mais pas la solution complète", déclare Wang, qui utilise le logiciel pour ses propres enquêtes. L'essentiel, selon lui, est d'utiliser plusieurs tests anti-fraude pour filtrer les réponses et d'intégrer ces fonctions à l'avance, avant le lancement de l'enquête. Mais "la chose la plus efficace que nous ayons trouvée", dit Wang, est d'intégrer dans l'enquête des questions "qui touchent un peu à la connaissance du domaine ou à la capacité humaine de raisonnement logique".
Alors que les enquêtes en ligne sont depuis longtemps infestées de bots, les fraudeurs ont récemment pris l'habitude de simuler des entretiens lors d'appels vidéo - une escroquerie que Wang qualifie de "niveau supérieur". Ce phénomène a également frappé les chercheurs en autisme. Elizabeth Pellicano a transféré ses recherches en ligne pendant la pandémie, mais ce n'est que lors d'un récent groupe de discussion Zoom qu'elle s'est rendu compte qu'elle avait un problème sur les bras.
"Je sais que je suis l'une des seules psychologues à étudier les troubles rares. Il n'y a pas d'autre moyen de faire ce type de recherche sans utiliser l'internet comme outil, alors il faut que je trouve une solution." Kathleen Bogart
Pellicano organisait des groupes de discussion pour interroger des personnes autistes, des membres de leur famille, des praticiens et des chercheurs sur leur expérience de la recherche sur l'autisme. L'un des groupes était composé de quatre personnes censées être des parents d'enfants autistes. Pellicano, professeure de recherche sur l'autisme à l'University College London au Royaume-Uni, avait fourni des questions à l'avance et permis aux membres du groupe de ne pas utiliser les caméras ou d'utiliser la fonction "chat" pour répondre aux questions. Ces mesures visaient à répondre aux besoins des personnes autistes, mais elles ont également facilité le piratage de la session - trois des participants ont gardé leur caméra éteinte et, curieusement, l'un d'entre eux a déclaré pendant l'entretien qu'il n'avait pas d'enfant autiste. Mme Pellicano a tout de même poursuivi l'entretien et, dès le lendemain, elle avait déjà reçu des courriels réclamant un paiement.
C'était inhabituel, dit-elle. Il en va de même pour certaines adresses électroniques : Trois d'entre elles étaient présentées sous la forme "prénom, nom, numéro", un schéma que les chercheurs en économie ont également remarqué comme étant parfois synonyme de fraude. En outre, les entretiens ont été exceptionnellement courts et ont été perturbés par des problèmes de connexion internet.
En fin de compte, Mme Pellicano a conclu que trois des quatre participants étaient des escrocs. Son expérience l'a suffisamment alarmée pour qu'elle rassemble neuf coauteurs et publie une lettre à la rédaction dans Autism en mai, détaillant leurs expériences avec des études menées dans trois pays. Mme Crehan n'était pas auteure de la lettre, mais elle a également été confrontée à des fraudes lors d'entretiens vidéo. Elle raconte qu'un de ses assistants de recherche a surpris un parent en train de dire à son enfant de "faire semblant d'être autiste" lors d'un entretien Zoom.
L'utilité des enquêtes et des entretiens en ligne réside en partie dans leur portée : les participants peuvent se connecter de n'importe où. De plus, les médias sociaux permettent de trouver plus facilement des répondants qui seraient autrement difficiles à localiser, note Bogart. Proposer de rémunérer les participants à l'enquête est une incitation utile - le groupe de discussion Zoom de Pellicano, par exemple, a payé les participants 25 livres sterling - mais ces trois éléments rendent également l'étude qualitative en ligne propice à l'escroquerie.
Le fait de poster des liens d'enquête sur des sites de médias sociaux et d'autres sites web publics a été qualifié de "cause principale" des réponses frauduleuses par certains chercheurs. Mme Pellicano a envisagé d'arrêter de payer les enquêtes, bien qu'elle affirme que les personnes interrogées "méritent d'être payées pour le temps qu'elles consacrent à partager leur temps et leurs expériences". Mais en même temps, si l'escroquerie est "motivée par des raisons monétaires, l'élimination des incitations devrait permettre de résoudre ce problème".
Mme Bogart souhaite toujours que ses participants soient rémunérés, mais elle a décidé de ne révéler la récompense monétaire qu'une fois que quelqu'un a commencé l'enquête, au lieu de la présenter d'emblée. Elle a également renoncé à publier des appels ouverts pour ses enquêtes sur les médias sociaux et ne le fera que dans des groupes restreints, tels que ceux qui sont privés sur Facebook.
Les chercheurs envisagent d'autres moyens d'endiguer le phénomène, comme la collecte d'adresses IP ou l'obligation pour les participants d'allumer leur appareil de prise de vue pendant les entretiens, mais ces méthodes risquent d'aller à l'encontre des règles du comité d'examen institutionnel (CEI), qui est chargé de veiller au respect de la vie privée des participants. Bogart a commencé à plaider auprès de son IRB pour que les adresses IP soient collectées afin de connaître le pays d'origine de chaque personne interrogée. Toutefois, comme le souligne Pellicano dans sa lettre à la rédaction, les chercheurs doivent savoir que les utilisateurs de réseaux privés virtuels (VPN) peuvent aider les escrocs à masquer leur localisation et leur adresse IP.
Il est probable que les escrocs adopteront également de nouvelles tactiques. Selon
Klitzman, des années après son analyse de 2015, les fraudeurs sont aujourd'hui plus sophistiqués que jamais sur le plan technologique. Par exemple, une étude réalisée en 2020 par le Pew Research Center a révélé l'existence d'un robot sophistiqué qui peut être utilisé pour répondre à des enquêtes en mode indétectable et qui peut être acheté dans le commerce. Si l'on ajoute l'intelligence artificielle, "le paysage est en train de changer", affirme Klitzman.
Néanmoins, Mme Bogart est déterminée à continuer d'utiliser la recherche en ligne, car elle a joué un rôle essentiel dans sa carrière. "Je sais que je suis l'une des seules psychologues à étudier les troubles rares", dit-elle. "Il n'y a pas d'autre moyen de faire ce type de recherche sans utiliser l'internet comme outil, alors il faut que je trouve une solution."
Citer cet article : https://doi.org/10.53053/JKHR6038