Education populaire (science et techniques), luttes diverses et variées (celles ci qui imposent de "commencer à penser contre soi même") et musiques bruitistes de toutes origines
Education populaire (science et techniques), luttes diverses et variées (celles ci qui imposent de "commencer à penser contre soi même") et musiques bruitistes de toutes origines
Abonné·e de Mediapart
ChatGPT : des réponses qui posent question
ChatGPT parle beaucoup, mais interroge aussi. Quelles sont ses forces, ses faiblesses, comment fonctionne t il ? Quelles sont ses "bases de connaissances", par qui sont ils saisis, et quels conséquences sur le plan écologique ? A l'heure ou une pétition demande l’arrêt des recherches en "intelligence artificielle générative", on doit peut être commencer à s'interroger...
Education populaire (science et techniques), luttes diverses et variées (celles ci qui imposent de "commencer à penser contre soi même") et musiques bruitistes de toutes origines
Abonné·e de Mediapart
Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.
Ce billet était écrit depuis plus d'un mois mais le disque dur sur lequel il était sauvegardé a "planté". Cela montre que nous sommes de plus en plus dépendant d'aléas techniques (et que les sauvegardes de sécurité sont nécessaire surtout quand comme ici elles ont été négligées) Bonne lecture de ce texte, largement "reconstitué"...
Les textes en italiques sont ceux de chatGPT (qui est seul responsable de ses réponses)
ChatGPT : l'art de la conversation informatique
Depuis quelques mois, ChatGPT, application d’intelligence artificielle est de toutes les conversations, elle suscite un engouement médiatique important qui la présente comme une « révolution » remettant en cause le travail intellectuel sous toutes ses formes : chatGPT est présenté comme le poète du futur, le romancier, l’auteur de notice de wikipédia, le journaliste de l’avenir. Ou se situe la propagande, ou se situe la vérité. Et d’abord, comment ça marche…
Et d’abord, « ChatGPT »,qu’est ce que c’est ? Laissons le répondre : « ChatGPT est un modèle de langage très avancé développé par OpenAI. Il est capable de comprendre et de produire du texte en utilisant des algorithmes d'apprentissage automatique. ChatGPT est souvent utilisé pour répondre à des questions, générer du texte et effectuer des tâches de traitement de langage naturel. » En fait, ChatGPT appartient à une catégorie particuliére d’applications web comme les assistants virtuels, les agents utilisateurs, les bots de trading (qui effectuent des opérations en bourse « automatique ») et donc les « chatbots » qui utilisent l’intelligence artificielle pour maintenir une conversation entre une « machine » (informatique) et un humain. Notons que les chatbots sont assez anciens même si jusqu’à une date relativement rapprochés, leurs performances étaient très limitées et qu’ils ne pouvaient pas faire illusion. Le premier chatbot opérationnel de l'histoire de l'informatique s'appelait ELIZA. Il a été créé par Joseph Weizenbaum, un informaticien du MIT, en 1966. ELIZA était un programme informatique qui utilisait des techniques de traitement du langage naturel pour simuler une conversation en ligne avec les utilisateurs. ELIZA a été conçu pour imiter un psychothérapeute en posant des questions aux utilisateurs et en répondant à leurs réponses de manière appropriée.
on peut demander à ChatGPT une explication de son fonctionnement :
ChatGPT est un modèle de langage naturel basé sur le deep learning qui utilise une architecture de réseau de neurones appelée Transformateur. Le modèle est entraîné sur une quantité massive de données de texte pour apprendre les motifs et les structures dans le langage humain.
Lorsqu'un utilisateur pose une question à ChatGPT, le texte est d'abord prétraité pour le nettoyer et le normaliser. Ensuite, le texte est encodé dans une représentation numérique qui est ensuite fournie en entrée au modèle de ChatGPT. Le modèle de ChatGPT calcule une distribution de probabilité sur les mots de sortie possibles en utilisant l'entrée encodée, ainsi que la mémoire de travail interne du modèle. Les mots de sortie sont générés un par un, en fonction de la distribution de probabilité donnée par le modèle, jusqu'à ce que la réponse complète soit construite.
Au fil du temps, ChatGPT a été entraîné sur de grandes quantités de données de texte, ce qui lui permet de fournir des réponses plus précises et plus naturelles. ChatGPT peut être utilisé pour une variété de tâches de traitement du langage naturel, telles que la traduction, la génération de texte, la classification et la réponse à des questions, en fonction du contexte et des données d'entraînement utilisées.
En fait le traitement automatique du langage a déja une longue histoire, qui commence dans les années 1960 dans un contexte de guerre froide. Dans le cadre de la guerre entre les blocs, l'objectif est de traduire "automatiquement" des textes dans un contexte militaire. Les premières réalisations sont d'ailleurs proposées par IBM qui propose un certain nombre de phrases ("militaires, diplomatiques, scientiques) traduites du russe en anglais. Il y a à cet époque une grand optimisme technologique sur la facilité de ce genre de travail Les auteurs prétendent que dans un délai de trois à cinq ans, la traduction automatique ne sera plus un problème. Soixantes ans plus tard il n'est toujours pas résolu...
C'est qu'il ne suffit pas de faire de la traduction "mot à mot". Et que la question de la traduction (comprendre un texte dans une autre langue) est différent de l'écriture dans sa langue propre (le processus peut etre découpé en deux) Dans un premier temps, on s'intéresse beaucoup à la structuration des phrases (différentes entre les langues) et on développe beaucoup l'analyse des "arbres" qui permettent justement une analyse structurelle des langues. Mais le grand probléme des langues "naturelles" est leur coté contextuel : un "arbre" peut etre un étre vivant (un peuplier, un chéne) une structure mathématique (un arbre binaire) un dispositif mécanique (un arbre de transmission) sans oublier l'arbre généalogique... Pour intégrer cette dimension, un des progrés a été de réaliser des dictionnaires non seulement au niveau du mot, mais d'un ensemble de mot (le mot mais aussi la phrase qui le contient) Par exemple pour "chatGPT" la fenétre d'analyse compte environ 3000 mots.
Les derniéres progrés rencontrés en traitement automatique du langage résulte de la mise en oeuvre des techniques de "réseaux de neurone profond". Cette technique n'a rien de nouvelle : elle existe depuis 60 ans ! Mais elle a été révolutionné par l'arrivée de processeurs rapides dévolue a cette tache. Elle consiste a imiter sommairement le fonctionnement de nos propres neurones qui sont remplacés par des processus informatiques Cette technique est basée sur la "reconnaissance de forme" : elle a déja permis une révolution dans le domaine de l'image (on peut par exemple trouver un chat sur une image) puis des formes en général : ce n'est pas un hasard si la "révolution des réseaux de neurone profond" a été lancée par la simulatin d'un jeu de go ou l'ordinateur était supérieur à tout joueur humain. Le jeu de go repose beaucoup sur la reconnaissance de formes. On comprendra également son importance pour le langage...
Ce qu'apporte chatGPT
Agrandissement : Illustration 1
De fait, les chats basés sur des processus d'intelligence artificielle et de "réseaux de neurone" existent depuis longtemps et sont couramment utilisés. C'est le cas par exemple des systèmes d'interrogations automatisés utilisés par un certain nombre de "services après vente" sur Internet ou l'interlocuteur n'est pas un "être humain" mais bien une "intelligence artificielle" qui vous questionne sur les dysfonctionnements de l'appareil acheté à la Fnac ou chez Amazon et tente d'apporter des réponses plus ou moins judicieuses. Vous pouvez avoir l'impression de discuter avec un technicienne ou un technicien, mais en fait c'est un programme informatique qui vous répond... Dans le même esprit, on peut imaginer des systèmes traitant de réservation (d’hôtel ou de voyages par exemple)
Tous ces exemple s'appuient sur un sujet relativement limité (même si les références à des produits multiples peut être nombreuses et le problème pas aussi trivial qu'il ne semble) et avoir un chat généraliste est une autre paire de manche. De plus certaines tentatives ont été faites, et ont donné lieu à des débordements regrettables. De fait, ces programmes ont en général un processus dit "d’entraînement" qui permet après un échange avec des interlocuteurs humains de supprimer ou en tout cas de réduire les inévitables erreurs .
Il est vrai qu'à l'origine, chatGPT n'est pas un succédané de moteur de recherche mais un "robot conversationnel" même si les deux peuvent etre liés. Le problème du "moteur de recherche" c'est qu'il faut savoir l'interroger pour arriver à extraire l'information dont il dispose. Or un robot conversationnel ne s’arrête jamais de discuter. Comme dans la vraie vie certaines personnes ne veulent jamais avouer leurs lacunes et continuent de pérorer alors même qu'elles sont en "terrain inconnu". C'est un processus connu sous le nom de "phénomène d’hallucination" : le robot conversationnel quand il n'a pas de réponse, en invente une.
Hubert Krivine, un militant politique connu et un vulgarisateur scientifique intéressant (même si je ne suis pas toujours d'accord avec ses propos) montre l'exemple de ce qu'il obtient quand il intérroge chatGPT a propos de lui (en donnant son identité :
Hubert Krivine est un médecin, ancien militant politique et écrivain français. Il est surtout connu pour son engagement politique dans les années 60 et 70 en France, comme membre de l’Organisation communiste internationaliste (OCI) et de Lutte Ouvrière. Il a été également membre du Parti de Gauche pendant quelques années. Il est aussi connu pour son engagement en faveur de la cause palestinienne et pour ses positions controversées en matière de politique étrangère. Il a écrit plusieurs livres sur les sujets politiques et historiques. Il est aujourd’hui retraité de la politique active mais continue de s’exprimer sur des sujets qui lui tiennent à cœur.
C'est effectivement trés trés délirant. Mais le probléme c'est que j'ai refait l'expérience qui ne m'a pas donné du tout le même résultat Si je demande "qui est hubert krivine" chatGPT me répond :
Je suis désolé, mais je ne peux pas trouver d'informations fiables sur une personne nommée "Hubert Krivine". Il est possible que cette personne soit relativement inconnue ou qu'elle n'ait pas de présence significative sur internet. Si vous avez plus d'informations sur qui il est ou ce qu'il a accompli, je serais heureux de vous aider davantage.
Ce qui est correct. ChatGPT me signale juste qu'il ne posséde pas assez de connaissance sur le sujet Aprés ce type de réponse, il est "logique" de pouvoir constater que chatGPT dise n'importe quoi ! Mais même dans ce cas, il ne dira forcément pas la même chose (parce qu'il aura utilisé ses facultés "d'apprentissage") et qu'il devra avoir normalement écrit moins de sottises ! Voila ce que je constate moi en interrogeant cette intelligence artificielle :
Hubert Krivine est effectivement connu pour être un militant politique trotskyste. Il est né en 1939 et a été l'un des fondateurs de la Ligue communiste révolutionnaire (LCR) en France en 1969, qui était un parti trotskyste. Krivine a joué un rôle important dans la LCR pendant de nombreuses années, occupant des postes de direction et participant à des campagnes politiques à l'échelle nationale et internationale. Il a également été un militant actif en faveur de nombreuses causes, notamment la défense des droits des travailleurs, la lutte contre le racisme et l'oppression, et la promotion de la solidarité internationale entre les peuples.
Je pense que chatGPT confond hubert et Jean Michel (un de ses frères) Il lui arrive de le confondre avec Alain (un autre de ses freres) voir avec Jean Louis (un autre cousin) Bref, ChatGPT se perd dans les méandres de la famille Krivine. Je dois dire que moi aussi...
Mais c'est cela le probléme. Un de mes profs de physique disait "le progrés en science, c'est de remplacer une erreur subtile en une autre erreur, encore plus subtile" Et c'est exactement ça ! On a tendance a se focaliser sur les "grosses" erreurs mais celles qui "font du mal" (surtout en science) c'est les petites...
Et un autre gros probléme est qu'on passe beaucoup de temps a se moquer des "grossiéres erreurs" de ChatGPT : j'ai ainsi découvert que Macron avait commencé à militer à la lcr (c'est faux : j'ai vérifié), que les vaches volent comme des oiseaux (je n'ai pas vérifié), et autres fantaisies. C'est tout a fait exact que ChatGPT peut dire "n'importe quoi". Mais pas tant que ça ! Par exemple, sur le trotskysme il est bien moins délirant que beaucoup de gens...
ChatGPT et le turc mécanique
Agrandissement : Illustration 2
La nouvelle d'Allan Poe a rendu le "turc mécanique" célèbre : au 18° siécle, siécle des automates, un automate "jouant aux échecs" bat tous les joueurs humains qui lui sont opposés. Son secret : un homme de petite taille dissimulé à l'intérieur du mécanisme qui est par ailleurs un trés bon joueur d'échec oriente le déplacement des piéces maniées par l'automate.
Il est le symbole du travail humain dissimulé, en particulier au niveau de l'intelligence artificielle utilisant les algorithmes "d'apprentissage automatisé" qui nécessite d'énormes bases de données mises sous une forme déterminée pour leur exploitation
C'est si vrai qu'Amazon a mis au point un de ses services le "turc mécanique" (disponible sur https://www.mturk.com/)
c'est ce qu'on appelle du "micro working" : on choisi une micro tache à réaliser dans un temps déterminé contre un paiement minime (au mieux un demi dollars) Si vous ne le réalisez pas dans le temps prévu, vous n'etes pas payé. Beaucoup, et a juste titre, ont dénoncé l'exploitation forcenée auquelle conduisait cette forme de travail avec le rapport social qui lui est lié (travail parcellaire, sous payé, sans statut)
Le Turc mécanique d’Amazon, c’est une plateforme - un site internet donc-, sur laquelle s’inscrivent des entreprises d’un côté, et des particuliers – des travailleurs - de l’autre. Le principe est simple : les entreprises proposent des micro-taches, auxquelles sont associées une rémunération (en général minime, 10 cents, 20 cents, ¼ de dollar) et un temps alloué (si vous prenez la tâche et ne la réalisez pas dans le temps alloué, elle est remise sur le marché).
C'est également le genre de travail lié au travail de mise en forme des données dans les systémes d'intelligence artificielle utilisant les "réseaux de neurones" qui nécessitent des banques de données d'une taille gigantesque. ChatGPT utilisant une des bases de connaissance la plus importante qui soit (plusieurs encyclopédies, des ouvrages de références et des revues scientifiques à comités de lecture y sont numérisées) a besoin également de milliers de "petites mains" pour réaliser ce travail ingrat, mais indispensable.
Pour ce travail de "mise en forme", ChatGPT a utilisé de la main d'oeuvre au Kenya, pays spécialisé dans la sous traitance dans le domaine de l'IA. Cette main d'oeuvre a également été entrainée pour limiter les dérives : des dizaines de milliers de messages "offensant" ont été utilisé pour "entrainer" chatGPT
Pour obtenir ces étiquettes, OpenAI a envoyé des dizaines de milliers d'extraits de texte à une entreprise de sous-traitance au Kenya, à partir de novembre 2021. Une grande partie de ce texte semblait avoir été extraite des recoins les plus sombres d'Internet. Certains d'entre eux décrivaient des situations avec des détails graphiques comme l'abus sexuel d'enfants, la bestialité, le meurtre, le suicide, la torture, l'automutilation et l'inceste.
Le partenaire d'externalisation d'OpenAI au Kenya était Sama, une entreprise basée à San Francisco qui emploie des travailleurs au Kenya, en Ouganda et en Inde pour étiqueter les données de clients de la Silicon Valley tels que Google, Meta et Microsoft. Sama se présente comme une entreprise « d'IA éthique » et prétend avoir aidé à sortir plus de 50 000 personnes de la pauvreté.
Un employé de Sama chargé de lire et d'étiqueter du texte pour OpenAI a déclaré à TIME qu'il souffrait de visions récurrentes après avoir lu une description graphique d'un homme ayant des relations sexuelles avec un chien en présence d'un jeune enfant. "C'était de la torture", a-t-il dit. « Vous lirez un certain nombre de déclarations comme celle-là tout au long de la semaine. Au moment où il arrive à vendredi, vous êtes dérangé de penser à cette image. La nature traumatisante du travail a finalement conduit Sama à annuler tout son travail pour OpenAI en février 2022, huit mois plus tôt que prévu.
Chatgpt et le déréglement climatique
Si Chatpgt est un progrés certain en matiére de "discussion automatisée" c'est également une catastrophe sur le plan climatique.
Alan Woodward, professeur de cybersécurité à l’université du Surrey, au Royaume-Uni, souligne ainsi : « L’indexation et la recherche de contenu sur l’internet mobilisent déjà d’énormes ressources, mais l’incorporation de l’IA requiert une puissance de feu différente ».
Il ajoute : « Elle nécessite une puissance de traitement ainsi qu’un stockage et une recherche efficace. Chaque fois que nous assistons à un changement d’étape dans le traitement en ligne, nous constatons une augmentation significative des ressources en énergie et en refroidissement requises par les grands centres de traitement. »
Interrogé par nos confrères, Martin Bouchard cofondateur de la société canadienne de centres de données QScale, confirme cette idée. Selon lui, il faudra 4 ou 5 fois plus de calcul par recherche sur Bing et Google.
Prenons l’exemple du modèle de langage GPT-3, développé par la société OpenAI, le plus gros modèle de langage jamais entraîné (175 milliards de paramètres). L’entraînement de ce modèle consommerait autour de 552 TeqCO2. A titre de comparaison, 1TeqCO2 équivaut à un aller / retour Paris – New York en avion. Point supplémentaire : le maximum annuel autorisé à chaque Européen pour atteindre l’équilibre carbone en 2050 serait de 2TeqCO2. Le coût d’entraînement de ce modèle serait en moyenne 250 fois supérieur à cette valeur.
Et c'est d'autant plus vrai que "l’entraînement" (le fait d’améliorer en permanence la justesse des réponses délivrées par chatGPT ) est un processus qui fait appel aux utilisateurs mêmes, et qui entraine par conséquent une dépense d'énergie considérable elle aussi. Deux processus concourent à l'ameilioration des performance de ce "robot discuteur" : d'une part un processus qui élimine les "dérives" de la discussion et les "hallucination", qui est fait par des intervenantes et intervenants payés (mal) pour ça, et d'autre part un processus plus général d'ameilioration des performances par les utilisateurs même (c'est la principale raison pour laquelle le processus est gratuit : en fait, en se connectant à chatGPT, vous travaillez pour lui !) Mais en dehors du probléme de gratuité du travail , cela pose également la question de la dépense considérable d'energie de ce type d'application
ChatGPT pour quoi faire ?
On a vu (succintement) comment cet outil "magique" fonctionnait réellement. On a vu comment il utilisait largement un travail "gratuit" ou trés faiblement rémunéré. On a vu qu'il consommait "une énergie de dingue", ce qui posait probléme à l'heure ou il faut réduire notre dépense energétique. La question finale est alors : à quoi sert il ?
Car pour le momment, c'est le plus gros problémes : tous les usages proposés tiennent plus du gadget que d'un usage raisonné. Pour une application consommant une part déraisonnable d'électricité, c'est quant même regrettable. Le probléme c'est que quand je demande autour de moi qui utilise chatGPT, et pourquoi, la plupart répondent "j'utilise ChatGPT pour voir ce que chatGPT est capable de faire". Cela ressemble fort au début de la micro électronique ou le gros des utilisatrices et utilisateurs se servaient de l'outil pour apprendre à utiliser l'outil, sans savoir vraiment a quoi allait t il leur servir.
Bibliographie
Pour écrire ce billet je me suis servi d'ouvrages et d'articles dont je vous donne les principaux pour celles et ceux qui désireraient approfondir la réflexion (et leur connaissance dans le domaine)
Ouvrages de réflexion générale sur le sujet :
François-Régis Chaumartin et Pirmin Lemberger : le traitement automatique du langage avec l’intelligence artificielle Editions Dunod 2020 320 pages
Un ouvrage complet mais très pédagogique sur la question. Necessite de comprendre assez précisément les techniques numériques de base
Kate Crawford Un contre atlas de l’intelligence artificielle Editions Zulma 2021 384 pages
Un ouvrage riche de réflexion sur l’intelligence artificielle, ses enjeux, ses non dits
Articles et sites web
ChatGPT, comment ça marche : un article fouillé sur le fonctionnement des systéme de traitement automatisé du langage avec une approche historique particulièrement intéressante :
Une étude assez précise des couts énergétiques du deep learning en général et de ChatGPT en particulier, avec des hypothèses réalistes (mais peut être sous estimées)
Utiliser ChatGPT dans l’enseignement supérieur : écrit parla division « numérique » de l’université de louvain , un « slide » donne des exemple de ce qu’il est possible de faire (ou pas) avec chatGPT