Samy Johsua

Abonné·e de Mediapart

66 Billets

1 Éditions

Billet de blog 9 janvier 2025

Samy Johsua

Abonné·e de Mediapart

ChatGPT, une intelligence sans pensée

Titre d’un livre de Hubert Krivine qui vient à point nommé pour nourrir la réflexion sur le déferlement de l’IA pour, comme le dit l’auteur, « en définir les limites, même à contre-courant ».

Samy Johsua

Abonné·e de Mediapart

Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.

Lors de sa présentation d’un concurrent de OpenAI ChatGPT, soit le X AI, Elon Musk vient de déclarer avec la démesure qui le caractérise qu’il s’agit là de « tenter de comprendre la véritable nature de l’univers ». La lecture du livre de Hubert Krivine montre, de manière convaincante, que basée sur les mêmes principes « d’apprentissage automatique » il n’a aucune chance d’y parvenir. Mais l’auteur prévient modestement que son livre « contiendra…plus de questions que de certitude ». Il contribue au débat et c’est déjà beaucoup.

L’auteur sait évidemment qu’une littérature immense traite de ces deux termes, intelligence et pensée. Et il se garde bien de prétendre donner le fin mot en la matière. Alors il préfère utiliser des formulations de travail. L’IA dont fait partie ChatGPT (c’est, compte tenu de son succès, de cet outil dont s’occupe principalement le livre) relève d’une forme « faible ». Intelligente si l’on veut, pouvant résoudre des problèmes qu’on lui pose. Et encore dans des limites à explorer. Mais elle « …diffère de l’Intelligence Humaine… Par exemple l’IA faible vous dira comment aller d’un point A à un point ; l’IA forte vous dirait quel est votre point B, pourquoi et quand y aller. Et ce choix de B obéit généralement à une infinité de causes enchevêtrées qui peuvent être rationnelles ou pas ; locales dans le temps et l’espace, ou pas ».

De plus l’IA « générative » dont fait partie ChatGPT, avec son « deep learning » repose essentiellement sur une logique inductive. Grâce à son immense capacité de traitement de « big data », et à l’aide d’une méthode probabiliste, elle fournit donc des réponses qui mettent en relation ces « données » particulières qu’elle a collectées dans les « data ». Mais l’auteur (qui est physicien) nous cite deux sommités sur la question. Einstein, « Aucune méthode inductive ne peut conduire aux concepts fondamentaux de la physique ». Et Poincaré : « On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n’est pas plus une science qu’un tas de pierres n’est une maison ». Et lui-même le rappelle : « En physique moderne, la plupart des évènements ont été pré-vus avant d’être vus ». Avec donc une limite générale d’emblée pour cette IA générative : comment du neuf pourrait-il sortir du déjà connu ? Non que la récolte de ce « connu », par induction donc, soit en elle-même inutile. Pour la mise à l’épreuve de théories par exemple, à la recherche de contre-exemples. Pour favoriser les hypothèses, comme l’a permis le voyage sur le Beagles pour Darwin. Ou par ce que les anglo-saxons appellent « serendipity », comme dans le cas de la découverte de la pénicilline, « par hasard » ou celle des rayons X (un « hasard » nécessitant quand même un esprit préparé à s’étonner). Mais on est loin là d’une « Intelligence Générale ». « A première vue est intelligent celui qui comprend, c’est-à-dire qui met en relation des évènements différents… et en tire des conclusions pratiques ». Comme retirer sa main du feu. Tout joueur de jeu de go quitterait la partie en courant devant des flammes, ce que ne ferait pas la machine, qui pourtant a prouvé sa capacité à le battre à ce même jeu ! S’y ajoute une « capacité à s’adapter aux variations de l’environnement…à…trier parmi la masse de données celles qui seraient utiles (en lien avec le milieu et ses variations) ». Au final, « Mieux vaut définir l’intelligence générale par une propriété fonctionnelle, sans localisation : la capacité de son possesseur à faire face…à toute modification de l’environnement ». Sans s’y attarder Krivine signale qu’on pourrait, pour les humains, ajouter la « capacité à l’abstraction ».

Les défenseurs de l’IA générative affirment que ces limites pourraient un jour être dépassées. Avec essentiellement un argument, « More is different ». Pour les familiers de la dialectique hégélienne on sait effectivement que la quantité peut se transformer en qualité. Mais ce n’est pas automatique. Déjà, dans le cas précis, on a  pu montrer que l’augmentation des données traitées pouvait induire des corrélations dues au simple hasard. Sauf à en passer par une explication. On peut raisonnablement défendre que tous les frigos en bon état sont éclairés à l’intérieur en permanence. A preuve, chaque fois que j’ouvre la porte, cette lumière se manifeste… En effet de quelque manière qu’on s’y prenne la machine ne donne qu’un modèle de la réalité. Plus précisément, « ChatGPT est principalement utilisé comme une merveilleuse machine à écrire dont la dactylo est inconnue : il édite, sur une sujet plus ou moins encadré par le prompt une espèce de moyenne statistique très sophistiquée de tous les auteurs. Voilà pourquoi il est souvent appelé stochastic parrot, soit « perroquet aléatoire ». Mais aussi massives que soient les données traitées, elles n’épuisent pas le réel. Comme le dit la citation connue, «La carte n’est pas le terrain » (Korzybski). Et exclut par définition ce qu’elle ne modélise pas. La nouveauté à venir évidemment comme on l’a déjà vu.  Et nous dit l’auteur, ne pas oublier que « Le rare, par définition statistiquement peu présent dans les data, peut être crucial dans l’évolution ». Que ce soit celle des espèces (qu’on songe aux diverses extinctions) ou aux ruptures provoquées par les changements de paradigme chers à Kuhn liés à des apports scientifiques exceptionnels mais décisifs.

Selon donc le degré d’exigence que l’on porte au terme, on peut admettre que l’IA est « intelligente » du moins dans des limites repérables. Mais plus globalement encore, Krivine nous dit que « …la pensée, non prisonnière de finalité ou de réalisme ou même de logique peut aussi être source. Le domaine de la pensée est donc un univers mouvant, anarchique, irresponsable, non hiérarchisé qui concerne aussi bien le raisonnement que les rêves, les désirs, l’intuition, la curiosité, l’appétence… ».

Les limites ainsi apportées aux trop grandes prétentions de l’IA ne signifie par pour autant qu’elle soit sans effets, y compris nombre d’effets positifs. En médecine (détection des tumeurs malignes, maladies dermatologiques, etc…). Voir aussi le problème du repliement des protéines en 3D, qui a valu un Nobel de chimie cette année. La pharmacovigilance. Ou dans divers domaines de physique et d’astronomie. Pour ce qui est plus spécifiquement de ChatGPT, l’auteur estime que le bilan est contrasté. Déjà par les inégalités sociales en rapport au Net. Puis par ceci qu’à la limite il est d’autant plus utile que son utilisateur connait le sujet. La suite est plus délicate à imaginer. Dans le passé par exemple la photographie n’a pas fait disparaître la peinture, mais en a peut-être modifié sa capacité imaginative. On parle de disparition de nombre de métiers, ce qui est du domaine du possible. D’autres, dont « les travailleurs du clic » vont se multiplier. Avec le risque que la machine remplace l’humain, comme pour la relation médecin/malade, dans des proportions déraisonnables décrites par le professeur diabétologue André Grimaldi. Certainement aussi y aura-t-il un impact sur l’enseignement. Et on peut lister les questions en suspens, comme le sens moral, le licite, les fakes news, la confusion corrélation-causalité (être malade et aller à l’hôpital !), etc…

Et, last but not least, qui pour contrôler tout ceci ? « Difficile de ne pas être pessimiste dans des sociétés (Etats ou firmes) dont les productions matérielles et intellectuelles sont essentiellement orientées vers la maximisation du profit (financier ou politique… Finalement, il en va de ChatGPT comme de ce qu’il en est de toutes les avancées potentielles : elles dépendent essentiellement des fins de la société qui les utilise ».

Hubert Krivine, ChatGPT, une intelligence sans pensée, Ed Cassini, 12 euros, préface de Jean-Gabriel Ganascia

Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.