Michel de Pracontal
Journaliste scientifique, j'ai travaillé à Science et Vie, à L'Evénement du Jeudi, et au Nouvel Observateur (de 1990 à 2009). Je suis aussi auteur de plusieurs livres dont le dernier, Kaluchua, vient de paraître au Seuil. Sur twitter: @MicheldePrac.
Journaliste à Mediapart

229 Billets

0 Édition

Billet de blog 30 janv. 2016

Michel de Pracontal
Journaliste scientifique, j'ai travaillé à Science et Vie, à L'Evénement du Jeudi, et au Nouvel Observateur (de 1990 à 2009). Je suis aussi auteur de plusieurs livres dont le dernier, Kaluchua, vient de paraître au Seuil. Sur twitter: @MicheldePrac.
Journaliste à Mediapart

Samedi-sciences (198): un programme de Google, nouveau maître de go

Pour la première fois, un ordinateur a battu un champion de go, jeu que l’on pensait jusqu’ici trop complexe pour être maîtrisé par une machine. Dix-huit ans après la défaite de Garry Kasparov contre Deep Blue aux échecs, ce match marque une nouvelle avancée de l’intelligence artificielle.

Michel de Pracontal
Journaliste scientifique, j'ai travaillé à Science et Vie, à L'Evénement du Jeudi, et au Nouvel Observateur (de 1990 à 2009). Je suis aussi auteur de plusieurs livres dont le dernier, Kaluchua, vient de paraître au Seuil. Sur twitter: @MicheldePrac.
Journaliste à Mediapart
Fan Hui, champion d'Europe de go, battu en 2015 par le programme AlphaGo © Google Deepmind

Pour la première fois, un ordinateur a battu un champion de go, jeu de stratégie traditionnel originaire de Chine, que l’on pensait jusqu’ici trop complexe pour être maîtrisé par une machine. Pourtant, le programme AlphaGo, mis au point par l’entreprise britannique Deepmind, qui appartient à Google, a battu à plates coutures le champion d’Europe Fan Hui. Ce dernier, né en Chine en 1981, installé en France depuis 2000 et naturalisé Français, a disputé un match en cinq parties contre AlphaGo en octobre 2015. La machine a gagné sur le score sans appel de 5-0.

Dix-huit ans après la défaite de Garry Kasparov contre Deep Blue aux échecs, ce match marque une nouvelle avancée de l’intelligence artificielle. Les spécialistes n’imaginaient pas qu’un joueur de go professionnel soit battu par un programme avant une décennie. Fan Hui lui-même ne cache pas sa surprise, d’autant qu’un match préliminaire avait été plus équilibré (3-2 pour la machine). « Avant de jouer contre AlphaGo, je pensais que je gagnerais, confie Fan Hui à la revue britannique Nature, qui consacre sa couverture à l’événement. Après la première partie, j’ai changé de stratégie et j’ai mieux résisté, mais j’ai perdu. Le problème est que les humains font quelquefois de très grosses erreurs, parce qu’ils sont humains. Nous pouvons être fatigués, ou avoir trop envie de gagner, nous mettre la pression. Le programme n’est pas comme ça. Il est très fort et stable, comme un mur. Pour moi cela fait une grande différence. Je sais qu’AlphaGo est un ordinateur, mais si je ne l’avais pas su, j’aurais peut-être pensé que le joueur était un peu étrange, mais je l’aurais pris pour un joueur très fort, une vraie personne. »

C’est toutefois grâce à la qualité de son jeu, et pas seulement du fait de l’avantage psychologique d’être infatigable et sans émotion, qu’AlphaGo a surclassé Fan Hui. Et là réside l’intérêt de l’histoire. Si le jeu de go a résisté jusqu’ici aux machines, c’est qu’il est d’une extrême complexité, même si ses règles sont simples : sur un plateau quadrillé, comportant 19 lignes horizontales et 19 verticales, soit 361 intersection, deux joueurs placent à tour de rôle des jetons appelés « pierres », respectivement noires ou blanches ; chacun des deux joueurs s’efforce d’encercler une ou plusieurs pierres de l’autre, et s’il y parvient, il capture ces pierres et conquiert la zone qu’elles occupaient; le but du jeu est de contrôler plus de territoire que l’adversaire lorsqu’il n’y a plus de place sur la grille pour poser de nouvelles pierres.

Malgré l’apparente simplicité du jeu, un programme de go ne peut pas reposer sur la seule puissance de calcul, sur la « force brute » : le nombre de configurations possibles est largement plus grand que le nombre d’atomes dans l’univers. Aux échecs aussi, le nombre de combinaisons est trop élevé pour résoudre le problème par la force brute, mais un programme peut explorer quelques coups à l’avant pour évaluer la position résultante et voir quel joueur a l’avantage, en tenant compte de la valeur des pièces de chacun et de leurs positions relatives.

Au go, il est beaucoup plus difficile d’identifier les positions gagnantes ou perdantes : toutes les pierres ont la même valeur et de subtiles différences de position peuvent avoir des conséquences très importantes mais qu’on ne peut pas évaluer simplement.

Comment transmettre à un programme l’intuition d’un joueur expérimenté ? Les concepteurs d’AlphaGo ont utilisé des techniques dites d’apprentissage automatique et des réseaux de neurones artificiels (voir les explications des concepteurs dans la vidéo ci-dessous). Le programme est construit comme un réseau de cellules, organisées en plusieurs couches, dont les connexions se renforcent quand il produit une bonne réponse et s’affaiblit quand la réponse est mauvaise. La couche inférieure représente l’état du jeu à un moment donné, la couche supérieure montre les possibilités pour le coup suivant, et entre les deux s’interposent 11 couches.

© Nature

Entraîner le réseau consiste à ajuster les connexions pour qu’il sélectionne un bon coup. Pour amorcer cet apprentissage, les chercheurs ont fourni au programme un ensemble de 30 millions de configurations de jeu, avec pour chacune la continuation choisie par un bon joueur. Les connexions du réseau ont été ajustées pour intégrer ces données. Puis le programme a continué à s’entraîner en jouant contre lui-même, de très nombreuses parties, en utilisant 50 ordinateurs. À chaque itération, le programme s’est amélioré en intégrant les coups donnant la meilleure issue.

AlphaGo s’est ainsi construit une expérience du jeu. « Nous avons développé ce système d’une telle manière qu’il joue plus comme un être humain » que comme une machine, estime Demis Hassabis, qui a dirigé avec David Silver le développement d’AlphaGo. Ce dernier a même un style de jeu, qualifié de « plus conservateur qu’agressif » par Toby Manning, un joueur de go qui a arbitré le match entre le programme et Fan Hui.

La prochaine étape est pour le mois de mars. AlphaGo doit disputer un match contre le Sud-Coréen Lee Sedol, l’un des tout meilleurs joueurs de la décennie, que Silver compare, dans la revue Science, à un « Roger Federer du go ». David Silver dit qu’il n’a pas parié un centime sur la victoire de son champion, mais sera « très décu » si le programme perd, tout en jugeant que tout est possible : « Les êtres humains ont inévitablement plus d’un tour dans leur sac que nous ne pouvons pas nous entraîner à déjouer. »

Bienvenue dans Le Club de Mediapart

Tout·e abonné·e à Mediapart dispose d’un blog et peut exercer sa liberté d’expression dans le respect de notre charte de participation.

Les textes ne sont ni validés, ni modérés en amont de leur publication.

Voir notre charte

À la Une de Mediapart

Journal — France

Affaire Pellerin : la fuite judiciaire qui menace l’Élysée et le ministère de la justice

Le député Emmanuel Pellerin, visé en septembre dernier par une enquête en lien avec sa consommation de cocaïne, a été prévenu des investigations en cours, pourtant censées rester secrètes. L’élu des Hauts-de-Seine affirme que l’information lui a été transmise par Thierry Solère qui lui aurait dit la tenir du ministère de la justice. Le conseiller politique du président de la République et Éric Dupond-Moretti démentent.

par Pascale Pascariello et Antton Rouget

Journal — France

Le député Pellerin : la cocaïne en toute impunité

Député des Hauts-de-Seine de la majorité présidentielle, l’avocat Emmanuel Pellerin a consommé de la cocaïne avant et après son élection à l’Assemblée en juin dernier, d’après une enquête de Mediapart. Confronté à nos éléments, il a reconnu cet usage illégal. Saisie en septembre dernier, la justice n’avait pourtant pas souhaité enquêter.

par Pascale Pascariello et Antton Rouget

Journal

TotalEnergies est visée par une enquête préliminaire pour mensonges climatiques

Selon nos informations, la multinationale pétrolière est l’objet d’une enquête ouverte par le parquet de Nanterre à la suite d’une plainte au pénal pour « pratiques commerciales trompeuses ». Ce délit ouvre la voie à des sanctions pour « greenwashing ». Une première en France.

par Mickaël Correia

Journal

TotalEnergies : l’heure des comptes

TotalEnergies sait que ses activités sont nocives pour le climat depuis 1971. Pourtant, le géant pétrolier continue d’émettre autant de gaz à effet de serre que l’ensemble des Français·es. En pleine crise énergétique, TotalEnergies a annoncé début 2022 un bénéfice record de 14 milliards d’euros. Retrouvez ici nos articles et nos enquêtes sur une des multinationales les plus polluantes au monde.

par La rédaction de Mediapart

La sélection du Club

Billet de blog

Nous, les banni·e·s

À travers son nouveau podcast « Nous, les banni·e·s », La Cimade a décidé de donner la parole aux personnes étrangères qui subissent une décision de bannissement. Pour illustrer la violence des interdictions de retour sur le territoire français (IRTF), 5 témoins partagent leurs histoires, de leur départ vers la France jusqu’aux difficultés d’aujourd’hui.

par La Cimade

Billet de blog

SOS solidarité pour famille intégrée en péril

Le recours contre l'OQTF du 6-12-22 a été rejeté. Cette famille, avec trois jeunes enfants est menacé de mort dans son pays, risque l'expulsion. Conséquence immédiate : logés au CADA (hébergements demandeurs d'asile) de Cebazat, ils seront à la rue le 31 janvier et si le 115 ne répond pas ce jour-là ou ne propose rien... SOS solidarité rapide et concrète dans ce billet. A vous de jouer.

par Georges-André

Billet de blog

OQTF : la réalité derrière ces quatre lettres

À cause de l'OQTF, j'ai perdu mon travail étudiant. Je me suis retrouvé sans ressources du jour au lendemain, sans rien. C'est très dur, car je cotisais comme tout le monde. Avec ma compagne, on attend une petite fille pour juin prochain. D'ici là, je dois me terrer. J'ai l'impression de vivre comme un rat, j'ai tout le temps peur de tomber sur la police. Je ne suis certes pas Français, mais j'aime la France comme j'aime le Sénégal.

par Couzy

Billet de blog

Appel contre l’immigration jetable et pour une politique migratoire d’accueil

Nous appelons à la mobilisation contre le nouveau projet de loi du gouvernement, qui s’inscrit dans une conception utilitariste et répressive des personnes étrangères en France. S'il était adopté, il accentuerait encore le fait qu'elles sont considérées comme une population privée de droits, précarisée et livrée à l’arbitraire du patronat, de l’administration et du pouvoir.

par association GISTI