Samedi-sciences (203): la machine, championne du monde de go

À Séoul, le programme AlphaGo de Google a gagné le match de go qui l'oppose au champion coréen Lee Sedol, grâce à une série de trois victoires consécutives.

À Séoul, le suspense s’est achevé au matin du samedi 12 mars : le programme AlphaGo de Google a remporté sa troisième victoire consécutive dans le match de go en cinq manches qui l’oppose au Coréen Lee Sedol.

Lee Sedol après sa deuxième défaite, jeudi 10 mars © DR Lee Sedol après sa deuxième défaite, jeudi 10 mars © DR

Bien qu’ayant perdu le match, Sedol a sauvé l’honneur en gagnant brillamment la quatrième partie, dimanche 13 mars. Jouant avec les blancs, donc en second, ce qui est un désavantage, Lee Sedol a trouvé un extraordinaire 78ème coup, qui a déconcerté le programme. Celui-ci s’est mis à jouer bizarrement, et a abandonné après environ 4 heures 45 de jeu.

Lee a donc finalement trouvé une faiblesse dans le jeu d'AlphaGo, ce qui semblait quasiment impossible la veille, tant la domination du programme paraissait complète. Malgré cette belle résistance, AlphaGo a gagné la rencontre, et a battu l’un des plus grands champions de sa génération, considéré comme le Roger Federer du go, et classé meilleur joueur mondial de 2007 à 2011 selon le site goratings.org. C’est un succès historique pour l’intelligence artificielle, que de nombreux experts n’attendaient pas à ce niveau avant de longues années, tant la complexité du jeu de go semblait un défi insurmontable pour l’ordinateur. 

Samedi matin, Lee Sedol a abandonné au 176ème coup, après un peu plus de trois heures d’une partie jugée « incroyablement compliquée » par les commentateurs du site spécialisé GoGameGuru. Inventé par les Chinois il y a environ 3000 ans, le go est intrinsèquement compliqué, même si ses règles sont simples. Sur un plateau quadrillé de 19 lignes horizontales et 19 verticales appelé goban, les joueurs déposent tour à tour des jetons appelés pierres. Le but est de contrôler le maximum de territoire en encerclant les pierres de l’adversaire. La difficulté vient du nombre énorme de situations possible – il y a plus de positions de jeu que d’atomes dans l’univers – et de ce que des situations qui semblent presque identiques peuvent conduire à des issues très différentes.

Il est donc très difficile de traduire le savoir des joueurs de go en règles formelles, et c’est pourquoi il a fallu beaucoup plus de temps à la machine pour régner sur le goban que pour conquérir l’échiquier : cela fait près de vingt ans qu’un programme d’IBM, Deeper Blue, a défait le champion du monde Garry Kasparov (voir notre article et Samedi-sciences du 30 janvier).

Même si AlphaGo avait remporté les deux premières manches, les observateurs pensaient que Lee Sedol avait des chances dans la troisième, bénéficiant d’un double avantage : il jouait avec les noirs, donc en premier, et il avait pu analyser les deux premières parties, alors que l’équipe d’AlphaGo n’avait pas la possibilité d’ajuster le programme en cours de match. 

Jouant sous pression, pris par le temps, Lee n’a pas trouvé de faiblesse dans le jeu d’AlphaGo. Il a attaqué la troisième partie de manière agressive et originale, sans réussir à désarçonner son adversaire informatique. Selon le commentateur Michael Redmond, lui-même grand joueur professionnel, cité dans Wired, la partie est entrée dans un territoire inconnu au bout d’environ 45 minutes, aboutissant à « une situation probablement jamais vue dans un match de go professionnel ».

Le milieu de la partie a abouti à une situation concentrée dans un coin du plateau de jeu, qualifiée d’ « effrayante » par Redmond, dans laquelle Sedol s’est efforcé de consolider sa position, tandis que la machine jouait des coups apparemment peu actifs, mais qui ont suffi à assurer la victoire. L’un des atouts d’AlphaGo est qu’il calcule en permanence ses chances de victoire finale, et ne joue que pour les maximiser, sans chercher forcément un avantage immédiat. Cela s’est révélé d’une efficacité dévastatrice.

« Je ne sais que dire, je m’excuse de n’avoir pas pu produire un meilleur résultat et d’avoir déçu les attentes, a déclaré Lee Sedol, visiblement sonné par ses trois défaites successives. Je pense que je n’avais aucune chance de gagner la première partie. Dans la deuxième, j’ai manqué des occasions ; et de toute ma longue expérience de joueur, je n’ai jamais connu un tel niveau de pression que pendant la troisième partie. »

Les commentateurs du site Gogameguru estiment que le programme a montré sa vraie force dans cette troisième partie et se disent «convaincus qu'AlphaGo est tout simplement plus fort qu'aucun joueur de go humain connu.»

« Lee aurait été difficile à battre aujourd’hui par n’importe quel joueur humain » jugeait pour sa part Redmond, qualifiant AlphaGo d’« œuvre d’art » susceptible de révolutionner le le jeu de go dans l’avenir. Demis Hassabis, le fondateur de DeepMind, filiale d’intelligence artificielle de Google qui a conçu le programme, a aussi rendu hommage au champion coréen : « Nous sommes stupéfaits de la façon dont Lee a contré AlphaGo dans le début de la partie, a déclaré Hassabis, cité dans The Korea Times. Lee Sedol a résisté avec son seul cerveau à une machine qui traite des milliers de positions par seconde. »

La position de fin de partie dans laquelle Lee Sedol a abandonné samedi 12 mars © DR La position de fin de partie dans laquelle Lee Sedol a abandonné samedi 12 mars © DR

Dimanche, Lee a changé l'atmosphère en remportant la quatrième partie. Pour autant, cette victoire ponctuelle n'est probablement qu'un sursis. Après le match, le programme intègrera les enseignements de sa défaite pour tenter de corriger ses points faibles, et il est probable qu'il en résultera une nouvelle version d'AlphaGo encore plus forte. À terme, l'on ne voit pas comment l'intelligence artificielle ne dépasserait pas, comme aux échecs, les capacités des champions humains.

Cela étant, le triomphe d’Alphago dépasse le jeu de go. Les techniques d’apprentissage automatique et les systèmes de « réseaux neuronaux profonds » qui sont au cœur du programme sont aussi utilisés par Google pour faire fonctionner ses services grand public. Les mêmes outils servent, entre autres, à identifier des visages sur des photos, à reconnaître des commandes vocales de smartphones, à sélectionner les choix des moteurs de recherches, etc. Demain, ils permettront de réaliser des moteurs de recherche plus intelligents, capables de mieux comprendre la demande de l’utilisateur, ou des assistants personnels informatiques vraiment utiles.

L’essence d’un programme comme AlphaGo est sa capacité à s’améliorer lui-même, en, analysant une masse de données. Cela peut en principe s’appliquer à mille autres choses qu’à un jeu traditionnel chinois. Pour Hassabis et ses collègues, les machines pourraient apprendre à effectuer des tâches concrètes comme elles apprennent à jouer au go. Mais le monde réel est beaucoup plus complexe que le monde formalisé d’un jeu de stratégie. Comment les machines du futur se débrouilleront-elles dans des environnements plus flous et moins artificiels qu’un échiquier ou un goban ? Les paris sont ouverts.

 

N.B. Ce billet publié samedi 12 mars a été remis à jour dimanche 13, pour tenir compte de la victoire de Lee Sedol dans la quatrième partie.

Le Club est l'espace de libre expression des abonnés de Mediapart. Ses contenus n'engagent pas la rédaction.