Michel DELARCHE
retraité de l'ingénierie informatique et aéronautique et de l'enseignement dit supérieur (anglais de spécialité), écrivain et esprit curieux
Abonné·e de Mediapart

1461 Billets

0 Édition

Billet de blog 28 sept. 2019

Les limites des réseaux neuronaux aux échecs

L'actuel tournoi mondial des programmes d'échecs apportent des enseignements intéressants sur les limites des systèmes à réseaux neuronaux.

Michel DELARCHE
retraité de l'ingénierie informatique et aéronautique et de l'enseignement dit supérieur (anglais de spécialité), écrivain et esprit curieux
Abonné·e de Mediapart

Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.

Le programme classique Stockfish semble avoir considérablement affiné sa fonction d'évaluation depuis l'an passé: il a remporté le tournoi de Première Division, éliminant au passage le champion de l'an passé LCZero qui n'a fini que troisième.

LCZero est devenu à la fois plus difficile à battre (il a terminé le tournoi sans une seule défaite) mais aussi plus frileux en attaque et donc remportant au total moins de victoires. Or l'expérience des forts joueurs humains montre que les joueurs les plus solides en défense (comme Leko ou Karjakine qui est surnommé "le ministre de la défense") obtiennent sur la durée de moins bons résultats que des joueurs prenant plus de risque pour gagner et acceptant de ce fait de perdre de temps en temps.

La super-finale en 50 parties double ronde (même ouverture jouée avec les Blancs puis avec les Noirs) se joue actuellement entre StockFish et le second du tournoi, à savoir le programme mixte AllieStein, qui combine une évaluation heuristique déterministe avec élagage alpha-bêta et le calcul statistique par réseau neuronal.

Après 12 parties, StockFish mène par deux victoires à une (toutes les victoires ont été remportées avec les Blancs). On peut en tirer deux premières conclusions:

1°) l'ascension des systèmes à réseaux neuronaux n'est pas irrésistible.

2°) les programmes classiques ne sont pas au bout de leurs progrès.

On peut même se demander si l'on n'assiste pas à un début de plafonnement des systèmes à réseaux neuronaux du fait de l'instabilité intrinsèque de leurs évaluations, d'une part, et de leur incapacité à fournir une traçabilité stratégique à leurs décisions, d'autre part, un peu comme ce qui s'est passé dans les années 80 avec les systèmes experts dont on attendait monts et merveilles mais qui se sont révélés trop instables pour être industriellement exploitables dès que l'on combinait quelques centaines de règles (sauf dans quelques domaines bien délimités comme le diagnostic médical).

La sélectivité des programmes classiques leur permet désormais d'atteindre une profondeur de calcul encore inaccessible aux systèmes à réseaux neuronaux. Par exemple, dans la 6ème partie (qu'il a remportée), StockFish a pu annoncer mat en... 49 coups au 37ème coup des Noirs.

L'instabilité des évaluations est bien illustrée par les pics d'excitation des programmes à réseaux neuronaux, qu'on pourrait ici soupçonner d'une certaine "exhubérance irrationnelle" (selon la formule employée par un ancien banquier central à propos des marchés financiers), dans l'évaluation des positions lors de la 5ème partie. L'instabilité de l'évaluation produite par AllieStein du 18ème au 23ème coup  montre bien le principal défaut de ces systèmes: si leur base statistique d'échantillonnage n'est pas assez représentative des potentialités de la position, l'évaluation peut fluctuer énormément d'un coup à l'autre (cette instabilité est un problème spécifique aux réseaux neuronaux qui n'a rien à voir avec l'effet d'horizon).

Le déroulement de cette partie, quoiqu'affecté d'une certaine tension tactique, n'est pourtant pas si compliqué; StockFish avec les Noirs a sacrifié une Tour contre un seul pion pour démolir le grand roque des Blancs puis obtenu aisément l'égalisation en menaçant de récupérer un cavalier et un pion au passage puis en forçant une nulle par répétition. C'est une ligne de jeu qui me semble à la portée d'un fort joueur humain du fait du grand nombre de coups plus ou moins forcés (à chacun de leur demi-coup, les Blancs n'ont qu'un ou deux coups plausibles pour se défendre), mais elle a visiblement échappé à BlueLeela (une version dopée de LCZero) tout comme à AllieStein qui jouait les Blancs. Les deux versions de StockFish se sont montrées par contraste beaucoup plus réalistes dans leurs fluctuations (que l'on peut par ailleurs expliquer par l'effet d'horizon):

 Je concluerai ce billet par un retour aux échecs humains. Le champion français MVL s'est fait assez piteusement éliminer hier en demi-finale par Radjabov dans une ouverture anglaise symétrique. Les savants commentateurs d'Europe Echecs ont relevé que son refus d'échanger les Dames au 26ème coup était probablement une erreur, mais je crois plutôt que MVL a péché par orgueil en ne choisissant pas d'échanger les Dames dès le début de la partie: en jouant 6.... Dxd1! au lieu de 6.... Dc7?, il aurait facilement égalisé dans l'ouverture en déroquant le Roi blanc au passage et ainsi augmenté fortement ses chances d'obtenir la nulle dans cette deuxième partie longue, et donc de se qualifier le lendemain aux départages grâce à sa supériorité incontestable en parties rapides (il est présentement numéro 1 mondial à cette cadence et Radjabov seulement 21ème.)

Bienvenue dans le Club de Mediapart

Tout·e abonné·e à Mediapart dispose d’un blog et peut exercer sa liberté d’expression dans le respect de notre charte de participation.

Les textes ne sont ni validés, ni modérés en amont de leur publication.

Voir notre charte

À la Une de Mediapart

Journal — Europe
L’« année zéro » de la diplomatie allemande
La Russie vient de donner une rude leçon de géopolitique à l’Allemagne en lui rappelant sa vulnérabilité militaire et économique. Pour la diplomatie allemande, qui a misé sur la carte russe pendant vingt ans, l’humiliation est profonde, et le constat brutal. Premier volet de notre série sur « l’adieu au pacifisme » outre-Rhin.
par Thomas Schnee
Journal — Liberté d'expression
Un retour sur l’affaire Rushdie
Alors que Salman Rushdie a été grièvement blessé vendredi 12 août, nous republions l’analyse de Christian Salmon mise en ligne en 2019 à l’occasion des trente ans de l’affaire Rushdie, lorsque l’ayatollah Khomeiny condamna à mort l’écrivain coupable d’avoir écrit un roman qu’il jugeait blasphématoire. Ce fut l’acte inaugural d’une affaire planétaire, sous laquelle le roman a été enseveli.
par Christian Salmon
Journal — Climat
Près de Montélimar, des agriculteurs exténués face à la canicule : « Beaucoup de travail et de questions »
Mediapart a sillonné la vallée de la Valdaine et ses environs dans la Drôme, à la rencontre d’agriculteurs qui souffrent des canicules à répétition. Des pans de récoltes grillées, des chèvres qui produisent moins de lait, des tâches nouvelles qui s’accumulent : paroles de travailleurs lessivés, et inquiets pour les années à venir.
par Sarah Benichou
Journal
Un homme condamné pour violences conjugales en 2021 entre dans la police
Admis pour devenir gardien de la paix en 2019, condamné pour violences conjugales en 2021, un homme devrait, selon nos informations, prendre son premier poste de policier en septembre dans un service au contact potentiel de victimes, en contradiction avec les promesses de Gérald Darmanin. Son recrutement avait été révélé par StreetPress.
par Sophie Boutboul

La sélection du Club

Billet de blog
Face aux recommandations du GIEC, comment réconcilier l’écologie avec le nucléaire
L'écologie politique a toujours manifesté une aversion contre le nucléaire. Pourtant, cette source d'énergie décarbonée n'est pas dénuée d'intérêt. D'où vient alors ce désamour pour le nucléaire ? Le nucléaire devrait se guérir de deux maux: sa filiation militaire qui met en exergue sa dangerosité, et l'absence d'une vision stratégique renouvelée et forgée avec l'adhésion de la société.
par francois brechignac
Billet de blog
Le nucléaire sans débat
Où est le débat public sérieux sur l'avenir du nucléaire ? Stop ou encore ? Telle est la question qui engage les générations futures. Une enquête remarquable et sans concession qui expose faits et enjeux. (Gilles Fumey)
par Géographies en mouvement
Billet de blog
Réagir avant qu'il ne soit trop tard 2/4
L’avenir n’est plus ce qu’il était ! La guerre en Ukraine, la menace nucléaire, la crise alimentaire, le dérèglement climatique, les feux gigantesques de l’été, les inondations meurtrières, autant d’épisodes anxiogènes de la modernité face auxquels nous devons impérativement réagir. Ces désordres du monde constituent une opportunité à saisir pour modifier notre trajectoire
par HARPAGES
Billet de blog
Croissance énergétique : et si le nucléaire n'était pas la solution ?
On trouve ici et là des aficionados du nucléaire pour expliquer que pour continuer à consommer et à croitre sur le rythme actuel, il suffit de construire des centrales nucléaires. C'est d'ailleurs l'essence du plan pour l'énergie de notre renouveau président. Alors causons un peu croissance énergétique et centrales nucléaires.
par Haekel