Je vous propose ici quelques réflexions sur la différence entre l’approche humaine des échecs et celle des ordinateurs en utilisant comme exemple une des parties de la finale TCEC 2018, à la 42ème ronde, remportée par Stockfish (avec les Blancs) contre la défense Française de Komodo.
J’ai choisi une défense Française car cette ouverture semi-ouverte convient bien à une approche stratégique plutôt qu’à l’exploitation d’une grande variété de suites tactiques plus ou moins forcées et, contrairement à certaines ouvertures fermées ou semi-fermées, elle ne nous oblige pas à démêler tout un écheveau de possibles transpositions piégeuses.
Pour comprendre comment jouer la Défense Française, la meilleure référence de base reste l’ouvrage déjà ancien du champion américain R. Fine Les idées cachées dans les ouvertures d’échecs (éd. Payot, 1971 pour la traduction française, mais l’original date de 1943) que tout amateur voulant développer sa compréhension stratégique devrait avoir lu, relu et médité, de même que Mon Système d’A. Nimzowitsch et aussi le Cours scientifique d’échecs de R. Réti. Comme tous les ouvrages déjà anciens, le livre de Fine n’est pas à jour quant à l’évaluation de certaines variantes, mais d’un point de vue strictement stratégique, il reste une référence de base absolument essentielle.
Que nous dit Fine à propos de la Française ?
« La plupart des ennuis des Noirs naissent du manque de développement de leur Fou-Dame. Les Blancs cherchent généralement à prendre avantage de ce manque d’espace vital en attaquant l’aile-Roi tout en maintenant une pression paralysante sur le centre ; la défense des Noirs consiste en une percée au centre et un développement judicieux […] le coup c5 est vital pour les Noirs dans la défense Française […] Tant que les pions Blancs restent en d4 et e5, le Fou-Dame Noir est enfermé et le Cavalier privé de sa meilleure case. »
Vis-à-vis de ces principes stratégiques, il faut être conscient qu’un ordinateur n’a pas de stratégie et ne suit aucun plan, sauf peut-être au début d’une partie lorsqu’il joue des coups prédéfinis par sa bibliothèque d’ouverture (limitée à 8 coups de profondeur dans ce tournoi), car ces coups résultent en grande partie de l’expérience et des meilleures pratiques des champions humains.
Le programme recherche à chaque coup un optimum tactique dans l’arborescence des coups possibles. Sa puissance de calcul peut parfois donner l’impression qu’il sait jouer positionnellement ou sacrifier du matériel pour un avantage à plus long terme, mais c’est une illusion : l’ordinateur n’est capable d’optimiser son jeu qu’à concurrence de sa profondeur d’exploration de cette arborescence, et ses performances sont limitées par ce que l’on appelle l’effet d’horizon du calcul. L’ordinateur choisit un coup à jouer d’après la valeur de sa fonction d’évaluation qui combine l’évaluation matérielle (conventionnellement, +1 représente un avantage équivalent à un pion, +3 1/4 à une pièce mineure, + 5 à une Tour et +10 à une Dame) et d’autres facteurs (espace contrôlé, mobilité des pièces, état de la structure de pion etc.) La différence de performance entre programmes dépend essentiellement de la capacité de leurs créateurs à prendre en compte correctement un maximum de facteurs d’évaluation de la position et à élaguer efficacement l’arborescence à explorer en se concentrant sur les branches les plus prometteuses. Conventionnellement toujours, l’évaluation passe à +1000 lorsqu’un mat apparaît à l’horizon.
Pour ceux qui veulent approfondir l’étude de cette ouverture particulière sans se noyer dans toutes les variantes possibles et imaginables, la monographie du maître russe B. Zlotnik La Défense Française (éd. Garnier 1986) est un excellent livre. C’est en nous référant aux judicieux conseils stratégiques de Fine et aux principales lignes d’analyses proposées par Zlotnik que nous parcourerons du haut de notre propre médiocrité humaine la partie qui suit, sans nous laisser impressionner par les Elo stratosphériques des deux programmes qui s’affrontent...
Je ne dispose évidemment pas des évaluations réalisées par les programmes au cours de la partie, seulement des évaluations fournies dans la Chessbomb Arena par Stockfish 8, le « petit frère » du programme qui joue ici, mais cela suffira pour illustrer mon propos.
Stockfish 180614 - Komodo 12.1.1
1-0
TCEC Season 12 SuperFinal round 42
1. e4 e6 2. d4 d5 3. Nc3 Nf6 4. Bg5 Be7
Les Noirs renonçent à la contre-attaque immédiate (variante McCutcheon) 4… Fb4
5. e5 Nfd7 6. h4 h6
Choisissant la variante d’avance, qui est la plus gênante pour les Noirs car la plus restrictive pour leur développement, les Blancs se lancent ensuite dans l’attaque Alekhine-Chatard, une des suites les plus tendues ; les Noirs refusent le sacrifice du pion h et préfèrent déloger le Fou par h6, ce qui n’est pas un coup stratégique humain et ne me semble pas une bonne idée… mais les ordinateurs n’ont pas d’idées !
Dans l’ouvrage de Zlotnik, h6 n’est d’ailleurs pas envisagé : les coups humains traditionnels sont f6 ou surtout c5 pour attaquer sans tarder la chaîne de pions blanche (de préférence d'abord à sa base plutôt qu’à sa pointe, donc plutôt par c5 que par f6) ou le plus positionnel a6 destiné à prévenir l’arrivée d’une pièce blanche en b5. (J’ai réussi – une seule fois – à battre Junior 6 il y a une vingtaine d’années en jouant a6 !)
7. Be3 c5 8. Qg4 Kf8
Toujours d’un point de vue stratégique humain, jouer c5 seulement maintenant fait apparaître h6 comme une perte de temps et surtout comme un affaiblissement inutile de l’aile-Roi : le Dg4 des Blancs est en revanche un coup thématique typique qui empêche le petit roque (sous peine du gain de la qualité par Fh6 forçant g6) ; pour défendre g7, le coup suivant Kf8 accepte de perdre le roque ce qui est un autre affaiblissement stratégique des Noirs, qui ne pourront plus établir aisément la communication entre leurs tours, et c’est une conséquence du premier affaiblissement consenti par h6 (l’alternative de jouer g6 pour conserver le droit au petit roque est probablement encore plus affaiblissante).
La fonction d’évaluation de Stockfish 8 ne donne à ce stade de la partie qu’une égalité complète à 0, mais beaucoup de joueurs humains préféreraient déjà la position blanche, plus facile à jouer avec la poursuite de l’attaque thématique à l’aile-Roi, combinée avec des coups naturels de développement sur l’aile Dame.
9. f4 h5
au lieu de poursuivre leur développement, les Blancs jouent un nouveau coup thématique de pion (servant à soutenir e5 après l’échange prévisible en d4) et, pour chasser la Dame de la colonne g, les Noirs isolent maintenant leur pion h, ce qui en fait une cible potentielle à long terme pour les Blancs. On voit bien qu’il n’y a ici aucune pensée stratégique, ce qui ne veut pas dire que ces coups soient intrinsèquement mauvais, en ce sens qu’ils ne détériorent pas la position au point d’offrir à l’adversaire l’opportunité d’acquérir un avantage matériel immédiat, mais ils ne semblent pas judicieux du point de vue de l’expérience humaine du jeu et sont à mon avis très représentatifs du manque total de vision stratégique de ces super-programmes.
Et pourtant, la force brute de calcul des programmes d’aujourd’hui fait qu’ils ne commettent aucune erreur tactique visible à un horizon de 5 ou 6 coups, même et surtout dans des positions complexes et très tendues, ce qui est largement suffisant pour battre n’importe quel joueur humain...
10. Qh3 cxd4 11. Bxd4 Nc6 12. Nf3 Nxd4 13. Nxd4 Nb8
les échanges en d4 sont classiques ; pour les Blancs, concéder la paire de Fous n’est pas ici un problème stratégique, vu l’absence durable de rayonnement du Fou-Dame des Noirs. La manœuvre du Cavalier d7 via b8 pour aller réoccuper c6 coûte un temps, ce qui ne plairait pas au grand stratège attentif au facteur temps qu’était Réti.
14. O-O-O Nc6 15. Nb3 a5 16. a4 Bd7 17. g4 Rc8 18. gxh5 Nb4 19. Rd2 Rxh5 20. Qe3 Bc6 21. Rh3 Kg8
Le grand roque des Blancs incite les Noirs à attaquer sur l’aile-Dame alors que les Blancs se redéploient à l’aile-Roi, ce qui est stratégiquement assez logique, même si cela découle d’une fonction d’évaluation qui demeure purement tactique. On verra plus loin que le coup a5 des Noirs était une mauvaise idée : pousser ce pion sans disposer d’autres moyens d’attaque que le Cavalier les affaiblit sans leur donner suffisamment de contre-jeu.
Après le 21ème coup noir, la fonction d’évaluation de Stockfish 8 atteint +0.6 ce qui représente assez correctement un avantage Blanc, mais le coup suivant qui est un coup assez naturel de développement attaquant la Tour h fait retomber l'évaluation à 0, ce qui me semble anecdotique : le déjà net avantage positionnel des Blancs n’a évidemment pas disparu (morale de l’histoire : ne devenez pas esclave des fonctions d’évaluation ; leur précision à deux chiffres est totalement illusoire et elles peuvent fluctuer d’un demi-point voire plus sans que cela ne signifie forcément grand-chose d’un point de vue stratégique) ; Stockfish 8 recommande à son grand frère de jouer plutôt Kb1 à la place de Be2, mais en l’absence de pression significative des Noirs sur l’aile Dame, les Blancs n’ont en fait aucune urgence à déplacer leur Roi (c’est le genre de petit coup d’amélioration de la position qu’on peut utilement garder en réserve)
22. Be2 Rh6
Stockfish 8 critique ce coup qui ramène son évaluation à +0.68 et propose à la place la suite 22... Rxh4 23. Rxh4 Bxh4 24. Qg1 g6 25. Nb5 Qf8 26. Kb1 Bxb5 27. Bxb5 Qh6 28. Qh2 Nc6 29. Rd3 Nb4 30. Rd2 ; ici, les Noirs ont gagné le pion h, d’où une évaluation finale à 0. Mais cette approche étroitement matérialiste est à mon avis trompeuse : ouvrir la colonne h (ce qui reviendrait à accepter à retardement le gambit refusé en début de partie) alors que le Roi est en g8 et que les Blancs ont roqué de l’autre côté paraîtrait trop dangereux à un joueur humain normalement constitué et il semble donc plus naturel de ne pas prendre le risque de jouer Txh4, même si cela semblerait rétablir globalement l’équilibre grâce au petit avantage matériel.
D’autre part, ce saut brusque de l’évaluation à +0.68 pourrait sembler important, et l’indice d’un coup inférieur, mais ce n’est en réalité qu’un retour à l’évaluation antérieure de +0.6 ...
Après ce petit aparté illustrant les douteuses fluctuations de la fonction d’évaluation, il est intéressant de suivre la progression quasi-continue de la fonction d’évaluation de Stockfish 8 après chaque coup des Noirs, comme si le programme prenait petit à petit conscience de l’infériorité de leur position:
23. h5 Kh8 (+0.68) 24. Rg3 Qc7 (+0.83) 25. Kb1 Bd7 (+0.99) 26. Qg1 Rg8 (+1.04)
27. Nb5 Qc8 (+0.97) 28. Qb6 Nc6 (+1.2) 29. Rd1 Qb8 (+1.19) 30. Rdg1 Be8 (+1.6)
Dans ce milieu de partie, le parallèle entre les deux joueurs est saisissant : le Roi Noir est acculé dans un coin, avec ses deux Tours commises à sa défense. Les Noirs en sont réduits à multiplier des coups de Dame sur la 1ère rangée, et des coups de repli de leurs pièces mineures (Nc6, Be8) parce qu’ils n’ont plus que des mauvais coups à leur disposition (c’est ce que l’on appelle une situation de zugzwang, assez facile à détecter pour un joueur humain, mais impossible à « comprendre » pour un programme). Ils restent bloqués à l’aile Dame et paralysés au centre alors que les Blancs renforcent méthodiquement leur attaque à l’aile Roi et continuent de gagner de l’espace (montée du Cavalier en b5, parce que les Noirs ont trop goulûment joué le coup anti-stratégique a5 au lieu du prophylactique a6 ; doublement des Tours sur la colonne g ; multiplication des menaces sur les deux ailes par la Dame qui navigue entre g1, e3 et b6.)
Au 30ème coup, les Noirs sont déjà complètement asphyxiés et leur partie est perdue, ce que reflète bien la fonction d’évaluation (qui atteindra 2,29 au 38ème coup, reflétant la prise possible de la Tour g8 par le Fou e6). Avant d’en arriver là, un joueur humain tenterait le tout pour le tout en sacrifiant un voire deux pions centraux pour trouver enfin du contre-jeu et essayer de valoriser sa paire de Fous, mais un programme d’ordinateur ne fonctionne pas comme ça...
31. Qe3 f6 (+1.46) ; 32. Nc1 Bf7 (+1.29) ; 33. Nd3 Bf8 (+1.57) ; 34. c3 Rh7 (+1.22) ;35. f5 fxe5 (+1.44) ; 36. fxe6 Bxe6 (+1.7) ; 37. Rg5 Bd7 (+1.76) ; 38. Bg4 Be8 (+2.29)
La fin de partie se passe de commentaires, la liquidation finale opérée sans laisser le moindre contre-jeu aux Noirs est digne d’un Joël Lautier de la grande époque :
39. Be6 Be7 40. R5g3 Bxh5 41. Bxd5 g5 42. Bxg8 Qxg8 43. Nxe5 Qe6 44. Nxc6 Bg6+ 45. Kc1 Qxc6 46. Nd4 Qe4 47. Qxe4 Bxe4 48. Ne6 Bd5 49. Nxg5 Rh5 50. Rg4 b6 51. Ne4 Bf7 52. Kd2 Rd5+ 53. Kc2 Rf5 54. c4 Rh5 1-0