screenshot Elite Dangerous
Winnend voordeel in het eindspel (1)
Zijn computeranalyses betrouwbaar? De vraag is: hoe zeker kunnen we zijn van zo’n evaluatie om effectief ervan uit te gaan dat een stelling effectief (objectief) gewonnen is of niet? Spoiler alert: niet.De betrouwbaarheid van computeranalyses – en meer bepaald de betrouwbaarheid van de evaluatie zelf was de insteek voor de vorige twee artikelen. Dit artikel was begonnen als een zoektocht naar voorbeelden in het eindspel, maar kreeg uitlopers naar opening en middenspel, omdat ik daar ook voorbeelden van vond. Misschien niet de meest representatieve, maar toch. Vandaar dit drieluik (hoewel ik veel meer voorbeelden van eindspelen heb). Alvorens we naar de eindspelen gaan, heb ik nog een recent gevonden voorbeeld van het middenspel.
Het gaat om de variant na 42.a6 (...) 45.fxg4, waarin de stelling (2r2rk1/p1b4p/PpPp2q1/1P1Pp1p1/5pP1/Q6P/1B2R1P1/4R2K b - - 0 45) dichtgeschoven wordt, en praktisch niet te winnen valt voor wit, tenzij zwart zich laat ringeloren. Leela laat zich niet van de wijs brengen en geeft een matige +0.43 voor wit. Rebel 16.3 vindt dit prima voor wit, met een evaluatie van +1.10 (30/56) en SF12 ziet ook nog bijna winst met +1.00. Patricia 5.0 (een engine die zeer agressief speelt) vindt dit ook een stelling om "door te spelen" met een evaluatie van +0.54 (44/57), terwijl ShashChess 39.1 (een zeer goede SF-kloon) hier +0.76 (34/59) aan geeft. SF18, die we uiteindelijk als de referentie mogen beschouwen, houdt het bij +0.03 (60/75), wat vermoedelijk de waarheid is.
Terug naar eindspelen. In Chess Life 2017/9 had Andrew Soltis een artikel over “stellingsbegrip” (door schaakprogramma’s). Je kan niet stellen dat 2017 prehistorie is in computerschaak, maar hij had toch snel een zestal stellingen waarbij de (pré-neurale netwerk) evaluaties in min of meerdere mate de mist in gingen. De huidige neurale netwerk-programma’s doen het veel beter, maar je kan je nog altijd vragen stellen bij de evaluaties van sommige stellingen.
De eerste stelling in het artikel van Soltis is een klassieker: een variant op loper en verkeerde randpion (of is het randpion en verkeerde loper?). 8/5nkP/8/8/8/6K1/2B3P1/8 w - - 0 1
Zelfs nu nog geeft SF17.1 (in lichess) deze stelling +0.8 (diepte 28/99) voor wit; ik vermoed dat hierin meegerekend is dat zwart in de praktijk toch nog kan mistasten (hij hoeft enkel Pf7-h8-f7 te spelen om remise te houden) en dat wit in sommige gevallen (als zwart te frivole zetten begint te spelen) wel nog kan winnen. Vergelijk het met een blitzpartij waarin zwart door zijn vlag gaat met enkel koning en randpion en wit enkel koning en paard: mat is mogelijk (door beide partijen). Maar objectief moet bij perfect spel van beide kanten de evaluatie niet 0.5 maar 0.0 zijn. Trouwens ook Fritz21 geeft wit hier nog +1.19 (22/74) en SF18 zelfs +0.97 (63/89). Ik moet toegeven dat ik dit in de praktijk ook nog wel zou proberen. Als je al twee pionnen kan veroveren tegen je tegenstander, dan mag je hopen dat er nog wel een foutje volgt. Zeker als je ziet wat Hans Niemann overkwam in een dame-eindspel in de tweede ronde van de Uzbek Cup.
https://lichess.org/broadcast/3rd-uzchess-cup-2026--masters/round-2/bTzR6pi8/FlZInfHy#0
Het is daarom bijna verrassend dat in de volgende stelling (8/8/6kp/8/5KP1/7P/8/8 w - - 0 1) (wit: Kf4, g4, h3; zwart: Kg6, h6) SF17, SF18 en Fritz21 wel 0.0 aangeven, hoewel zwart hier even goed kan misgrijpen. Of staat hier 0.0 omdat dit vijfstukkeneindspel wel als tbs beschikbaar is voor SF17.1 in Lichess? Ik denk eerder dat de reden is dat *alle* varianten kunnen uitgerekend worden tot remise.
En wat te denken van volgende stelling (1B6/8/p7/2pk1p1p/P2b4/3K1P1P/8/8 w - - 0 47)?
Dit lopereindspel evalueert SF17.1 in lichess als -0,7 (60/99) dus een mooi voordeel voor zwart, maar opnieuw, niet te winnen. SF18 op mijn laptop vindt dit aanvankelijk ook remise (eerste zet 1.Lc7), maar vanaf ongeveer zoekdiepte 60 gaat de evaluatie steeds meer richting voordeel zwart (1.Lc7: -0.94 bij 65/161), waarbij het einde van sommige varianten een eindspel toont waarbij zwart een loper en verkeerde randpion heeft tegen K alleen: nog net remise dus, maar vandaar waarschijnlijk de evaluatie van bijna -1. Fritz21 maakt het nog bonter en gaat tot -3.52 (39). We hebben weer Leela 0.32 nodig om hier "met kennis van zaken" (en een zeer groot netwerk) om ons met de voeten op de grond te houden: -1.33, meer niet. Fritz21 tot deze stelling gebracht is nog niet helemaal mee en scoort dit aanvankelijk zeer onstabiel (sterk wisselende evaluaties), om de stelling uiteindelijk -1.13 (27/91) te geven.
Uit bovenstaande voorbeelden moeten we toch besluiten dat actueel SF18 en Leela0.32 de beste engines zijn die het meest objectieve oordeel geven, maar elk met hun voorkeuren wat stellingen betreft. Diep rekenwerk vertrouw ik nog altijd toe aan SF18, een positioneel oordeel vraag ik aan Leela. Tot zover deze inleiding op de materie - later meer voorbeelden.
En de foto bij het artikel - gewoon: we komen in het eindspel, dus meer ruimte (space) ...