Pe măsură ce câștigarea depinde de intuiția unei funcții matematice, AIs întâmpină dificultăți. Un articol recent publicat în Machine Learning detaliază o întreagă categorie de jocuri în care metoda utilizată pentru a antrena AlphaGo și AlphaChess eșuează. Aceste observații sunt importante în contextul în care tot mai mulți oameni se bazează pe contribuțiile IA pentru o gamă largă de probleme, conform arstechnica.com.
👉 Deficiențe în metodele Alpha pentru jocurile de strategie
Cu seria Alpha de jocuri AI, grupul DeepMind de la Google părea că a găsit o modalitate prin care AIs pot aborda orice joc, stăpânind jocuri precum șahul și Go prin repetarea jocului cu sine în timpul antrenamentului. Totuși, au apărut lucruri ciudate când oamenii au început să identifice poziții Go care ar pierde în fața unor noi veniți, dar care învingeau ușor un AI de Go similar. Deși înfrângerea unui AI la un joc de masă poate părea relativ trivială, poate ajuta la identificarea modurilor în care AI-ul eșuează sau a modurilor prin care putem îmbunătăți antrenamentul pentru a evita dezvoltarea acestor puncte orb, care pot deveni critice pe măsură ce oamenii se bazează pe AI pentru diverse probleme.
👉 Structura și semnificația jocului Nim
Un exemplu critic este un joc numit Nim, în care doi jucători își iau când unul dintr-un set de bețe dintr-un tablou în formă de piramidă, până când unul rămâne fără mișcare legală. Nim constă în configurarea unui set de rânduri de bețe, cu rândul superior având un singur băț iar fiecare rând inferior având cu două mai mult decât cel de deasupra. Acest lucru creează un tablou în formă de piramidă. Jucătorii își iau câte un băț dintr-un rând ales, îndepărtând de la unu la întreaga conținută a rândului, până când nu mai sunt mișcări legale. Este un joc simplu care poate fi ușor explicat copiilor.
Importanța jocului Nim derivă dintr-o teoremă care arată că orice poziție într-un joc imparțial poate fi reprezentată printr-o configurație a unei piramide Nim. Asta înseamnă că, dacă ceva se aplică la Nim, se aplică la toate jocurile imparțiale. Caracteristica distinctivă a jocului Nim și a altor jocuri imparțiale este că, la orice moment al jocului, este ușor de evaluat tabloul și de determinat care jucător are potențialul de a câștiga. Cu alte cuvinte, poți evalua tabloul și știi că, dacă joci mișcările optime de acum încolo, probabil vei câștiga.
Lucrările recente realizate de Bei Zhou și Soren Riis pun o întrebare simplă: Ce se întâmplă dacă iau abordarea AlphaGo pentru a antrena un AI să joace Nim? Ei au analizat dacă un AI ar putea dezvolta o reprezentare a unei funcții de paritate doar prin jocul cu sine. AlphaZero, versiunea de șah, a fost antrenată doar din regulile șahului și prin jocul cu sine are capacitatea de a asocia diferite configurații ale tabloului cu o probabilitate de câștig.
Cu toate acestea, în jocul Nim, numărul de mutări optime pentru o configurație dată a tabloului este limitat. Dacă nu joci una din ele, îți cedezi controlul adversarului, care poate câștiga dacă joacă doar mutări optime. Zhou și Riis au descoperit că pentru un tablou Nim cu cinci rânduri, AI-ul s-a descurcat bine destul de repede și a continuat să se îmbunătățească după 500 de iterații de antrenament. Adăugând doar un rând în plus, însă, rata de îmbunătățire a încetinit dramatic. De fapt, pentru un tablou cu șapte rânduri, îmbunătățirile în performanță s-au oprit practic după ce AI-ul s-a jucat cu sine de 500 de ori.
În concluzie, Nim necesită ca jucătorii să învețe funcția de paritate pentru a juca eficient. Procedura de antrenament care funcționează bine pentru șah și Go nu poate face acest lucru. Aceasta este o indicație că jocurile ca Nim sunt ciudate, dar Zhou și Riis au găsit semne că probleme similare ar putea apărea și la AI-urile care joacă șah, identificând mutări „greșite” care au fost inițial evaluate foarte bine de evaluatorul tabloului AI-ului. Sugestia lor este că, deși șahul nu are aceleași probleme, configurațiile de tip Nim sunt în general rare. Aceasta conduce la o concluzie alarmantă, sugerând un „mod de eșec catastrofal tangibil” în abordările curente de antrenare a IA-urilor.
Pentru mulți, explorarea utilității AIs în probleme matematice care necesită raționament simbolic este fundamentală, iar înțelegerea metodelor care nu funcționează poate fi la fel de valoroasă.