Le go est un jeu de stratégie ancien, originaire de Chine, et pratiqué sur un plateau carré quadrillé de 19 lignes par 19 colonnes.
Deux joueurs s'affrontent, l'un avec des pierres noires, l'autre avec des pierres blanches, en posant à tour de rôle une pierre sur les intersections du plateau.
L'objectif est de contrôler le plus grand territoire possible en entourant des zones vides avec ses pierres et en capturant les pierres adverses en les entourant complètement.
Les règles sont simples, mais le jeu est reconnu pour sa profondeur stratégique, offrant une infinité de possibilités de jeu. Quand les échecs offrent en général une vingtaine de coups possibles à chaque tour, le jeu de go lui en propose jusqu’à 361 !
Même pour un ordinateur il est impossible de simuler tous les coups possibles.
De fait, AlphaGo est très différent de DeepBlue, puisqu’il utilise l’approche connexionniste et le machine learning.
Au départ, seules les règles du jeu ont été intégrées au programme. Selon les principes du machine learning, AlphaGo a donc d’abord été nourri par des dizaines de milliers de parties amateurs - et a ainsi appris à jouer.
Puis AlphaGo s’est entraîné en jouant contre lui-même.