IA - Les origines

Que s’est-il passé lors du fameux 37e coup de la seconde partie ?

A

Lee Sedol a abandonné, déclarant par la suite “L’IA est désormais trop forte et mon esprit trop faible”

A

Lee Sedol a abandonné, déclarant par la suite “L’IA est désormais trop forte et mon esprit trop faible”

B

AlphaGo a commis ce qui semblait une erreur et s’est finalement révélé être un coup de génie

B

AlphaGo a commis ce qui semblait une erreur et s’est finalement révélé être un coup de génie

C

AlphaGo, qui était en mauvaise posture, a triché, sans que Lee Sedol s’en aperçoive

C

AlphaGo, qui était en mauvaise posture, a triché, sans que Lee Sedol s’en aperçoive

D

Lee Sedol a réalisé un coup extrêmement créatif qui a fait bugger le programme qui a fini par abandonner

D

Lee Sedol a réalisé un coup extrêmement créatif qui a fait bugger le programme qui a fini par abandonner

E

E

F

F

Développez vos connaissances avec Polaris.
Retrouvez ici tous nos quiz apprenants en accès libre.

AlphaGo

Commençons par présenter le jeu de go.

C’est un jeu de stratégie ancien originaire de Chine, pratiqué sur un plateau carré (goban) quadrillé de 19 lignes par 19 colonnes. Deux joueurs s'affrontent, l'un avec des pierres noires, l'autre avec des pierres blanches, en posant à tour de rôle une pierre sur les intersections du plateau. L'objectif est de contrôler le plus grand territoire possible en entourant des zones vides avec ses pierres et en capturant les pierres adverses en les entourant complètement.

Les règles sont simples, mais le jeu est reconnu pour sa profondeur stratégique, offrant une infinité de possibilités de jeu. Quand les échecs offrent en général une vingtaine de coups possibles à chaque tour, le jeu de go lui en propose jusqu’à 361 ! Même pour un ordinateur il est impossible de simuler tous les coups possibles.

De fait, AlphaGo est très différent de DeepBlue, puisqu’il utilise les réseaux neuronaux du deep learning (l’approche connexionniste si vous avez un doute !). Au départ, seules les règles du jeu ont été intégrées au programme. Selon les principes du machine learning, AlphaGo a donc d’abord été nourri par des dizaines de milliers de parties amateurs - et a ainsi appris à jouer. Puis AlphaGo s’est entraîné en jouant contre lui-même.

Lors du 37e coup de la deuxième partie, AlphaGo a joué un coup qui apparaissait comme une erreur absolument grossière à tous les spécialistes - qui le prirent pour un bug. Lee Sedol demeura lui-même circonspect pendant de longs instants (voir la vidéo ci-dessous, 1'). Ce coup s’est révélé d’une créativité inouïe et permis à AlphaGo de remporter cette partie. Il marque un tournant : l'IA n'est plus uniquement une force brute, elle peut désormais nous surprendre.

Le développement d’AlphaGo illustre de manière percutante les progrès exponentiels que peut réaliser une intelligence artificielle. Ainsi, un an après sa victoire contre Lee Sedol, DeepMind annonce un nouveau développement, AlphaGo Zero. Ce programme utilise une architecture simplifiée et part d’une connaissance nulle du jeu (uniquement les règles). Jouant uniquement contre lui-même, il atteint le niveau débutant en trois heures. Il bat 100 à 0 la version ayant battu Lee Sedol après 72 heures.