L'IA A Appris Indépendamment à Jouer Aux échecs à Un Niveau Surhumain En Une Journée - Vue Alternative

L'IA A Appris Indépendamment à Jouer Aux échecs à Un Niveau Surhumain En Une Journée - Vue Alternative
L'IA A Appris Indépendamment à Jouer Aux échecs à Un Niveau Surhumain En Une Journée - Vue Alternative

Vidéo: L'IA A Appris Indépendamment à Jouer Aux échecs à Un Niveau Surhumain En Une Journée - Vue Alternative

Vidéo: L'IA A Appris Indépendamment à Jouer Aux échecs à Un Niveau Surhumain En Une Journée - Vue Alternative
Vidéo: LES ÉCHECS - LE RIRE JAUNE 2024, Avril
Anonim

L'algorithme AlphaZero, sans enseignant humain, a maîtrisé les échecs et le jeu de shogi en 24 heures, de sorte qu'il a battu d'autres programmes de champions qui avaient auparavant battu des gens sans condition.

Deep Mind, une société développant des algorithmes pour l'intelligence artificielle (IA), a publié des données sur les résultats du recyclage de l'algorithme AlphaGo pour jouer aux échecs et au shogi. Auparavant, AlphaGo était capable de battre les champions du monde dans le jeu de go. L'intelligence artificielle a réussi à maîtriser de nouveaux jeux encore plus rapidement. Le travail correspondant est publié sur le serveur de pré-impression de l'Université Cornell.

AlphaZero a utilisé une méthode d'apprentissage par renforcement. C'est un sous-type d'apprentissage automatique profond qui n'utilise pas un enseignant humain, mais exclusivement des jeux entre deux IA. Bien qu'au début les deux IA jouent très faiblement, en raison de leur vitesse élevée (par rapport à un enseignant humain), elles peuvent jouer à un grand nombre de jeux en peu de temps et sélectionner des mouvements éprouvés et leurs séquences dans certaines positions du tableau, ce qui donne la capacité des algorithmes d'augmenter leur niveau extrêmement rapidement.

Dans ce cas, AlphaZero a atteint un niveau de jeu plus élevé que n'importe quel joueur humain en seulement 24 heures. Ensuite, elle a été autorisée à jouer avec Stockfish, le meilleur joueur d'échecs disponible, et Elmo, le meilleur joueur de shogi (un jeu d'échecs hautement modifié au début du Japon médiéval).

Malgré une période d'entraînement très courte, AlphaZero a battu Stockfish 28 fois et a fait match nul 72 fois de plus. Elle a réussi à gagner 90 fois contre Elmo, à perdre 8 fois et à faire match nul 2 fois. Ce sont des résultats extraordinairement élevés. Les échecs et le shogi sont très différents du jeu pour lequel AlphaGo a été créé à l'origine, ainsi que l'un de l'autre. Par exemple, «les échecs japonais» implique des possibilités extrêmement exotiques, comme jouer n'importe laquelle des pièces «mangées» de l'ennemi. La victoire d'un algorithme créé pour Go uniquement en jouant avec un algorithme complètement identique signifie qu'un enseignant humain peut réaliser

IVAN ORTEGA

Recommandé: