Introduction De L'intelligence Artificielle, Qui Apprend Indépendamment Aux Robots à Marcher - Vue Alternative

Introduction De L'intelligence Artificielle, Qui Apprend Indépendamment Aux Robots à Marcher - Vue Alternative
Introduction De L'intelligence Artificielle, Qui Apprend Indépendamment Aux Robots à Marcher - Vue Alternative

Vidéo: Introduction De L'intelligence Artificielle, Qui Apprend Indépendamment Aux Robots à Marcher - Vue Alternative

Vidéo: Introduction De L'intelligence Artificielle, Qui Apprend Indépendamment Aux Robots à Marcher - Vue Alternative
Vidéo: Robotique : Les Bases - Technologie Collège - Mathrix 2024, Mai
Anonim

Pour qu'un mécanisme robotique apprenne à marcher, il ne suffit pas de lui «attacher» plusieurs jambes. Apprendre à bouger est un processus très complexe qui prend beaucoup de temps aux développeurs. Mais maintenant, ce problème sera résolu par l'intelligence artificielle, car un groupe d'experts a créé des algorithmes universels qui aident l'IA à apprendre aux robots de n'importe quelle configuration à se déplacer. Dans ce cas, une intervention humaine dans ce processus n'est pas nécessaire.

Image
Image

Derrière le développement se trouvent une équipe de scientifiques de l'Université de Californie à Berkeley et un groupe d'experts de Google Brain, l'un des bras de recherche de Google sur l'intelligence artificielle. Leur nouveau système a entraîné le robot à quatre pattes à traverser à la fois des terrains familiers et des terrains inconnus.

L'apprentissage par renforcement est essentiellement une méthode de la carotte et du bâton adaptée à l'IA. Il utilise une récompense ou une punition pour avoir atteint ou non des objectifs.

Pour des expériences, les scientifiques ont pris le robot Minitaur. Ils ont développé un système qui consistait en une station de travail qui mettait à jour les données du réseau neuronal, chargeait les informations dans Minitaur et les déchargeait. La puce NVIDIA Jetson TX2 à bord du robot était responsable du traitement de l'information. Le robot a marché pendant 2 heures et a fait 160000 pas. Pendant ce temps, l'algorithme a récompensé le robot pour avoir avancé et l'a puni s'il restait bloqué en place ou s'il donnait un très gros rouleau sur le côté. En conséquence, un algorithme de mouvement a été créé qui a permis au robot de choisir la trajectoire de mouvement optimale dans n'importe quelle situation.

Vladimir Kuznetsov