Comment Fonctionne L'intelligence Artificielle: Reconnaissance Vocale - Vue Alternative

Table des matières:

Comment Fonctionne L'intelligence Artificielle: Reconnaissance Vocale - Vue Alternative
Comment Fonctionne L'intelligence Artificielle: Reconnaissance Vocale - Vue Alternative

Vidéo: Comment Fonctionne L'intelligence Artificielle: Reconnaissance Vocale - Vue Alternative

Vidéo: Comment Fonctionne L'intelligence Artificielle: Reconnaissance Vocale - Vue Alternative
Vidéo: Chronique - Comment ça Marche ? La reconnaissance vocale, comment ça marche ? 2024, Septembre
Anonim

Chacun de nous est confronté à un phénomène aussi mystérieux que l'intelligence artificielle dans la vie de tous les jours - c'est lui qui permet aux assistants vocaux et aux moteurs de recherche de reconnaître la parole humaine et de deviner les désirs des utilisateurs. Aujourd'hui, nous parlerons exactement du fonctionnement de cette technologie et des perspectives qui attendent ce domaine de développement dans un avenir proche.

L'intelligence artificielle est un terme très large, dans lequel de nombreux algorithmes existent déjà et sont encore en cours de développement, conçus pour effectuer un large éventail de tâches pratiques. Mais de quoi les programmes d'intelligence artificielle modernes sont-ils réellement capables et sur quels principes sont-ils guidés pendant leur travail? Aujourd'hui, nous allons parler de l'une des principales caractéristiques de l'esprit machine, que chacun de nous rencontre régulièrement dans la vie quotidienne - la capacité des assistants vocaux à reconnaître la parole humaine.

Reconnaissance vocale

Pour mesurer la voix, le programme utilise un certain nombre de paramètres sonores: la fréquence et la longueur de l'onde sonore à un moment donné. Par exemple, lorsque vous parlez à l'assistant vocal populaire Alexa, le logiciel divise votre voix en diapositives de 25 millisecondes, puis convertit chacun des segments en signatures numériques. Après cela, les blocs de signature sont comparés au catalogue interne des sons du programme jusqu'à ce que le nombre de correspondances soit suffisamment élevé pour que l'IA «traduise» les nombres en une requête alphabétique qu'elle comprend.

Image
Image

Surveillez l'écran de votre téléphone lorsque vous utilisez Siri ou Google Assistant et vous verrez que le vocabulaire change lorsque vous prononcez les mots. Cela est dû au fait qu'à chaque "étape" suivante, le logiciel compare également le résultat obtenu avec la base de données interne et construit des mots en fonction des correspondances. Selon Rohit Prasad, scientifique en chef de la division Alexa d'Amazon, «le modèle de langage apprend plusieurs milliards de mots sous forme de texte». L'ordre des mots joue également un rôle important: cela peut être remarqué à l'aide du moteur de recherche habituel de Google, qui donne parfois des données différentes pour des requêtes identiques, dans lesquelles seuls quelques mots sont réorganisés.

Vidéo promotionelle:

Perspectives de la reconnaissance vocale

Alan Black du Carnegie Institute for Language Technology soutient que pour tous les professionnels des grandes entreprises, le plus intéressant est de trouver la limite de leur propre système. «Quand le programme dit:« Je ne peux pas faire ça », alors la situation devient vraiment intéressante», plaisante-t-il. Cependant, c'est effectivement le cas: répondre aux demandes imprévisibles des utilisateurs est même l'une des principales tâches sur lesquelles les cercles d'étudiants qui se disputent le prix Alexa - et cela représente jusqu'à 2,5 millions de dollars - étudient. Leur tâche est de créer un chatbot conçu pour communiquer avec des personnes qui posent des questions cohérentes et significatives. Les informations dans ce cas sont mises à jour toutes les 20 minutes. Cela semble être une tâche assez facile, même pour un programmeur moyen,mais dans la pratique, la communication du programme avec de vraies personnes est toujours associée à des écarts par rapport au sujet du dialogue, à des phrases spontanées et à d'autres violations. Un programme qui apprend à travailler avec eux ainsi qu'avec une personne réelle constituera une avancée majeure pour l'ensemble de l'industrie de l'IA.

Vasily Makarov