L'intelligence Artificielle A Appris à Reconnaître Correctement La Parole Parmi Le Bruit - Vue Alternative

L'intelligence Artificielle A Appris à Reconnaître Correctement La Parole Parmi Le Bruit - Vue Alternative
L'intelligence Artificielle A Appris à Reconnaître Correctement La Parole Parmi Le Bruit - Vue Alternative

Vidéo: L'intelligence Artificielle A Appris à Reconnaître Correctement La Parole Parmi Le Bruit - Vue Alternative

Vidéo: L'intelligence Artificielle A Appris à Reconnaître Correctement La Parole Parmi Le Bruit - Vue Alternative
Vidéo: C’est quoi l’intelligence artificielle ? Découvrir #1 2024, Mai
Anonim

Les assistants virtuels et les systèmes de reconnaissance vocale ont appris à «reconnaître» ce qu'une personne leur dit et à suivre ses commandes. Mais pour le bon fonctionnement des mêmes Siri et Cortana, les bruits parasites peuvent être un gros problème. Pour faire face à cette faille technique, les experts de Mitsubishi Electric, qui ont présenté une nouvelle technologie pour séparer le discours d'une personne du bruit général, peuvent aider.

La technologie de l'entreprise japonaise s'appelle Deep Clustering, dont le fonctionnement repose sur les principes de l'apprentissage automatique. Pour commencer, l'intelligence artificielle a appris à séparer indépendamment le discours d'une personne du flux général de divers sons et bruits. Le réseau neuronal sépare les données audio entrantes en divers éléments et analyse chacun séparément, après quoi il peut déjà traiter la voix humaine. Un travail similaire est observé lorsque deux ou plusieurs interlocuteurs sont «connectés».

Lors d'une démonstration de la technologie par une entreprise japonaise, le système a réussi à séparer le discours de deux personnes parlant la même phrase dans différentes langues dans un seul microphone. Tous les traitements ont été effectués en temps réel et le délai n'a pas dépassé trois secondes. La précision de la reconnaissance était de 90%, et lorsque trois personnes ont commencé à parler dans le microphone, le pourcentage de «coups» est tombé à 80, ce qui est également un bon résultat. Selon les auteurs du projet Anthony Vetro et Yohei Okato,

«Contrairement à séparer la parole des bruits de fond, séparer le discours d'une personne du bruit de« voix »des personnes qui parlent en même temps est une tâche très difficile, car les sons des voix de différentes personnes ont beaucoup de particularités. Dans la plupart des systèmes, le problème de la séparation de la voix est résolu en installant deux microphones ou plus, mais dans le cas de l'utilisation d'un seul microphone, seule l'intelligence artificielle peut faire face à la tâche de séparation de la voix. Cette technologie peut être utilisée partout où une haute précision de reconnaissance des messages vocaux est requise. Par exemple, dans les systèmes de commande vocale pour voitures, ascenseurs, appareils ménagers et autres appareils électroniques."

VLADIMIR KUZNETSOV