Les Scientifiques Ont Formé Un Réseau Neuronal Pour Déterminer Le Sexe D'une Personne à Partir Du Texte écrit - Vue Alternative

Les Scientifiques Ont Formé Un Réseau Neuronal Pour Déterminer Le Sexe D'une Personne à Partir Du Texte écrit - Vue Alternative
Les Scientifiques Ont Formé Un Réseau Neuronal Pour Déterminer Le Sexe D'une Personne à Partir Du Texte écrit - Vue Alternative

Vidéo: Les Scientifiques Ont Formé Un Réseau Neuronal Pour Déterminer Le Sexe D'une Personne à Partir Du Texte écrit - Vue Alternative

Vidéo: Les Scientifiques Ont Formé Un Réseau Neuronal Pour Déterminer Le Sexe D'une Personne à Partir Du Texte écrit - Vue Alternative
Vidéo: Intelligence Artificielle [12.13] : Apprentissage automatique - exemple de réseau de neurones 2024, Mai
Anonim

Une équipe de scientifiques de l'Université nationale de recherche nucléaire "MEPhI", du Centre national de recherche "Kurchatov Institute" et de l'Université d'État de Voronej a développé une méthode qui enseigne à un ordinateur à reconnaître le sexe d'une personne à partir d'un texte écrit par lui avec une précision de 80%. Le développement scientifique appartient au domaine de la linguistique computationnelle. La recherche a été réalisée grâce à une subvention de la Russian Science Foundation. Les résultats sont publiés dans la revue Procedia Computer Science.

De nombreuses études scientifiques montrent qu'un texte écrit reflète inévitablement les caractéristiques de son auteur - sexe, caractéristiques psychologiques, niveau d'éducation. La parole est un outil de psychodiagnostic précieux utilisé par les spécialistes des ressources humaines des grandes entreprises, ainsi que par les services de sécurité.

Sur la base de l'analyse de la parole, il est possible de diagnostiquer la présence de certaines maladies chez une personne (démence, dépression) et une tendance au comportement suicidaire. La nécessité d'établir les caractéristiques de l'auteur du texte croît également avec le développement des communications Internet: il est important pour les entreprises de savoir quels groupes de personnes aiment leurs produits et services.

Les scientifiques travaillant dans ce sens (linguistes, psychologues, spécialistes des technologies de l'information), à partir des valeurs numériques de divers paramètres du texte, construisent des modèles mathématiques pour diagnostiquer certains paramètres de la personnalité.

Une équipe d'experts a analysé l'efficacité de diverses technologies d'apprentissage automatique en utilisant des réseaux de neurones pour l'analyse de texte.

Au cours de l'étude, ils ont comparé la précision de la résolution du problème de l'identification de genre des textes en se basant sur deux approches de la modélisation basée sur les données: d'une part, les algorithmes d'apprentissage automatique (support vector machine et gradient boosting), d'autre part, les réseaux de neurones d'apprentissage profond (réseaux de neurones convolutifs et réseaux neuronaux récurrents avec mémoire à court terme).

«Nous avons obtenu des résultats élevés dans la détermination du sexe de l'auteur du texte grâce à des modèles de réseaux de neurones avancés, dans des conditions où l'auteur ne cache pas son sexe. La tâche suivante est de déterminer le sexe en fonction de sa dissimulation intentionnelle », explique Alexander Sboev, professeur associé au NRNU MEPhI.

Ainsi, dans les textes suivants, postés initialement sur un site de rencontre, le réseau de neurones trouve facilement une prise dans dix cas sur dix, d'ailleurs, l'auteur met délibérément le nom du sexe opposé dans la signature.

Vidéo promotionelle:

Le texte a été écrit par une fille: «Je suis un homme beau et musclé de 30 ans. Je travaille pour une grande société pétrolière et gazière dans une bonne position avec un salaire décent. Je vis dans mon propre appartement à Moscou. La propriété dispose également d'une petite mais jolie maison dans l'un des villages d'Italie. J'aime le sport, en particulier le football. J'adore sortir le week-end, je déteste rester à la maison. Une fille qui me conviendrait devrait avoir une disposition modeste, une belle apparence et une silhouette attrayante selon les normes modernes. Elle devrait partager mes intérêts, ne devrait pas être jalouse et ne devrait pas essayer de me rendre jalouse. Je ne vais pas soutenir la fille, car je pense que les deux devraient travailler dans la famille. Je préfère également garder le budget séparément. Je ne tolérerai pas la trahison."

Le texte a été écrit par un homme: «Bonjour! Je suis extrêmement malheureux, extrêmement! Pourquoi vous comportez-vous ainsi avec nous?! Nous sommes des personnes aussi, nous sommes tous égaux! Êtes-vous sexiste? Je ne prendrai plus ça! Je vais casser ta voiture partout, la peindre. Attends, inhumain. Je finirai de cette façon."

Les résultats de cette étude ont montré qu'une approche basée sur l'utilisation de réseaux de neurones convolutifs et de méthodes d'apprentissage en profondeur pour reconnaître le sexe de la personne qui a écrit le texte est la plus optimale.

Aujourd'hui, un groupe de chercheurs travaille sur le problème de la reconnaissance de l'âge.

Recommandé: