Comment Les Secrets Du Manuscrit De Voynich Sont Révélés: Une Enquête - Vue Alternative

Table des matières:

Comment Les Secrets Du Manuscrit De Voynich Sont Révélés: Une Enquête - Vue Alternative
Comment Les Secrets Du Manuscrit De Voynich Sont Révélés: Une Enquête - Vue Alternative

Vidéo: Comment Les Secrets Du Manuscrit De Voynich Sont Révélés: Une Enquête - Vue Alternative

Vidéo: Comment Les Secrets Du Manuscrit De Voynich Sont Révélés: Une Enquête - Vue Alternative
Vidéo: De l'ombre à la lumière - Le manuscrit indéchiffrable 2024, Mai
Anonim

Ce qui se cache derrière les nouvelles sensationnelles concernant le manuscrit de Voynich et les scientifiques russes, est-il possible de déterminer avec précision la langue du texte, à quel point les mathématiciens sont adéquats pour travailler sur le «champ» de la linguistique.

Le 19 avril, les médias russes ont diffusé des informations sur la découverte "historique" des mathématiciens russes: en utilisant la nouvelle méthode, les scientifiques ont non seulement prouvé la signification du célèbre "manuscrit de Voynich", mais ont également pu déterminer qu'il était écrit en deux langues et à l'exception des lettres pour les voyelles.

Le manuscrit de Voynich est un manuscrit médiéval illustré acheté en 1912 par l'antiquaire Wilfred Voynich. Créé au 15ème siècle (basé sur l'analyse radiocarbone du parchemin - mais la plupart des scientifiques à l'heure actuelle ne considèrent pas le texte lui-même comme une falsification ultérieure), il est écrit dans une langue inconnue en utilisant un alphabet inconnu. A en juger par les illustrations, le texte se compose de blocs thématiques: botanique, astronomique, pharmacologique et autres. La complexité du décodage du texte a fait du manuscrit de Voynich un «Saint Graal» pour les cryptographes et l'objet de nombreuses études, y compris celles utilisant les méthodes Big Data.

La nouvelle du manuscrit a été rapportée comme quelque chose de sensationnel. Cela a immédiatement éveillé quelques soupçons. «Avant cela, toutes les tentatives de déchiffrer un document unique et même simplement de comprendre s'il s'agit d'un texte significatif a échoué. 600 ans d'efforts inutiles!.. Cryptographes de la CIA et de la NSA, supercalculateurs et même médecins des «sciences occultes» ont signé leur impuissance totale. Le dernier message du cryptologue Gordon Rugg de l'Université de Keele au Royaume-Uni se lit comme suit: «Le manuscrit de Voynich est faux. Un tel «texte complexe» est facile à construire pour quiconque est familier avec des méthodes de copie simples », dit l'article.

Premièrement, la signification du texte a été reconnue dans les années 1970 et confirmée à plusieurs reprises dans des études sur les années 2010, qui ont été rédigées de manière suffisamment détaillée même dans les médias nationaux. Deuxièmement, la découverte soumise à la presse n'a été présentée que sous la forme d'un pré-imprimé d'institut, et non dans un article dans une revue internationale à comité de lecture (le pré-imprimé a également été publié en 2016).

Ces bizarreries dans la présentation du matériel nous ont obligés à demander des éclaircissements d'abord à l'auteur de l'étude, puis à des experts indépendants - des linguistes qui travaillent avec des méthodes statistiques et mathématiques, ainsi qu'avec le décodage de scripts anciens.

Il est facile d'écrire une formule, mais il est très coûteux d'effectuer une analyse numérique

Vidéo promotionelle:

Tout d'abord, brièvement sur l'essence de l'étude. Les auteurs de la prépublication, des mathématiciens de l'Institut de physique et de technologie de Moscou et de l'Institut de mathématiques appliquées de l'Académie des sciences de Russie, s'appuient sur leurs travaux, selon lesquels «la distribution de fréquence des symboles textuels est une caractéristique stable non pas de l'auteur ou du sujet du texte, mais de la langue». Autrement dit, en utilisant un ensemble à l'aide d'outils mathématiques, vous pouvez déterminer dans quelle langue il est écrit, du fait que chaque langue a son propre «profil» caractéristique (distribution de l'exposant de Hurst). De plus, prenant ces méthodes comme base, les scientifiques ont établi que le texte du manuscrit était rédigé dans un mélange de plusieurs langues. En même temps, de faux espaces y ont été ajoutés et les symboles indiquant les voyelles ont été supprimés.

L'auteur principal de l'étude, Yuri Orlov (IPM RAS et MIPT), a souligné que le manuscrit de Voynich n'est pas du tout l'objectif principal de leur travail. "Le manuscrit" sensationnel "n'est qu'une illustration de la méthode mathématique de reconnaissance des langues à partir du texte - un problème, en fait, pour l'apprentissage automatique", a déclaré Orlov.

Le manuscrit lui-même ne nous intéresse absolument pas. La science se réfère spécifiquement aux statistiques des langues. Grâce à lui, nous pouvons comprendre dans quelle langue ce manuscrit est écrit. Mais pas ce qui y est écrit, c'est un point important. - Yuri Orlov. Le MIPT et l'Institut de mathématiques appliquées du nom de M. V. Keldysh

Concernant la méthode linguistique utilisée dans le travail, Orlov note que l'analyse de la fréquence des combinaisons de lettres dans les textes lui-même est une chose bien connue. Cependant, l'indicateur Hurst est mal connu des linguistes, car il est difficile à calculer même en termes mathématiques. La formule elle-même est facile à écrire, mais l'analyse numérique est très coûteuse. Pour cela, le supercalculateur situé à l'Institut du nom de M. V. Keldysh, souligne le mathématicien.

Le choix des langues indo-européennes pour l'analyse s'explique par le fait qu'elles sont toutes très similaires, dit Orlov. Les indicateurs développés par les mathématiciens permettent de distinguer facilement les langues au sein d'un même groupe linguistique, mais pas entre les familles. Bien sûr, il est théoriquement possible d'effectuer le même travail avec d'autres groupes (Oural, Altaï ou autres), mais la valeur de l'analyse réside dans son exhaustivité, Orlov en est sûr. Dans le cas des langues indo-européennes, il n'est pas difficile de taper un corpus de textes pour chaque langue, il est plus difficile de le faire avec d'autres familles.

Revenant au manuscrit de Voynich, Orlov a noté que lui et ses collègues ont cité cinq preuves (le profil logarithmique de l'ordre de fréquence des lettres dans le texte en une et plusieurs langues, la distribution de l'exposant de Hurst, le portrait spectral de la matrice des probabilités conditionnelles, et d'autres) de l'hypothèse sur le mélange de langues dans le manuscrit et la suppression lettres pour voyelles. Ils se distancient catégoriquement du «repaire autour du manuscrit», mais ils ont présenté un résultat unique - une méthode ouverte, une analyse statistique avec une évaluation de la fiabilité qui peut être vérifiée indépendamment.

La conclusion est dépréciée par le fait que nous ne comprenons pas sur quel matériau ils ont dérivé et sur quoi - ils ont vérifié leur formule

L'hypothèse même que le texte du manuscrit de Voynich est dépourvu de lettres pour les voyelles, avec des espaces mal espacés est belle et bonne, note la linguiste Evgenia Korovina, qui est engagée dans les statistiques mathématiques du langage (Institut de linguistique, Académie russe des sciences). Auparavant, personne n'avait avancé une telle hypothèse. Par exemple, elle explique magnifiquement pourquoi il y a moins de lettres que ce à quoi on pourrait s'attendre pour un texte européen. Mais le problème est que les auteurs de l'étude n'ont même pas indiqué quels textes dans différentes langues ils comparaient et quel était le volume de ces tests. Un grand nombre de langues sont mentionnées dans la pré-impression. Par conséquent, l'étude n'est pas reproductible: si vous prenez des textes arbitraires dans les mêmes langues, ce n'est pas un fait que les mêmes modèles sortiront.

Maria Molina, spécialiste des méthodes de corpus dans l'étude des langues anciennes (Institut de linguistique, RAS), est d'accord avec Korovina. Selon elle, de nouvelles méthodes de traitement des données linguistiques permettent d'obtenir des informations sur ce qui était auparavant fermé aux chercheurs en langues. Cependant, un matériel d'entrée insuffisamment bien préparé discrédite souvent même les meilleures techniques de traitement des données.

La conclusion est dépréciée par le fait que nous ne comprenons pas sur quel matériau ils l'ont dérivée et sur quelle base ils ont testé leur formule. Pour mon matériel, je sais avec certitude qu'il y a une petite erreur méthodologique - et j'obtiens des chiffres extrêmement différents. - Maria Molina. Institut de linguistique RAS

«Garbage in - garbage out», ajoute Molina (GIGO est un principe en informatique qui signifie que des données d'entrée incorrectes entraîneront des résultats incorrects, même si l'algorithme lui-même est correct, - notez Indicator. Ru).

Les méthodes statistiques sont toujours des indices de résultats, pas de résultats

Albert Davletshin (un employé du Centre d'études comparatives linguistiques de l'Institut d'études comparatives de l'Université d'État russe pour les sciences humaines, étudie les langues maya et polynésienne) parlait encore plus vivement. Si les auteurs de la pré-impression n'allaient pas déchiffrer le manuscrit de Voynich, pourquoi le font-ils? Et de plus, si nous parlons spécifiquement du décodage d'une écriture inconnue, question après question se pose: «Il n'y a pas de données initiales sur l'écriture - quel type de lettre? Comment les différentes transcriptions sont-elles obtenues? Combien de personnages? Qu'est-ce qui sous-tend les hypothèses existantes sur la nature de l'écriture? Quelle est la longueur d'un mot séparé par des espaces et sans espaces? Que signifient les espaces? Quelle est la taille du dictionnaire? Quel est le rapport signatures / dessins?

Dans un premier temps, il s'avère que le texte est danois et uniquement danois (et c'est historiquement impossible, sur lequel il n'y a pas un mot dans l'ouvrage). Ensuite, il s'avère que le texte est dans deux langues inconnues (la vérification à ce stade s'avère impossible et est prise sur la foi). De plus, il existe de nombreuses façons conservatrices de montrer que deux (grandes) pages sont écrites en une seule lettre, mais dans des langues différentes, sans recourir à des modèles mathématiques complexes. Enfin, si les voyelles sont supprimées du texte, dans quelle mesure cela est-il confirmé par des méthodes standard connues depuis longtemps (par exemple, Sukhotin, Shevoroshkina et Ventris)?"

Davletshin critique également l'insensibilité à la philologie et à l'histoire caractéristique de ce type de recherche:

Ce que je vois dans le texte: il y a souvent des gens qui veulent prendre la source X et oublient que c'est une source et qu'elle existe dans un contexte historique, y compris linguistique, et qui comptent quelque chose dedans. L'hypothèse selon laquelle il y a plus d'une langue dans un manuscrit est intéressante. Mais vous pourriez en quelque sorte le montrer humainement. Les méthodes statistiques sont toujours des indices de résultats, pas de résultats. -Albert Davletshin. Centre d'études comparatives linguistiques, IVKA RSUH

Il n'y a aucun critère pour distinguer les résultats intéressants des résultats terribles

Une position plus équilibrée a été prise par Georgy Starostin, un expert en linguistique historique comparée (RSUH). Il était plus intéressé par l'utilité des nouvelles méthodes mathématiques pour résoudre les problèmes auxquels sont confrontés les linguistes. «Le modèle présenté dans l'article fait une impression étrange. D'une part, il semble appartenir à la catégorie des «aveugles», analysant les données textuelles sans aucun jugement préalable sur la structure de l'alphabet (par exemple, les digraphes, comme l'anglais ch, sh, devraient être considérés comme des combinaisons de deux lettres, bien que ce soit en fait une du son). En revanche, les voyelles sont rejetées des chaînes comparées qui, selon les auteurs du texte, contiennent moins d'informations et ajoutent plutôt du bruit. En général, la base de test est clairement très petite, il est impossible de parler de quelque chose de fondamental dans autant de langues."

Les résultats de la comparaison des langues indo-européennes et ouraliennes, présentés dans le tableau comparatif 3 de l'article, n'inspirent pas d'optimisme particulier chez Starostin. Certains indicateurs du degré de proximité des langues sont bien saisis (par exemple, les connexions intra-germaniques ou intra-romanes), certains mal (par exemple, la méthodologie n'identifie plus la famille indo-européenne). L'essentiel est qu'il n'existe aucun critère pour distinguer les résultats intéressants des résultats terribles. Dans le meilleur des cas, la méthode permet de distinguer de petits groupes linguistiques (même si, même ici, elle ne fonctionne pas entre finnois et estonien étroitement apparentés), mais tous ces groupes peuvent être identifiés de manière fiable sans elle.

Le tableau 3 de la pré-impression, qui présente les résultats de la comparaison des langues indo-européennes et ouraliennes. La même couleur dans le tableau. On identifie 3 groupes de langues proches par paires (au sens de la norme L1 des distributions de fréquences ordonnées dans les textes sans voyelle). Certaines paires de langues étonnamment proches sont marquées en rouge, comme l'allemand / hongrois, l'anglais / l'estonien, le latin / basque et le grec / finnois. Auteurs de la prépublication: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A
Le tableau 3 de la pré-impression, qui présente les résultats de la comparaison des langues indo-européennes et ouraliennes. La même couleur dans le tableau. On identifie 3 groupes de langues proches par paires (au sens de la norme L1 des distributions de fréquences ordonnées dans les textes sans voyelle). Certaines paires de langues étonnamment proches sont marquées en rouge, comme l'allemand / hongrois, l'anglais / l'estonien, le latin / basque et le grec / finnois. Auteurs de la prépublication: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A

Le tableau 3 de la pré-impression, qui présente les résultats de la comparaison des langues indo-européennes et ouraliennes. La même couleur dans le tableau. On identifie 3 groupes de langues proches par paires (au sens de la norme L1 des distributions de fréquences ordonnées dans les textes sans voyelle). Certaines paires de langues étonnamment proches sont marquées en rouge, comme l'allemand / hongrois, l'anglais / l'estonien, le latin / basque et le grec / finnois. Auteurs de la prépublication: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A.

Enfin, c'est une idée intéressante de déterminer la caractéristique génétique d'une langue par la distribution de l'exposant hurst et, peut-être, même amenée à un point scientifique. Mais cela nécessitera de traiter un grand nombre de textes dans différentes langues. Et le problème se pose immédiatement: de nombreuses langues ne sont pas écrites, et il n'est pas clair dans quelle mesure il est correct de comparer les systèmes d'enregistrement alphabétique avec les transcriptions phonétiques. Il y aura très peu de sens pratique de cette idée, Starostin en est sûr. Au mieux, il peut vraiment s'appliquer à des incidents comme le manuscrit de Voynich, lorsqu'il existe une hypothèse selon laquelle une langue avec une écriture alphabétique standard est cryptée selon certains principes (par exemple, avec la suppression des voyelles, etc.). Cependant, il existe très peu d'incidents de ce type dans le monde.

Résumer

Quel est le résultat final? La discussion autour de la recherche IPM et MIPT a révélé un profond fossé entre la communauté linguistique (même ceux qui utilisent des méthodes statistiques) et les «outsiders» concernant les linguistes qui ont décidé d'appliquer leurs outils mathématiques au matériel linguistique.

Le fait que les mathématiciens ne veuillent pas travailler avec des linguistes ne donne pas seulement lieu à de grossières maladresses, qui migrent ensuite vers les médias (par exemple, la langue basque dans la pré-impression est appelée indo-européenne, il y a l'expression «lettres de voyelles»). La beauté des modèles et la puissance de calcul des supercalculateurs sont en fait dévalorisées par les erreurs au point d'entrée. Là encore, grâce à la volonté et à l'ouverture des contacts avec des collègues d'une autre discipline, ces erreurs pourraient facilement être évitées.

Voir le manuscrit de Voynich lui-même ici.

Recommandé: