Pourquoi Les Langues Et Les Dialectes - Ce Sont Des Choses Complètement Différentes - Vue Alternative

Pourquoi Les Langues Et Les Dialectes - Ce Sont Des Choses Complètement Différentes - Vue Alternative
Pourquoi Les Langues Et Les Dialectes - Ce Sont Des Choses Complètement Différentes - Vue Alternative

Vidéo: Pourquoi Les Langues Et Les Dialectes - Ce Sont Des Choses Complètement Différentes - Vue Alternative

Vidéo: Pourquoi Les Langues Et Les Dialectes - Ce Sont Des Choses Complètement Différentes - Vue Alternative
Vidéo: QUELLE EST LA DIFFÉRENCE ENTRE UNE LANGUE ET UN DIALECTE ? 2024, Mai
Anonim

Souvent, des questions simples ont des réponses complexes. Par exemple: quelle est la différence entre la langue et le dialecte? Si vous décidez de demander à un linguiste à ce sujet, asseyez-vous. Bien qu'à première vue, cette question n'ait rien de difficile, elle peut être répondue de différentes manières.

La distinction entre langue et dialecte peut dépendre d'un point de vue ou d'un autre. D'un point de vue politique, la langue est ce que les gens parlent habituellement en tant que nation. Par exemple, de 1850 à 1992, la soi-disant langue serbo-croate existait, qui comprenait plusieurs dialectes, dont le serbe, le croate et le bosniaque. Mais après la scission de la Yougoslavie en plusieurs États indépendants au milieu des années 1990, ces dialectes ont été reconnus comme des langues distinctes. Cette définition politique fonctionne en partie, même si elle apporte plus de problèmes que de solutions: il existe des langues qui sont parlées dans différents pays, un exemple frappant en est l'espagnol en Amérique latine. Personne ne dirait que l'espagnol mexicain et l'espagnol colombien sont des langues différentes. Peut-être espagnol, parlé dans certaines régions d'Espagne,si différent de ses variétés latino-américaines qu'il mérite d'être appelé une langue distincte, mais ce n'est pas tout à fait clair.

Mais que se passe-t-il si nous traçons la frontière entre langue et dialecte, guidés par le critère de la compréhension mutuelle? Malheureusement, cette approche n'est pas non plus idéale. Un danois comprendra un peu mieux le suédois qu'un suédois - danois. De même, une personne qui parle le dialecte paysan particulier de l'anglais britannique comprendra bien mieux un Américain de Los Angeles qu'un Américain. La compréhension mutuelle dépend souvent de facteurs externes - ils sont une variable plutôt incontrôlable - et non des propriétés inhérentes à la langue elle-même.

Alors peut-être devrions-nous adopter une approche purement linguistique. Imaginons que l'on puisse mesurer systématiquement la différence (D) entre deux variantes de parole. La signification spécifique de D nous permettrait alors de définir la frontière entre deux dialectes et deux langues. Trouver une telle valeur ne devrait pas être très difficile, car les deux langues peuvent être comparées selon de nombreux critères, tels que l'inventaire solide, les caractéristiques grammaticales ou le vocabulaire.

Mais que se passe-t-il si les différences entre les variations de la parole sont graduelles et si la probabilité de trouver une valeur donnée de D est aussi élevée que la probabilité de trouver une autre valeur? Il faudrait alors choisir une valeur arbitraire de D comme point de départ, et une valeur arbitraire nous ramènerait à des considérations d'ordre politique ou pratique que nous n'avions pas l'intention de considérer. Voulons-nous que notre ligne de rupture soit au niveau où le serbe et le croate sont des langues différentes ou une seule? En cataloguant les langues du monde, combien de milliers de langues voulons-nous jeter dans l'oubli: cinq? Ou sept? Peut-être dix mille?

Ces dernières années, deux principaux obstacles à la distinction entre langue et dialecte ont été surmontés. Le premier est de savoir comment mesurer les différences entre les variantes de discours - c'est-à-dire trouver une valeur pour D. L'ASJP a minutieusement préparé un ensemble de données de comparaison systématique de langues qui contient actuellement 7655 listes de mots. Ils concernent les deux tiers des langues du monde, en supposant que, pour nos besoins, les langues sont définies par le code de la norme ISO 639-3. Étant donné que chaque liste de mots contient un ensemble fixe de 40 concepts qui sont interprétés de manière cohérente, il est facile de les comparer et ainsi d'obtenir une mesure de la différence. La mesure la plus couramment utilisée de la différence entre deux mots est la distance de Levenshtein, un terme nommé d'après Vladimir Levenshtein, un scientifique soviétique qui, en 1965, a développé un algorithme pour comparer deux chaînes de caractères. Il a défini «l'espacement» comme le nombre minimum de remplacements, d'insertions et de suppressions nécessaires pour transformer une ligne en une autre. La distance de Levenshtein peut utilement être divisée par la longueur de la plus longue des deux lignes, et ainsi mettre toutes les distances sur une échelle de 0 à 1. Ce phénomène est connu sous le nom de distance de Levenshtein normalisée, ou LDN. Il a défini la «distance» comme le nombre minimum de remplacements, d'insertions et de suppressions nécessaires pour transformer une ligne en une autre. La distance de Levenshtein peut utilement être divisée par la longueur de la plus longue des deux lignes, et ainsi mettre toutes les distances sur une échelle de 0 à 1. Ce phénomène est connu sous le nom de distance de Levenshtein normalisée, ou LDN. Il a défini «l'espacement» comme le nombre minimum de remplacements, d'insertions et de suppressions nécessaires pour transformer une ligne en une autre. La distance de Levenshtein peut utilement être divisée par la longueur de la plus longue des deux lignes, et ainsi mettre toutes les distances sur une échelle de 0 à 1. Ce phénomène est connu sous le nom de distance de Levenshtein normalisée, ou LDN.

Le deuxième obstacle est que peut-être «langue» et «dialecte» sont des concepts qui ne peuvent être définis que dans un ordre arbitraire. Nous avons ici des nouvelles très encourageantes pour vous. Si nous regardons toutes les familles de langues dans la base de données ASJP, où les participants au projet ont inclus une proportion significative de variétés étroitement liées, nous pouvons commencer à rechercher différents types de comportement de langues et de dialectes. Une image intrigante se présente à nous: les distances, en règle générale, fluctuent soit autour d'une valeur relativement petite, soit autour d'une valeur relativement grande, et une dépression se forme entre elles. Il s'avère que le plus souvent, ce creux se situe dans une fourchette étroite, en moyenne d'environ 0,48 LDN. Nous ne nous tromperons pas si nous disons que les variantes de la parole ont tendance à ne pas être partiellement similaires les unes aux autres dans leur vocabulaire de base. Soit il y a une tendance à une plus grande similitude, auquel cas les variantes de la parole peuvent être définies comme différents dialectes, ou moins de similitude, auquel cas elles peuvent être attribuées à des langues différentes. C'est là que se situe la frontière entre la langue et le dialecte.

Ce phénomène est probablement le résultat de circonstances sociales. Les dialectes divergent à mesure que les gens s'installent dans de nouveaux territoires et forment de nouvelles identités, mais s'il y a encore un contact entre eux, la convergence peut avoir lieu de telle sorte que les variantes de la est d'environ une langue). Cependant, une légère poussée vers la divergence peut entraîner une divergence relativement rapide des variantes linguistiques, augmentant la distance de Levenshtein, auquel cas nous pouvons les qualifier de langues distinctes. Il peut y avoir une relation entre la limite des distances entre les mots de la liste standard utilisée par l'ASJP et les distances correspondantes dans d'autres parties de la structure du langage, ce qui peut conduire à une grave perte de compréhension. En d'autres termes,le seuil de compréhension peut être corrélé au seuil entre les langues et les dialectes. Nous n'avons pas encore étudié cette question, mais en tant qu'objet de recherche, elle est extrêmement intéressante.

Vidéo promotionelle:

Arrivés à un critère objectif plutôt qu'arbitraire pour séparer les langues des dialectes, nous pouvons l'appliquer aux langues du monde. Certaines paires de variétés de discours considérées comme des langues nationales, telles que le bosniaque et le croate, sont bien en dessous du seuil de NDT de 0,48 (ce qui signifie qu'elles sont la même langue quelle que soit l'existence de la Yougoslavie). Non loin de ce seuil se trouvent des langues telles que l'hindi et l'ourdou (on peut difficilement les appeler deux langues différentes). Et les variétés d'arabe et de chinois, qui sont souvent considérées comme les mêmes langues, dépassent la LDN = 0,48 (ces variétés sont des langues distinctes). En fait, il existe plusieurs paires de variétés qui sont généralement considérées comme des langues différentes mais qui fluctuent à la frontière: par exemple, le danois et le suédois, qui ont une NDT de 0,4921.

Enfin, une technique dérivée d'ensembles de données, appelée chronologie ASJP, peut être appliquée pour établir le temps qu'il faut aux dialectes pour se distancer suffisamment pour être considérés comme des langues distinctes. Le résultat que nous avons trouvé est de 1059 ans, si l'on ne tient pas compte d'une erreur. Ces résultats sont étayés par le temps qu'il faut habituellement pour que la langue générique d'une famille de langues se divise en langues filles, qui deviendront plus tard les ancêtres des sous-familles. Pour cela, nous avons besoin d'autres méthodes d'analyse, mais les résultats sont similaires: il faut environ un millénaire pour transformer les dialectes en langues. Nous le savons car nous pouvons maintenant distinguer l'un de l'autre.

Søren Wichmann est un linguiste danois qui collabore avec l'Université de Leiden (Pays-Bas), l'Université fédérale de Kazan (Russie) et l'Université linguistique de Pékin (Chine). Son dernier livre, Temporal Stability of Linguistic Typological Features (2009), a été co-écrit avec Eric W. Holman.

Recommandé: