Le saviez-vous ? Le nombre de langues vivantes parlées sur notre planète s'élève très exactement à 6.909, un décompte datant de l'année dernière.
Ces langues vivantes sont toutes recensées dans L'Ethnologue, une des encyclopédies les plus fantastiques qui soient, fantastique à la fois par la masse d'informations glanées et par la qualité de ces informations, vérifiées une à une sur le terrain dans le monde entier par un réseau composé de milliers de linguistes. Avec, bien entendu, des informations sur la langue française et sur les langues parlées en France, entre autres.
Voici la fiche de l'Ethnologue pour la France et la carte des langues parlées en France.
Officiant au sein de l'organisme SIL International (SIL signifiant Summer Institute of Linguistics), l'équipe de l'Ethnologue aime présenter son travail plutôt comme un catalogue exhaustif que comme une encyclopédie, et elle insiste à juste titre sur la minutie avec laquelle les informations sont collectées puis vérifiées. Une petite équipe de chercheurs basée à Dallas, dans le Texas, est elle-même relayée par des équipes nationales et linguistiques présentes sur tous les continents.
Un inventaire à la Prévert ?
Barbara Grimes, directrice de publication entre 1971 et 2000 (8e-14e éditions), relatait en janvier 2000 : « Il s’agit d’un catalogue des langues dans le monde, avec des informations sur les pays où elles sont parlées, une estimation du nombre de personnes qui les parlent, la famille linguistique à laquelle elles appartiennent, les autres termes utilisés pour ces langues, les noms de dialectes, diverses informations sociolinguistiques et démographiques, les dates des Bibles publiées, un index des noms de langues, un index des familles linguistiques et enfin des cartes géographiques pour les langues » (extrait d'un entretien du NEF).
Les deux principaux index sont en effet l'Index des noms de l'Ethnologue (Ethnologue Name Index), qui donne la liste des noms de langues et de dialectes ainsi que leurs synonymes, et l'Index des familles linguistiques de l'Ethnologue (Ethnologue Language Family Index), qui organise les langues selon leurs familles linguistiques.
Du virtuel à l'imprimé...
Barbara Grimes expliquait aussi que, si la version web était utile, la version imprimée l'était encore plus, en langue anglaise pour toucher un large public : « Nous avons eu des demandes nous demandant l'accès à l'Ethnologue dans plusieurs autres langues, mais nous n'avons pas le personnel ni les fonds pour la traduction ou l'actualisation, indispensable puisque notre site est constamment mis à jour. L'internet est (...) un moyen commode pour mettre notre documentation à la disposition d'une audience plus large que celle de l'Ethnologue imprimé. D'un autre côté, l'Ethnologue sur l'internet n'atteint en fait qu'une audience limitée disposant d'ordinateurs. Or, dans les personnes que nous souhaitons atteindre, nombreuses sont celles qui ne disposent pas d'ordinateurs. Je pense particulièrement aux habitants du dit "Tiers-monde". »
Une nouvelle édition de l'Ethnologue est publiée environ tous les quatre ans. L'édition la plus récente, la 16e, date en 2009, avec une version imprimée payante et une version web gratuite... comme d'habitude depuis que le web existe. L'Ethnologue a proposé aussi une version CD-Rom payante pendant quelques années avant que l'internet à débit rapide ne devienne monnaie courante.
Des origines à nos jours
Contrairement à ce que certains croient, cette vaste entreprise n'est née ni avec l'internet (1974) ni avec le web (1993), même si sa version web a beaucoup contribué à la faire connaître. Il s'agit d'un projet de recherche actif depuis plus de cinquante ans.
L'Ethnologue est fondé en 1951 par Richard Pittman, qui est le directeur de publication des sept premières éditions, de 1951 à 1969. À l'origine, son but est de partager les informations glanées sur les langues minoritaires avec ses collègues de SIL International et d'autres linguistes. L'Ethnologue débute comme un catalogue de langues minoritaires avant de prendre de l'ampleur au fil des ans.
Barbara Grimes est la directrice de publication des sept éditions suivantes, de la 8e à la 14e, entre 1971 à 2000. À partir de 1971, le champ des informations s'élargit pour ne plus concerner seulement les langues minoritaires, mais pour englober aussi peu à peu toutes les langues vivantes connues dans le monde. Entre 1967 et 1973, Barbara Grimes révise d'abord en profondeur toutes les informations disponibles sur les langues d'Afrique, des Amériques, du Pacifique et de quelques pays d'Asie. Pendant ses années comme directrice de publication, entre 1971 et 2000, le nombre de langues recensées passe de 4.493 à 6.809, et les informations disponibles pour chaque langue sont elles-mêmes plus complètes, si bien que l'encyclopédie triple de taille.
En 2000, Raymond Gordon Jr. devient le troisième directeur de publication de l'Ethnologue et produit la 15e édition (2005). Il cède ensuite la place à Paul Lewis, aidé de Conrad Hurd pour la gestion de la base de données et de Raymond Gordon pour la direction des équipes nationales et linguistiques sur le terrain.
Dans l'introduction de la 16e édition (2009), on peut lire ceci : « La manière dont chacun choisit de définir une langue dépend des motifs qu'on a d'identifier cette langue comme étant distincte d'une autre. Certains basent la définition d'une langue sur des raisons purement linguistiques. D'autres reconnaissent la nécessité de prendre également en compte des facteurs sociaux, culturels ou politiques. En outre, les locuteurs d'une langue donnée ont souvent leurs propres critères sur l'appropriation d'une langue comme étant la leur. Ces critères sont souvent bien davantage liés à des questions de patrimoine et d'identité qu'aux traits linguistiques de la langue ou des langues en question. »
Comme expliqué aussi dans l'introduction de la 16e édition, une caractéristique de la base de données de l'Ethnologue est un système de codage des langues au moyen de trois lettres (par exemple FRA pour la France), ce depuis sa création. Ce codage est inclus dans l'encyclopédie elle-même à partir de la 10e édition (1984).
Le codage des langues est lui-même un véritable roman pour ceux que le sujet passionne.
L'Organisation internationale de normalisation (ISO) a adopté la norme ISO 639-2 en 1998. Cette norme, qui codait également chaque langue au moyen de trois lettres, était une convergence de la norme ISO 639-1 (un ancien standard de deux lettres pour chaque langue, adopté en 1988) et de la norme ANSI Z39.53 (les codes de langues MARC, trois lettres pour chaque langue, développés par les bibliothèques américaines et adopté en tant que norme nationale en 1987).
Au début de notre décennie, la norme ISO 639-2 (1998) devient insuffisante puisqu'elle code moins de 400 langues individuelles. En 2002, l'ISO invite donc officiellement SIL International à établir une nouvelle norme permettant d'harmoniser les codes utilisés dans l'Ethnologue avec les codes de la norme ISO, en intégrant aussi les codes des langues mortes utilisés par la Linguist List, une grande liste de diffusion à destination des linguistes.
Le résultat, officiellement approuvé en 2006 et publié en 2007, est la nouvelle norme ISO 639-3, qui attribue un code de trois lettres à près de 7.500 langues. SIL International est également désigné comme l'organisme officiellement responsable de l'enregistrement de nouvelles langues pour l'ISO 639-3, et gère donc le cycle annuel des modifications et des mises à jour sur une page de son propre site.
Il ne nous reste plus qu'à honorer l'adresse web de l'Ethnologue d'un signet dans notre navigateur web et à naviguer à perte de vue dans ce catalogue passionnant avant de choisir une langue improbable et exotique en voie d'extinction et d'envisager de l'apprendre, qui sait.
Copyright © 2010 Marie Lebert. Tous droits réservés. Avec diffusion en ligne par ActuaLitté.