Les langues indo-européennes forment de loin le plus grand ensemble linguistique qui ait jamais existé : au moins la moitié de l’humanité parle l’une des 400 langues de cette famille, laquelle inclut aussi bien les langues latines (ou romanes), dont fait partie le français, que les langues celtiques, germaniques (anglais, allemand, suédois…), indo-aryennes (hindi, ourdou, bengali… ), iraniennes, slaves, etc.

Mais comment cela a-t-il commencé ? Quelle est l’origine des langues indo-européennes ?

 © Science/Atkinson © Science/Atkinson

Une équipe internationale menée par le néo-zélandais Quentin Atkinson assure avoir élucidé l’énigme : selon un article publié dans la revue Science du 24 août 2012, la famille indo-européenne serait issue d’une langue parlée il y a environ 9 000 ans par les premiers agriculteurs dans la région de l’Anatolie (la Turquie actuelle) ; elle se serait propagée peu à peu, à mesure que l’agriculture se répandait dans cette partie du monde.

Atkinson et ses collègues affirment donc avoir tranché une controverse qui dure depuis des décennies et oppose deux théories rivales : selon la première, les langues indo-européennes auraient été amenées par un peuple de cavaliers venus de la steppe pontique, au nord de la mer noire, il y a 5 000 ou 6 000 ans. Ce peuple nomade aurait bénéficié de l’avantage procuré par la domestication du cheval et aurait également possédé des chariots.

L’hypothèse de la steppe, ou « hypothèse kourgane » (nom donné à cette culture de cavaliers nomades) a été avancée dans les années 1950 par Marija Gimbutas, préhistorienne américaine d’origine lituanienne. Le terme « kourgane » désigne au départ des tumulus recouvrant une tombe, caractéristique de cette culture.

Une théorie concurrente a été élaborée dans les années 1980 par l’archéologue britannique Colin Renfrew : selon ce dernier, les proto-Indo-européens sont les premiers agriculteurs, apparus en Anatolie il y a quelque 9 000 ans, bien avant la culture kourgane, et qui auraient commencé à essaimer dans toute l’Europe et vers l’Asie.

 © DR © DR
Jusqu’ici, l’hypothèse de la steppe avait la faveur de la majorité des spécialistes. Atkinson estime que sa recherche apporte une « confirmation décisive » à l’hypothèse minoritaire de Renfrew. Sa démonstration s’appuie sur une méthode très originale, qui transpose des techniques utilisées en épidémiologie pour tracer l’origine des virus.

Le groupe d’Atkinson a analysé les transformations de mots qui se retrouvent dans plusieurs langues indo-européennes et qui peuvent dériver d’un même terme ancestral. Par exemple, « mère », qui dérive du latin « mater », est apparenté à l’anglais « mother », à l’allemand « mutter », au persan « madar », et tous dérivent d’une même source proto-indo-européenne.

En français, « cinq » est apparenté à l’italien « cinque », mais aussi à l’allemand « fünf », à l’anglais « five », au suédois « fem » et là aussi, toutes ces formes sont issues d’une forme prototype. Contre-exemple : le grec « osteon » et le français « os » descendent d’une racine proto-indo-européenne,  mais une autre forme apparue dans les langues germaniques a donné l’anglais « bone » (os) et l’allemand « bein » (jambe).

Le groupe d’Atkinson a étudié un ensemble de 207 termes courants qui ont des formes apparentées dans diverses langues indo-européennes. Ils ont considéré un ensemble de 83 langues indo-européennes actuelles et 23 anciennes. Pour chaque langue, lorsqu’un terme donné possédait un correspondant dans cette langue, les chercheurs lui attribuaient la valeur « 1 » ; lorsque, dans la langue considérée, le terme étudié avait été remplacé par un nouveau mot complètement différent, la valeur attribuée était « 0 ».

Par ce procédé, on peut associer à chaque langue une séquence de « 1 » et de « 0 ». Ces séquences ont été traitées de manière analogue à l’ensemble des séquences ADN d’un virus qui mute au cours de l’évolution. La substitution d’une racine par une autre dans une langue est ainsi assimilée à une mutation.

 © DR © DR

Pour compléter le modèle, Atkinson et ses collègues ont ajouté les données connues sur l’étendue géographique de chaque langue. Ils ont aussi introduit des éléments de chronologie : à quelle date apparaît ou disparaît une langue, à quel moment se produisent des divergences (par exemple, la chute de l’Empire romain a déclenché la floraison des différentes langues romanes dérivées du latin). Les chercheurs ont aussi fixé des paramètres déterminant la vitesse à laquelle une langue peut se propager.

Une fois toutes ces données introduites dans l’ordinateur, il n’y a plus qu’à les mouliner en remontant le temps pour obtenir la localisation de la langue d’origine – l’hypothèse implicite étant que toutes les langues actuelles dérivent du proto-indo-européen, comme les formes mutées d’un virus dérivent d’une forme initiale.

Le résultat est sans ambiguïté : l’emplacement de la langue d’origine se situe en Anatolie. Colin Renfrew, assez logiquement, a salué ce travail comme une « percée majeure ». Les partisans de l’hypothèse kourgane estiment cependant que la méthode d’Atkinson, si ingénieuse soit-elle, comporte de nombreuses failles. L’ensemble de termes exploité par les chercheurs n’est qu’un petit échantillon du vocabulaire existant, de sorte qu’il pourrait exister un biais.

De plus, selon les linguistes, pour étudier l’évolution des langues, il ne suffit pas d’examiner les transformations du vocabulaire, il faut aussi considérer la syntaxe et les changements phonétiques.

L’archéologue américain David Anthony estime que l’article d’Atkinson « soulève plus de questions qu’il n’en résout ». Anthony est l’auteur d’un ouvrage récent, The Horse, the Wheel and Language (Le cheval, la roue et la langue) dans lequel il défend l’idée que la société mobile du peuple de la steppe a pu propager sa langue au-delà des limites de son foyer d’origine.

Un argument d’histoire linguistique s’oppose en outre à l’hypothèse anatolienne : le proto-indo-européen contient des termes pour désigner les roues ou les essieux d’un chariot. Par conséquent, cette langue d’origine ne peut pas avoir existé avant l’invention de la roue et du chariot, que l’on situe il y a 5 000 ou 6 000 ans. Pour David Anthony, ce point constitue un « atout majeur » contre la construction d’Atkinson et ses collègues. Mais il n’est pas sûr que l’argument soit décisif : pour Atkinson et ses collègues, les cinq grandes familles de langues indo-européennes (celtique, germanique, italique, balto-slave et indo-iranienne) ont divergé il y a entre 4 000 et 6 000 ans. Cette divergence est contemporaine de l’expansion de la culture kourgane. Il ne semble donc pas exclu que l’on puisse concilier les deux hypothèses dans un cadre plus large.

Mais pour l’instant, les spécialistes continuent de se crêper le chignon. L’opposition que rencontre Atkinson et ses collègues s’explique en partie par le fait qu’ils ne sont pas issus du sérail de l’archéologie ou de la linguistique, et introduisent des techniques informatiques et biologiques dans un domaine attaché à d’autres méthodes. À défaut de clore la controverse, leur approche hétérodoxe a le mérite d’offrir un nouveau cadre de réflexion sur la fascinante énigme des langues indo-européennes.

Le Club est l'espace de libre expression des abonnés de Mediapart. Ses contenus n'engagent pas la rédaction.

Tous les commentaires

Et la langue basque, dans tout cela ?

Et la langue des Touaregs ?

Merci d'avance aux spécialistes qui se sont exprimés sur ce fil de bien vouloir se mettre à la portée d'un béotien.