~.~..--~---~.~~-~--'~~-----~--~-------------------------..,---------------------,=-=~---- Chapitre 5 LANGUES ET GENES On parle aujourd'hui a peu prčs cinq mille langues clifférentes dans le monde. Quelques-unes sont utilisées par des centaines de millions de personnes, mais la plupart sont moins largement diffusées; certaines sont méme limitées a une centaine d'individus, et il y a de fortes chances pour qu'elles disparaissent complětement d'ici quelques générations. Nous en connaissons beaucoup qui ont déja disparu ou sont en train de le faire. II n'est pas nécessaire ďétre linguiste pour s'aper- ~ cevoir que certaineslangues sont fort proches les unes .des autres. Cela est vrai par exemple pour le francais et pour ľitalien, ma languematernelle, et peut-étre encore plus pour l'espagnol et ľitalien. Si je vais en Espagne ou au Portugal, je me débrouille sans trop de difficultés, sauf lorsque je tombe sur deux mots qui sont identiques dans les deux langues ou qui se ressemblent beaucoup, mais qui ont une autre signification, comme .burro, qui signifie «beurre» en italien et « áne » en espagnol. On appelle ces mots des faux .amis, mais heureusement ils ne sont pas trěs nombreux. La raison 212 GENES, PEUPLES ET LANGUES de la ressemblance entre les langues italienne, francaise, espagnole, roumaine, etc., est simple : toutes ces langues dérivent d'une source commune, le latin. Une ressemblance identique unit les langues d'origine germanique : scandinave, allemande, hollandaise, flamande et anglaise. Dans l'est de l'Europe, le groupe de langues slaves montre aussi des ressemblances trěs précises. Au xvm' siěcle déjá, on s'était apers;u que la . langue indienne classique, le sanscrit, ressemblait aux langues anciennes européennes. Comme cela arrive pour toute découverte ou invention, il y avait, voici quelques siěcles, des pionniers de cette découverte. Le xvnť siěcle a vu naitre de nombreux travaux linguistiques qui ont permis de mieux comprendre les parentés d'un groupe de langues qu'on appelle, a juste titre, la famille des langues indo-européennes, Alors on a commencé de reconnaitre l'existence de beaucoup d'autres familles (certains linguistes préfěrent les appeler phy/a, ou phy/um au singulier). Comme les taxonomistes des plantes et des animaux, les biologistes ont reconstruit des arbresque les linguistes nomment « génétiques » - l'équivalent de phylogénétique en biologie. Mais les linguistes ont rencontré des difficultés a remonter plus haut que les familles de langues. Méme si plusieurs d'entre eux ont cherché a établir des parentés entre les familles, il a jusqu'ici été impossible de s'accorder sur un seul arbre qui comprenne toutes les familles existantes. En effet, de nombreux linguistes pensent qu'on ne peut mérne pas répondre a la question de l'unicité ou de la multiplicité de l'origine des langues modernes. La difficulté réside dans la vitesse ďévolution des langues. LANGUES ET GENES 213 Tchool!she4:amthadai •. Austra1ien Es\:.imo-atéoutien Ne-déně Oravidien Amériodien Sino.tjbétain 1 Basque Miao-YbO 2 Burustaski Austro-asiatique 3 Kel Oaique 4 Gilyak Indo-pacifique 5 Nahali I.SLANOE· ~ ::, Ind<><';'opéen·' Eskimoetéouuen AustrCHIsiatique CJ Austronésien Ibranche de ta řarralle atJslrOilsialiQueJ Figure 1. Disttibution géographique desfami/les /inguistiques se/on Ruhlen. Je montre dans la figure 1 la distribution géographique des familles suivant la classification proposée trěs récemment par M. Ruhlen, qui est a la fois la plus modeme et la plus complěte ..Pour donner quelque idée des différences d'opinion entre linguistes, disons qu'en général les familles de langues les moins connues, comme celles des Aborigěnes d'Australie ou de Nou.velle-Guinée, sont considérées comme les plus difficiles et suscitent de nombreuses polémiques. Mais les opinions divergent aussi sur d'autres familles, et je voudrais citer un exemple de vraie discorde 'qui a donné lieu a une guerre presque centenaire, dont lescendres ne se ------- 214 GENES, PEUPLES ET LANGUES sont toujours pas éteintes, entre linguistes américains.Il s'agit des langues des Indiens d'Amérique. Au début du siěcle, un linguiste et un anthropologue célěbres, Sapir et Kroeber, ont tenté de montrer., sur la base de ressemblances communes ade nombreuses langues amérindiennes, que celles-ci pouvaient form~.r un nombre restreint de familles. Ces affirmations out rencontré des obstacles trěs puissants, car la plupart des linguistes américains se sont lancés dans une attaque violente contre cette unification. Un nouveau cyde a commencé sous l'impulsion de J. Greenberg, de l'université de Stanford, qui a publié un livre démontrant que les langues parlées par les Américains précolombiens peuvent se regrouper en trois familles: les langues esquimaudes, les langues na-dene, qui sont par~. lées surtout au nord de la cóte pacifique, et les langues amérindiennes proprement dites, qui incluent la plupart des langues de ce continent. Greenberg a proposé éga-.; lement avec des biologistes américains que cette classifi-e cation corresponde a celles qu'on peut obtenir sur les mérnes populations en utilisant soit les données des ' dents modernes et fossiles (C. Turner), soit celles des . groupements sanguins et des protéines (Zegura). De plus, ces trois familles linguistiques semblent correspondre a trois migrations trěs importantes qu'on peut reconnaitre archéologiquement et qui se sont succédé dans l'ordre inverse de l'ordre énuméré plus haut: les Amérindiens au début, les Na-Dene ensuite, et enfin les Esquimaux. Les premiers ont occupé toute l'Amérique, tandis que les deuxiěmes et les troisiěmes sont restés plus prěs de leur origine, la Sibérie. Nous avons. confirrné les observations génétiques et nous trouvons . LANGUES ET GENES 215 que d'un point de vue génétique les Amérindiens se "séparent en trois groupes bien distincts, ceux měmes qu'a proposés Greenberg. II faut noter que les Amérindiens proprement dits forment un groupe extrémement variable génétiquement et que les sous-groupements linguistiques ne correspondent pas de facon parfaite avec ceux qui sont proposés par la génétique. II est probable que les Amérindiens sont arrivés en Amérique par une migration beaucoup plus ancienne et plus complexe .que celles des .Na-Dene et des Esquimaux, et peut-étre mérne par des migrations multiples. La date qui semble correspondre le mieux aux données 'génétiques est vieille d'un peu plus' de trente mille ans, et il peuť bien s'agir de la moyenne de différentes migrations, tout au moins des plus importantes. II est intéressant d'ailleurs de noter que les Na-Dene du Nord et ceux du Sud (Apaches et Navajos) sont semblables entre eux aussi du point de vue génétique, bien que les derniers montrent qu'ils ont absorbé une certaine quantité de flux génique des groupes amérindiens qu'ils ont traver.sés avant d'arriver a leur résidence actuelle. La publication de ce livre a déchainé presque immédiatement une nouvelle guerre des linguistes américains contre l'unité de la plupart des langues amérindiennes suggérée par Greenberg. Un groupe important de linguistes s'est réuni et a déclaré qu'il est impossible de reconnaitre moins d'une soixantaine de groupements taxonomiques dans les langues amérindiennes. On sait bien que les taxonomistes sont souvent divisés en lumpers et en splitters: les tendances synthétiques et analytiques forment probablement une polarité de base dans )'esprit humain ;'mais ici il Ya des différences méthodo- ,~ 216 GENES, PEUPLES ET LANGUES logiques que le livre de Greenberg discute en détail et qui peuvent expliquer une bonne partie de la dispute. Je ne suis pas linguiste, mais je peux suivre un discours général sur la méthode, et je trouve que les arguments de Greenberg sont convaincants. De plus, Greenberg a de son cóté un avantage qu'on peut qualifier ďhistorique : il y a plus de trente ans, il a donné une nouvelle classification des langues africaines en quatre familles: la familIe des langues afro-asiatiques, comprenant aussi toutes les langues sémitiques, celles qui sont parlées dans le nord de l'Afrique et la plupart des langues éthiopiennes; la famille nilo-saharienne, qui comprend des langues parlées dans le haut Nil et le sud du Sahara; les langues niger-kordofaniennes, qui incluent celIes de l'Afrique de l'Ouest, du centre-ouest et du sud-est africain, y compris les langues bantoues qui ont eu récernment une grande diffusion; et enfin les langues khoisa- . nides, parlées par les Hottentottes et les Bochimanes. La classification de Greenberg a soulevé au commencement une bagarre entre linguistes, mais a la fin elle a été. acceptée sans réserves. II me semble intéressant de considérer quelques- . unes des objections qui ont été faites a Greenberg par, ses collěgues américains, car elles aident a comprendre . non seulement les difficultés objectives qui existent dans l'analyse de l'évolution linguistiquc, mais aussi celIes, beaucoup moins objectives, qui ont été engendrées par les positions des adversaires de Greenberg. Les difficultés objectives tout d'abord : les langues évoluent trěs rapidement et il semble n'exister aucune ressemblance entre ces langues et d'autres langues plus éloignées. Le passage du temps est responsable de LANGUES ET GENES 217 .changements phonologiques parfois trěs grands aux-quels s'ajoutent souvent des changements sémantiques .. -La combinaison des deux phénoměnes rend la reconstruction de ressemblances trěs difficile. La gram.maireévolue aussi,bien qu'en moyenne plus lentement, .et elle permet parfois de reconnaitre plus aisément des ressemblances anciennes. Sous la pression de changements rapides, une langue devient incompréhensible .dans un temps assez bref. Les langues issues du latin, .parlées aujourďhuicen Europe, n'auraient p~s été comprises des Romains il y a un millierd'années. Aprěs .une séparation de cinq ou dix mille ans, les mots qui montrent une parenté reconnaissable peuvent descendre a 5 ou 10 %. Heureusement, certains mots et certaines parties du discours montrent une vitesse ďévolution plus faible et les chances de reconstruire des parentés, měrné éloignées, sont alors plus grandes. Mais tout changement linguistique a des effets a d'autres niveaux, qui viennent compliquer l'analyse; comme le disent les Iinguistes, dans une langue «tout se tient ». . Quant aux difficultés engendrées par des méthodologies erronées, certains linguistes du groupe améri-. eain anti-Greenberg ont soutenu qu'il était impossible dese déclarer pour une parenté sans une parfaite connaissance des langues examinées. Comme cela n'est possible que pour trěs peu de langues, on ne devrait jamais pouvoir se prononcer sur la parenté de plus de deux ou trois langues au maximum. En refusant d'utiliser la possibilité de mesurer la ressemblance entre deux langues et en réduisarit le verdict a « apparenté/non apparenté », les linguistes américains du groupe' antiGreenberg ont du méme coup tué la possibilité d'établir des hiérarchies classificatoires. 218 GENES, PEUPLES ET LANGUES IIest intéressant que cette position soit totalement opposée a celle de plusieurs autres linguistes,qui mesurent la ressemblance entre langues sur la base du pourcentage de mots d'une liste standard ayant uneorigine commune reconnaissable. Cette méthode a été poussée plus loin par ses inventeurs, sur la base de l'hypothěse que la probabilité qu'un mot perde sa signification est constante dans le temps. En évaluant la fréquence de mots apparentés dans une période connue, par exemple dans la transition du latin aux langues modernes, on peut, gráce a cette hypothěse, calculer le temps nécessaire pour le développement de la différence existant entre deux langues modernes, et par conséquent évaluer la date approximative de leur séparation .. Cette méthode, qui a pris le nom de «glottochronologie », fait donc appel a une «horloge Iinguistique » tres proche intellectuellement de 1'« horloge moléculaire ». En biologie, on a l'avantage de pouvoir utiliser beaucoup de protéines et d'acides nucléiques différents pour obtenir des évaluations indépendantes de la séparation entre deux espěces, On peut done comparer des sources différentes ďinforrnation, ce qui permet un renforcement mutuel des conclusions. Ma1heureusement, c'est impossible en linguistique. La méthode est moins rigoureuse qu'en biologie et plus difficile a appliquer, surtout pour des périodes plus longues, puisque a partir de cinq a six mille ans de séparation entre deux langues le pourcentage de mots en commun est trop prěs de zéro pour étre statistiquement fiab1e. La liste de mots ne peut pas étre augmentée a 10isir, car elle est déjá choisie parmi les mots qui changent 1e moins vite. LANGUES ET GENES 219 D'autres linguistes exigent queles ressemblances .entre mots semblables de langues différentes soient examinées i 1alumiěre des « correspondances classiques' .des sons », qui sont des rěgles trěs strictes de change.ments phonologiques observées d'une langue i l'autre. Selon ces linguistes, si les rěgles ne sont pas suivies exactement, il ne faut pas accepter la parenté de deux mots qui semblent a premiére vue avoir une origine .commune. Or ces regles ont des exceptions, do nt quel,ques-unes ont étéexpliquées par des sous-rěgles qui .tiennent compte de 1'«environnement » phonologique .du changement. Mais il serait difficíle, sinon impossible, d'expliquer toutes les exceptions car c'est en grande .partie une question de probabilités de voies différentes de changement, Les «puristes» des correspondances :classiques de sons n'acceptent pas les exceptions. .Greenberg leur a donc répondu en établissant une liste .impressionnante d'exceptions aux correspondances des .sons qu'on trouve en comparant les langues de la famille indo-européenne. II conclut qu'avec les rěgles que ses adversaires voudraient irnposer, il eút été .impossible d'établir la famille des langues indo- 1 européennes, dont l'existence ne fait aucun doute, rnéme s'il peut y avoir quelque discussion de détail. Fort heureusement, la famille indo-européenne a été établie avant la théorie de la correspondance des sons. , Enfin, des linguistes affirment qu'avant de démonrrer des parentés ~p.tte groupements de langues, familles, sous-familles ou autres, il ifaudrait avoir reconstruit la «proto-langue », c'est-á-dire les mots du langage commun originel, qui est en général hypothétique. Ici on trouve une autre analogie avec la biolo- 220 GENES, PEUPLES ET LANGUES gie, oů l'on compare les séquences d'ADN en espěces différentes et oů l'on cherche le «consensus », Ia séquence partagée par toutes les espěces comme probable séquence ancestrale. Mais la recherche du conserisus est moins rigoureuse en Iinguistique car la variation y est beaucoup plus grande qu'en biologie et le conserisus, aprěs une évolution de quelques milliers d'années, n'est jamais suseeptible de donner, avee une probabilité élevée, une représentation eorreete du mot aneestral. En biologie, on peut trouver dans eertaines protéines si importantes pour l'organisme que celui-ci ne pourrait tolérer de changement, exaetement la méme séquence d'aeides aminés (les unités élémentaires dont les protéines sont faites) pourtant séparés par des milliards d'années. II est vrai que la reeonstruetion des protolangues peut faciIiter l'analyse eomparative,mais imposant la néeessité de cepassage on Iimite sérieusement la portée de la méthode, puisque les proto-langues sont connues pour un petit nombre de familles seulement. De plus, certaines reeonstructions sont probable- .•••.... ment arbitraires ou ont une faible probabilitéďétre cor- . reetes. La méthode de Greenberg évite ee passage. Elie a peut-étre l'ineonvénient de rester quelquefois plus subjeetive, mais elie peut aller beaueoup plus loin que les méthodes utiIisées par les spéciaIistes des langues . amérindiennes. Dans les Iimites que nous nous sommes imposées ici, la classifieation de Ruhlen, un élěve de Greenberg, me semble fournir des garanties satisfaisantes. La défi..:) nition de « fami1le» ne paraít pas trěs sůre et il est clair qu'elie est subjeetive. II n'est done pas, trěs important; qu'une fami1le soit une sous-famille pour un auteur et LANGUES ET GENES 221 i I une super-famille pour un autre. Malheureusement, la dassifieation moderne s'arréte au niveau des fami1leset celie de Ruhlen, qui en eompte moins que les autres, en donne dix-sept, II existe bien quelques superfami1les, rnais les seuls moyens Iinguistiques ne suffisent pas a reconstituer un arbre eomplet partant d'une langueoriginelie commurie atOus leshommes. . . .•, ' L'une de ees superfami1les présente un intérét parriculier. Il s'agit d'un groupement dont il existe aujourd'hui deux variantes : nostratique et eurasiatique. Son histoire est donnée par Ruhlen.La superfami1le nostratique, eomme elie a été décrite originellement par Je linguiste russe Illyich-Svitic, puis par des seientifiques russes comme Dolgopolvsky, Gamkrelidze et Ivanov, et par d'autres encore, comprend les fami1les indoeuropéenne, ouralo-altaíque, afro-asiatique, dravidienne, caucasique. Shevoroshkin lui a rattaehé la fami1le amérindienne définie par Greenberg. La superfami1le eura:-, siatiquedéfinie par Greenberg est semblable a la nostra- I tique, et s'en sépare en partie a cause des différentes définitions de quelques-unes des fami1les comme l'altaíque. Elle s'étend sur un espace un peu réduit par rapport a la nostratique, puisqu'elie n'inclut pas les .familles afro-asiatique et dravidienne qui, selon Greenberg, ont des origines plus anciennes. , , Avant de laisser de coté le sujet de la classification linguistique, je voudrais insister sur le fait que cinq ou six langues n'ont pas trouvé place dans les dix-sept fami1lesde Ruhlen ou dans quelque autre classifieation. Un de ees «isolats »linguistiques nous est familier, c'est le basque. Parlée par environ vingt-cinq mi1le Francais et un million et demi d'Espagnols, cette langue est vrai- 222 GEN ES, PEUPLES ET LANGUES LANGUES ET GENES 223 semblablement le reliquat d'une période pré-néolithique et descend peut-étre des langues par1ées par les CroMagnons, il y a vingt-cinq mille ans. Mais elle a certainement changé, de sorte que les Basques modernes et les hommes de Cro-Magnon, s'ils avaient la chance de dialoguer, ne se comprendraient pas et ne s'apercevraient probablement pas que leurs langues sont apparentées. Beaucoup de linguistes reconnaissent au basque une parenté avec des langues rnodernes du Caucase. 11 est donc possible qu'une ou plusieurs familles de ces langues pré-indo-européennes EUt parlée a ľépoque paléolithique dans toute ľEurope, et peut-étre méme plus loin. D'autres linguistes voient des ressemblances entre les langues basques et caucasiques, et les langues sino-tibétaines et na-dene de ľAmérique du Nord. Sur des bases que je ne peux juger, Ivanov affirme que les langues sumériennes, étrusques et d'autres langues vivantes éteintes sont également de la méme famille, une famille ancienne qui s'étendait donc a tout le nord de ľAsie et de l'Europe. L'inclusion du basque dans ce groupe fait penser que cette langue commune était parlée au moment oů ľhomme modeme est entré en Europe, il y a quarante mille ans. C'est un laps de temps trés long pour l'évolution des langues. Le temps oů le nostratique aurait commencé est évalué de dix mille a vingt mille ans. uant a l' rigine de la langue de ľhomme modeme, on ne peut pa établir de dates sůres. Méme pour l'origine, il y a une structure commune a toutes les familles, et cela est peut-étre une considération suffisante pour penser que les langues parlées aujourd'hui ont assez d'origines communes pour prendre la date de dispersion de ľhomme modeme a partir de ľAfrique comme point de départ des langues modernes. Cette date peut varier entre soixante-dix mille ans et cent cinquante mille ans. La premiére valeur est un minimum fixé par les dates ďhommes modernes les' plus .anciennes connues hors d'Afrique : en Chine, la premiére date est de soixante-sept milie ans, en accord avec la date attribuée a la premiére arrivée en Australie, il y a cinquantecinq a soixante mille ans. II est vrai que les premiers sites d'homme modeme au Moyen-Orient sont plus anciens, mais le fait de trouver ľhomme de Neandertal dans le mérne espace a des dates postérieures a suggéré que la premiére colonisation modeme hor s d'Afrique n'avait.pas eu de succěs. Les données biologiques sur la premiére séparation donnent appui a la limite supérieure : cent quarante-cinq mille ans est la date la plus récente (en février 1995) dérivée de ľADN mitochondrial, et cent cinquante-cinq milie ans est celle a laquelle on arrive par ľADN nucléaire. 11n'existe pas d'arbre fiable de l'origine de toutes les langues, et il n'est měme pas súr qu'il y ait eu une origine unique du langage. La plupart des linguistes considěrent que ce probléme est insoluble. C'est un .peu comme de chercher ásavoir s'il y a eu une seule 'origine de la vie sur terre. De nombreux biologistes pensent qu'il y a eu une origine unique, puisqu'il existe un seul type d'acides aminés synthétisés par les cellules vivantes, alors qu'il pourrait en exister deux, chimiquement opposés. Greenberg a noté qu'il y a au moins une étymologie commune a toutes les familles linguistiques, la racine fík, qui peut indiquer soit un doigt, soit le numéro un (une variation sémantique qui n'a pas besoin 224 GENES, PEUPLES ET LANGUES ďětre expliquée si on pense a la facon dotít nous indiquons le numéro un avec un geste). Dans ďautres langues, on trouve d'autres changements sémantiques qui semblent encore acceptables, par exemple «main.» ou měme «bras ». En francais, « doigt» vient de la racine latine digit; en italien, dito. Sur Ja base de cet exemple, deux linguistes américains, Bengston et Ruhlen, ont proposé ďautres racines presque universelles. Mais il faudra sans doute beaucoup de temps avant que ces recherches tres récentes trouvent l'accord des autres linguistes. Malheureusement, le nombre de mots sur lesquels on peut compter pour ces recherches est limité. 11s'agit en général de termes désignant les parties du corps, de pronoms personnels, de quelques autres noms et des chiffres un, deux, trois. 11n'est pas surprenant que les noms conservés depuis l'origine dans l'évolution linguistique soient ceux qu'on' apprend les premiers : yeux, nez, bouche, etc. Mais il en existe ďautres qui étaient certainement trěs importants dans la vie paléolithique et qui le sont restés jusqu' aux temps les plus modernes, comme « pou ». Seule l'invention des insecticides modernes nous a libérés de ce fléau, et encore de facon incomplěte. Comparaison des familles Iinguistiques avec I'arbre génétique Mérne s'il n'existe pas encore d'arbre évolutif complet des familles linguistiques, nous pouvons déji ' comparer l'arbre génétique et ce qui existe de l'arbre lin- AR8RE GÉNÉTIOUE LANGUES ET GENES 225 POPULATIONS FAMILLES LlNGUISTIOUES Pygmée Mbuti --- Langue originelle inconnue Africainde l'Ouest 8antou __ ,~ ~ Niger-kordofanien (niger-cqngolilis) Nilotique Nilo-saharierÍ San (Bochimanes) Khoisan ~~!;::~~~A~"~IAfro-asiattque "''''''''''''''''''''''''''"''''1:1: Européen .Sarde Indo-europeen ':::::::::::::::::j\ :~~::~ du S.E. Dravidien o::::::::::::::::::::::::: :::::::::::::::::\\ ~ Lapon I ~~g ;;: Sarnovede Ouralique-youkaguir ~ ;g ,: ~ Mongol ~ iII ~Tibétain Sino-tibétain C r:: o Coréen :::::::::::~::i\ ~Japonais Altalque , : g ~ool:~ Turc du Nord : Esquimau Esquimau-aléoutien : Tchouktche Tchouktke-kamchadal : Amérindien du Sud 3 :Amérindien du Centre Amérindien J Amérindien du Nord Amérindien duN.-O. -- Na-dene Chinois du Sud Sino-tibétain Mon KlJrr1e,~ A""m.,;m;q"' 1."..Thai Dalque. Acstrique Indonésien~ " Malaisien Philippin Austronésien Polynésien Micronésien Mélanésien -----, Nouvelle-Guinée llndo-Pacifique .Australien _____ Australien Figure 2. Arbre génétique et familles linguistiques. 226 GENES, PEUPLES ET LANGUES gUlstlque. En dépit de l'inachěvement de l'arbre des langues, on constate des ressemblances impressionnantes. .'. Dans la figure 2, les familles linguistiques ont été ,. ajoutées prěs des populations qui parlent les langues'·· appartenant a ces familles. On voit qu'une famille correspond souvent a une, deu:x ou trois branches de l'arbre génétique, rarement plus, et cela est vrai des seize familles linguistiques. La dix-septiěrne famille,. celle des langues du Caucase, n'est pas représentée. II existe en effet deux familles de langues caucasiennes, septentrionale et méridionale, alors que Ruhlen, dans la premiére édition de son livre, n'en fait appara1tre qu'une seule; mais il a accepté tout récemment cette sub- division. Parfois, une famille linguistique correspond a une seule branche, car les populations parlant ces langues ont été groupées ensemble dans l'analyse génétique; elles montrent en effet une grande similarité, soit génétique, soit ethnographique, et sont géographiquement proches. II s'agit par exemple de la sous-famille bantoue, une branche de la famille niger-kordofanienne, génétiquement trěs homogěne par rapport aux autres Africains. Bien que le mot « bantou » dérive d'une classification linguistique, il est aussi utile comme terme de classification biologique. D'autres groupements linguistiques ont également été reconnus sur la base de dennées linguistiques, tels les Indiens du Sud qui parlent des langues dravidiennes et les Indiens américains qui parlent des langues na-dene. Ces populations utilisant des langues de la méme famille sont trěs semblables, non seulement du point de vue linguistique, mais aussi du point de vue génétique et ethnique. LANGUES ET GENES 227 Comme l'arbre génétique montré dans la figure 2 comporte quaraiite-deux populations, parmi Iesquelles certaines sont considérées comme « européennes » et groupées ensemble, et seize families linguistiques, plu.'sieurs populations de l'arbre génétique doivent se réunir dans une seule famille linguistique. Lorsque cela arrive, on constate que ce sont souvent des populations trěs proches dans l'arbre génétique qui parlent des langues ·de la méme famille. On peut résumer ce comportement en disant que les familles linguistiques ont tendance a s'attacher dans la partie la plus basse de l'arbre, puisque les populations biologiques correspondantes ont une parenté génétique élevée. On pourrait donc utiliser ·l'arbre génétique pour dater approximativement l'origined'une famille linguistique. On trouve alors que ces .dates, a quelques exceptions prěs, sont cornprises entre six milie et vingt-cinq milie ans selon les families. On dispose de tres peu d'informations linguistiques directes a ce sujet. La datation glottochronologique de la famille indo-européenne serait de six milie ans, mais une analyse statistique de Kruskal et ses collěgues a montré que ' les estimations glottochronologiques de cet ordre de grandeur peuvent étre sérieusement en dessous de la réalité. II y a toutefois des exceptions a la rěgle qui veut que les familles linguistiques comprennent toujours des populations trěs proches dans l'arbre génétique. Les Éthiopiens, par exemple, font -partie de la branche · génétique africaine, quoiqu'ils parlent des langues de la famille afro-asiatique, trěs répandue en Afrique du Nord, en Arábie et au Moyen-Orient oů les hommes sont généralement caucasofdes. Les Éthiopiens sonf en 228 GENES, PEUPLES ET LANGUES effet un peu plus africains que caucasoídes sur le plan génétique et un peu plus caucasoídes qu' africains sur le plan lingUistique. Une autre exception de ce genre est celle des Lapons, qui font partie, génétiquement par1ant, des caucasoídes, dont ils se détachent par une branche trěs haute dans l'arbre de la figure 2. Ils parlent une langue de la famille ouralienne, dont on trouve des représentants typiques dans la Russie du Nord-Est et dans la Sibérie du Nord-Ouest, trěs prěs de l'Oural, ďoů vient le nomde la famille. Les peuples ouraliens d'Asie sont génétiquement des Mongoloídes, et les Lapons sont ~ mélange caucas?,lde e:rr~b~ble~e~t d'origine scandinave) et mongoloíde (d ongme sibérienne) avec prévalence du premier composant. Měrne sans regarder leurs genes, qui confirment ce diagnostic, on peut le constater dans le changement de couleur de la peau, des cheveux et des yeux, qui varient du type mongolořde au type scandinave. , . . Que ce soit dans le cas des Lapons ou des Ethiopiens, nous avons une explication simple de ce .fait. . Comme nous l'avons expliqué, ces deux populations viennent en effet de deux mélanges génétiques asseze récents : les européens-sibériens pour les premiers, les / africains-arabes pour les seconds. Les deux populations . font partie des branches de l'arbre dont vient la majorité de leurs genes, caucasoídes pour les premiers et : africains pour les autres, mais le mélange place ces: populations a une position élevée de l'arbre. II faut ajouter que si le mélange génétique montre exactement. les proportions des deux populations ancestrales, on n~ peut pas s'attendre a ce que les langues se mélangent entre elles avec la méme simplicité que les genes. H est. A;ANGUES ET GENES , 229 clair que les peuples mélés génétiquement tendent a garder seulement une des deux langues correspondantes aux populations d'origine. Parfois, la langue de la population mélée ne montre aucune altération; plus souvent, on trouve des mots ou quelquefois des sons empruntés a d'autres langues. La grammaire résiste au mélange encore mieux que le dictionnaire. Quant a ľhistoire des deux mélanges, nous savons que des contacts trěs intimes ont eu lieu entre Arabes et Africains en Éthiopie au cours du premier millénaire avant et aprěs JésusChrist : un empíre arabo-éthiopien a eu sa capitale ďabordá Saba, en Arabie, puis a Aksoum, en Éthiopie; mais probablement les contacts avaient commencé avant cette période. Nous savons aussi que les Lapons sont restés dans la région qu'ils habitent aujourd'hui pendant au-moins deux mille ans. Dans les deux cas, un laps de temps suffisant s'est écoulé pour que des échanges génétiques-aient lieu entre les populations en contact. Les évaluations du mélange génétique varient selon la'population considérée, en Laponie et en Éthiopie. Mais il est facile de calculer que le génome originel ; d'un peuple qui recoit un flux génique constant de 5 % " par génération de ses voisins gardera seulement 70 % de son génome aprěs trois siěcles. Cest exactement le cas des Noirs américains, qui ont été importés comme esclaves en Amérique des la fin du xvr siěclcet ont connu unflux génique blanc de cet ordre de grandeur .pendant ces trois siěcles. Si ce flux continuait a la méme .vitesse, les Noirs américains ne garderaient pas plus de : 10 % de leurs genes originels mille ans aprěs leur arri, vée en Amérique. Les Lapons et les Éthiopiens, qui ont été en contact longtemps (plusieurs milliers d'années), 230 GENES, PEUPLES ET LANGUES ont gardé une plus grande partie de leurs ~e~es origi-. naires puisque évidemment ils ont un flux geruque plus faible que celui de leurs voisins. . On trouve encore d'autres exceptions a la correspondance exacte entre les arbres génétique et linguistique, qui sont intéressantes car elles « con~rment la rěgle ». Ainsi, les Tibétains se trouvent géné?quement dans le groupe des Mongolo'ides du No~d; .1lspa:lent des langues sino-tibétaines, comme les Chinois, mais .les Chinois, dans notre arbre, viennent du sud de la Chine et sont génétiquement plus semblables aux Mongoloídes du Sud. Dans ce cas, l'histoire va venir a notre secours. Selon les historiens, les Tibétains sont chinois d'origine nord-chinoise. Partis ~~ m~si~cle avant JésusChrist de la Chine du Nord, ou ils étaient des pasteurs nomades, ils se sont portés au sud,' au Tibet. Plusieurs d'entre eux sont encore des pasteurs nomades. Les Tibétains ont gardé leurs langues originelles.aprěs l~ur migration vers le sud. L'unificati<:n de la Chine, eut lieu vers le nť siěcle avant Jésus-Chnst. Commencee par la dynastie Qing, assez breve,' elle fut achevée par la ,'1 dynastie Han, qui régna pendant quatre siěcles successifs. Les deux dynasties régnaient au nord et furent re~- , ponsables de l'extension de leur langu~, ori~ina~e de la·' Chine du Nord, a presque tout l'empire chinois. Dans. les deux mille ans qui suivirent, cette langue naturelle,\ ment se différencia en plusieurs autres langues. :g!1 Chine, surtout au sud, on trouve quand méme un grafl:~ nombre de minorités ethniques (dont cinquante-cillq sont reconnues officiellement), et chacune ďentre elles a conservé sa langue originelle, issue de. nombreuses origines différentes. LANGUES ET GENES 231 , Les. ten.ta?ves d~ reconstruction d'une partie de 1ar~re lingUlStl.quefaites l?ar. la création des superfamilles nostratique et euraslatlque, avec l'addition de la fa~e des Indiens d'Amérique, sont représentées graphiquement a I'extréme droite de l'ensemble des familles linguistiques, dans l'arbre de figure 2. II n'y a pas ďaccord complet entre les deux superfamilles. Elles on~ ét~.re~onstruites par des chercheurs indépendants qUl utilisaient un matériel et une méthode différents mais elles représentent une unité de base et il est'tre~ proba?le que les recherches futures pourront expliquer ces différences. Si on considere l'ensemble des deux familles nostratique et eurasiatique, leur union corres~ond a peu ďexceptions prěs a la grande branche génétl~U~que nou~. avons appelée nord-eurasienne et qui reurut Caucasořdes, Mongoloides du Nord et Indiens ďAmétique.. Cette branche se forrne lors :de la deuxiěme scission, lorsque les non-Africains seséparent entre la branche Europe-nord de l'Asie et la branche Sud-Est-asiatique (comprenant aussi l'Austra1ie et la ~~~vell~-?uinée). Les exceptions les plus importantes a l'identité de la branche Europe-nord de l'Asie et de ľunion nostratique-eurasiatique sont basques, caucasiques, sino-tibétaines, etc. Elles sont comprises dans la .branche génétique, mais non dans la branche linguistique. C'est exactement la trěs ancienne famille eurasienne, qui aurait vécu au temps de l'expansion en >~purop~ de l'hom~~, modeme et qui a été presque .\FPmpletement obliteree par la superposition plus' tar';9i;-e:de l'eurasiatique-nostratique. Dne analyse plus ;,geta111éedes données génétiques montre que ce sont .§}1ttoutles Na-Dene méridionaux, les Apaches et les 232 GENES, PEUPLES ET LANGUES Navajos, qui se sont fortement mělés aux Indi~ns du nord de l'Arnérique. Ce phénoměne est en pa~tle responsable de la tendance des Na:De~e.a s'associer dans l'arbre avec les autres Indiens d Amérique, de nouveau en position haute. .' . , L'origine du groupe linguistique Na-Dene n ~st pas bien connue. Quelques ~n~st:s .mettent la,fa~~lle en relation avec la famille sino-tibétaine, dont longme nous est également inconnue, mais cette derni~re ~ dů se répandre du nord au sud ~e la ~hine. L,esChi~OlS.du Nord, qui ne sont pas representes. dans 1arbre ~cause de l'insuffisance de données génétlques, sont tres semblables génétiquement a~ ~ongols, aux Coréen~ et aux ]aponais; autrement dit, 11ssont .des !A?n~OlOldes du Nord. La presence d'une langue .sl1:o-tlbetame ~a~s la branche génétique du Sud-Est, aSl~tlq~e ~es.C~nols , du Sud) est la conséquence de lobligatlon faite il y a , deux mille ans aux Chinois par les empereurs de la ' dynastie Han de parler la langue de la Chine du Nord. Cette dynastie donna son nom au mot Han~par l~qu~l la majorité chinoise se distin~e des ethnies mmoritaires. , , II faut aussi ajouter que l'arbre génétique .montr\, dans la figure 2 a des points faibles. ~e premle~ ~~l~'-.. plus robuste des embranchements rep!esente la diV1Sl0ll.ď" entre les Africains et les autres, consequence de la pre~ miěre diaspora, et se retrouve avec n'impor~e 5uell~ méthode permettant de calculer les distances genetlque ou de reconstruire l'arbre. Dans notre arbre de 1988, t deuxiěme branche sépare l'Océanie et ľAs~edu S:rd-Es des autres continents. En 1994, il devint clair qu,~ d'autres distances donnaient la préférence a la sépara LANGUES ET GÉNES 233 tion entr~ l'Océanie (Nouvelle-Guinée et Aborigěnes d'Australie) et le reste, qui était subdivisé entre Asie du Sud-Est et le reste de l'Eurasie dans un embranchement successif. Les mélanges qui eurent lieu en Asie sont probablement la 'cause des difficultés non encore completement résolues a propos de ces branches. L'arbre que nous montrons ici est un peu différent de ceux que nous avons montrés auparavant. 11 faudra encore beaucoup de données supplémentaires sur davantage de gěnes et de populations pour arriver a une version définitive,. surtout en ce qui concerne les rapports entre les trois branches majeures qui se forment aprés l'embranchement Africains-non-Africains. , Des difficultés ultérieures sont intervenues parce q~'une .méthod~-de reconstruction d'arbres trés 'populaire aujourďhui, développée par Saitou et Nel et dite neighbour join!ng, a donné un arbre dans lequel les branches qUl succědent a la premiére sont trěs différentes de la nótre, Aprěs l'embranchement .Africainsnon-Africains, qui reste le premier, la premiére branche est l'Europc:, mais elle est trěs courte. L'explication la .plus plausible est que les Européens ont recu de l'Asie leur princip ale contribution génétique; mais a cause de :,leurproximité avec l'Afrique, ils ont eu aussi des ď'échanges avec ce continent (dont on trouve les traces J~s plus nettes en Afrique du Nord). Dans la représenta-tion du neighbour joining, le mélange des populations \(Gauseun fort raccourcissement des branches et leur ',éplacement vers l'origine de l'arbre. Je crois que la différence entre les arbres obtenus avec cette méthode et la méthode plus traditionnelle que nous avons employée tire son origine de ce fait et que le neighbour 234 GENES, PEUPLES ET LANGUES joining est trěs sensible aux mélanges, en présence desquels il produit des modifications grossiěres par rapport a l'histoire. Le mélange entre l'Asie du Nord et l'Afrique contribue a la genese de l'Europe, en particulier pourla premiére. Plusieurs caractěres génétiques des Européens fontqu'ils sont a peu prés intermédiaires entre les Africains et les Asiatiques de l'Est. Le Moyen-Orient est un bon candidat pour l'aire d'origine des Européens. Intermédiaire entre l'Asie et l'Afrique, il a probablement été le point de départ de l'occupation de l'Europe par l'homme modeme, il y a quarante mille ans, et par les hommes néolithiques, il y a dix mille ans. On ne peut pas exclure que, pour occuper l'Europe, l'homme modeme soit venu en partie de plus haut, de la région des steppes. Ce sont probablement ces mouvements qui ont porté en Eurasie la famille linguistique (dite eura.sienne pour la distinguer de l'eurasiatique, qui est apparue plus tard) dont les seules families couvrant encore un espace important aujourd'hui sont la sino-tibétaine . et la na-dene. Les autres farnilles sont réduites a des isoIats : le basque en Europe (et peut-étre une langue éteinte, l'étrusque), les langues du Caucase du Nord, un isolat dans les montagnes du Pakistan Oebouroushaski, parlé par les Hunza). La famille eurasienne a été remplacée dans le Nord par la famille eurasiatique, qui a donné naissance aux cinq familles des temps modernes. Dans le Sud, elie a été remplacée par l'afro-asiatique et la dravidienne, qui se sont diffusées dans le nord de l'Afrique, dans le sud-ouest de l'Asie et au MoyenOrient. Aujourd'hui, la dravidienne, qui était autrefois par1ée en Perse, au Pakistan et en Inde, est limitée au LANGUES ET GENES 235 sud, de la péninsule indienne et a quelques isolats du nord. Elle a été remplacée en Perse, au Pakistan et dans la plus grande partie de l'Inde par les langues indo- européennes. Pourquoi est-il légitime de s'attendre a une similarité de base entre I'évolution biologique et l'évolution linguistique? 'j Des analogies importantes existent entre l'évolution des genes et celle des langues. Dans les deux cas, un changement qui se manifeste d'abord chez un individu peut ensuite-se répandre dans toutela population. Dans Je cas des gěnes, on appelie ce changement mutation; il passe successivement par la génération d'un individu a un autre et peut mettre un certain temps, parfois des millions de générations, pour qu'on le retrouve chez tous les individus d'une population. Cest que le génome, le patrimoine héréditaire est bien caché et protégé des influences extérieures; il change rarement et la transmission d'un individu a l'autre se fait seulement du pere ou de la měre a l'enfant. Les changements du langage, eux, sont bien plus fréquents et peuvent passer d'un individu a l'autre sans qu'il y ait aucun lien de parenté entre ces individus. Il est facile de comprendre que les langues peuvent changer beaucoup plus vite que les génomes. En effet, si un mot peut durer mille ans, un gene peut rester inchangé pendant des millions et parfois méme des milliards d'années. Malgré ces dif-férences, il reste des raisons de similarité importante entre les deux évolutions. ------ Si; 4# iiikiw+ 236 GENES, PEUPLES ET LANGUES LANGUES ET GENES 237 Mais il faut tout de suite préciser qu'il n'y a aucune raison de penser que les gěnes influencent la possibilité de parler l'une ou l'autre langue. L'homme modeme possěde au départ la capacité d'apprendre n'importe quelle langue connue, et la langue maternelle est le résultat d'un accident individuel : le lieu et groupe social de naissance. Toutes les langues modernes ont une complexité de structure comparable, et les langues des groupes ethniques qui vivent a un niveau économique primitif ne sont pas du tout plus «primitives » que les nótres. S'il y a un effet d'interaction entre gčnes et langues, ce sont plutót les langues qui influencent les genes dans la mesure oú une différence de langue entre populations peut diminuer leséchanges génétiques sans toutefois les annuler. L'évolution linguistique est un cas particulier d'évolution culturelle et nous lui consacrerons le pro~ chain chapitre. Ce qui. nous intéresse ici, c'est de comprendre comment il est possible de trouver un parallélisme entre deux évolutions si différentes l'une de l'autre. L'explication est fort simple. Deux populations isolées ľune de l'autre se différencient soit du point de vue génétique, soit du point de vue Iinguistique. L'isolement, qu'il soit dů a des barriěres géographiques, écologiques ou sociales, empéche et rend moins probables les mariages entre les deux populations, et par conséquent ľéchange génétique. Les populations vont donc évoluer indépendamment et, de ce fait, se différencier l'une de l'autre. La différenciation génétique va augmenter réguliěrement avec le passage du temps. On peut attendre exactement la méme chose d'un point de vue linguistique : ľisolement va diminuer ou annuler l~s ~cha~ges culturels et les deux langues vont aussi se différencier. Méme si les résultats de l'estimation du temps. de séparation de deux langues par la glottochronOl?gle ne sont pas toujours aussi exacts qu'on le voudrait, ce temps augmente généralement avec la durée de l'i,so~e.ment.~n principe, l'arbre linguistique et l'arbre ge~et1que.d~lvent correspondre puisqu'ils reflětent la meme histoire de scissions et donc d'isolements évolutifs. . I! existe toutefois des causes importantes de perturbations. Lors d'événements historiques particuliers . un langage peut étre remplacé pa~ un autre. En Europe, ~ par ~xemple, la langue hongroise se trouve géographiquement au centre d'un groupe de langues indoe~opéennes. de différentes branches : slave, germa~que, rornaine ; mais elle appartient a la famille ouralie~ne, bra~che ugro-finnique. Les autres langues de la meme famille sont parlées dans le nord-est de l'Europe et dans l'ouest de la Sibérie, comme nous l'avons vu en ; p:rlan! d~s Lapons. Cest a la fin du rx" siěcle aprěs ."J Jesus-~~lst que les Magyars, un ~oupe de nomades, ~~~l....ont Iaissé leurs de~eures en Rt~SSleP?ur t~aver~er les L Carpa~es et en:ahir la Hongrie, qU1 avait déjá été Ú' occupee en partie par ďautres barbares, les Avares, La . conquéte a abouti a la création d'une monarchie magyar~ qui a imposé la langue des vainqueurs a la population de langue romaine vivant dans la région. :~'effe:tif des cO,nquérantsétait plus faible que celui des conqU1s,et representait a peu prěs 30 % du total. L'effet génétique de la conquéte a donc été modeste et di1ué ..p~r !es échanges ..successifs avec les voisins. Aujourd hU1,un peu plus de 10 % des gěnes des Hongrois 238 GENES, PEUPLES ET LANGUES peuvent étre attribués aux conquérants d'origine oura- lienne. Ailleurs, les conquétes des barbares aprěs la chute de ľEmpire romain ont eu plus de difficultés a remplacer ou méme seulement a altérer de facon importante la langue des vaincus, qui étaient toujours supérieurs en effectif et en degré de civilisation bien que leur organisation militaire ait été incapable de résister a la poussée des barbares. Les Lombards, venus probablement de Suěde, ont occupé une bonne partie de l'ltalie un peu avant l'invasion de la Hongrie et ont constitué un état puissant qui a duréjusqu'au xr siěcle sans avoir toutefois d'effets importants sur la langue ..Cela est vrai aussi des Francs, une population d'origine allemande qui a eu une trěs grande importance dans l'histoire politique de la France sans en affecter la langue. Mais en Angleterre, apres la chute de l'Empire romain, des Anglo-Saxons, mercenaires des Romains, ont probablement fait venir du continent leurs familles et leurs alliés, et ont pu imposer leur langue vers le vi" siěcle avant J ésus-Christ. .Les iles Britanniques ont connu en peu de temp s de grand s changements de langues. Les indigěnes parlaient . des langues aujourďhui inconnues ; au cours du dernier millénaire avant jésus-Christ, la langue celtique s'est répandue dans presque toute l'Europe, a partir ďune : zone d' origine située probablement entre l'Autriche. et la Suisse. Au temps de la conquéte romaine, les iles Bri- . tanriiques parlaient des dialectes celtiques. La conquéte des Romains leur a substitué la langue latine, suivie parla langue anglo-saxonne, et enfin la conquéte normande a importé dans l'anglais modeme un grand nombre de mots d'origine francaise. LANGUES ET GENES 239 Un autre remplacement important s'est produit en Turquie, oů les Turcs ont commencé a attaquer l'empire de Byzance a la fin du xr' siécle et ont terminé Ieur conquěte avec la chute de Constantinople en 1453. Le remplacement de la langue grecque, qui était parlée a Byzance, par la langue turque, était particuliěrernent important puisque cette langue appartient a une famille différente, dite altaíque. De nouveau, 1'effet génétique a été. modeste en Turquie, Les armées de cette. époque étaient composées''ďun nombre assez restreint de soldats et, méme si parfois ils voyageaient avec leur famille, les effectifs étaient toujours faib1es par rapport á ceux des pays envahis lorsque ceux-ci avaient une longue histoire de civilisation et de développement économique. Mais protégés par 1'Empire romain, les peuples envahis avaient perdu la capacité de résister a '.. des envahisseurs dangereux comme les barbares. Nous avons évoqué a plusieurs reprises une autre langue parlée en Europe qui n'est pas indo-européenne mais est parlée aujourd'hui encore par une proportion de Francais du Sud-Ouest et une plus grande partie de la population de l'Espagne du Nord : la langue locale, le basque, n'a pas été remp1acée par une langue indoeuropéenne, arrivée plus tard, a 1a différence de ce qui s'est passé ailleurs. Les exemp1es de remplacement de 1angues ne sont pas limités a l'Europe; mais comme l'histoire de l'Europe est assez longue, les derniers remplacements se sont produits a-úne période historique, tandisqu'ailleurs il s'est agi d' événements presque toujours préhistoriques. Les invasions ariennes de 1'Iran, du Pakistan et de l'lnde ont apporté des langues indo-européennes 240 GENES, PEUPLES ET LANGUES dans des régions oů l'on parlait des langues de famille draviclienne. Du sud-est de l'Asie, les grandes découvertes géographiques des malayo-polynésiens ont apporté les langues austronésiennes en NouvelleGuinée, en Mélanésie, Micronésie et Polynésie. Du cóté occidental, ces langues sont parvenues [usqu'á Madagascar, oů on les parle encore. Les migrations polynésiennes onteu moins d'effet génétique li oů il y avait des densités élevées de Mélanésiens Cen Mélanésie); dans cet endroit, il y a eu plus de trois mille ans de mélanges et la mosaíque génétique-linguistique est trěs complexe. Mais lorsqu'il y a trois mille ans les Austronésiens sont passés de la Polynésie centrale i la Polynésie orientale, ils devaient étre encore des Mongoloídes, car ils n'avaient pas eu beaucoup de temps pour se méler aux Mélanésiens. Les amateurs d'explorations extraorclinaires seront contents de savoir qu'on ne peut pas exclure i partir d'une base génétique que l'Amérique du Sud ait donné une contribution partielle i la Polynésie orientale, . comme cela a été suggéré par Thor Heyerdahl avec les voyages du Kon- Tiki. La différence génétique entre MongoloIdes et Amérincliens est si faible qu'il est ., encore assez difficile de dire précisément quelle a été la contribution génétique des Sud-Américains i la Polynésie. Les nouveaux marqueurs génétiques qui viennent ďétre introduits pourront sans doute donner des réponses beaucoup plus claires i tous ces ?robleme~. La substitution totale d'une langue se fait plus facilement sous une forte pression politique organisée. Ces . circonstances extraordinaires font que maintes fois les interactions entre les peuples ne produisent pas de LANGUES ET GENES 241 changements de langues. Les langues différentes parlées dans les pays voisins peuvent étre peu affectées pendant des milliers ďannées, méme si les gčnes subissent une substitution partielle qui va parfois jusqu'á une substitution totale. 11est difficile de préciser l'importance de la substitution du génome basque originel i celui des voisins dů au flux génique, mais elle doit étre assez grande. Dans ďautres cas, la substitution génique est presque complěte, tandis qúeÍa substitution linguistique ne l'est pas. Deux populations parlant des langues khoisanides en Tanzanie (Hadza, Sandawe) n'ont plus de gěnes des Khoisans ; mais les Hadzas et les Sandawes ne sont pas trěs nombreux et doivent avoir vécu cornplěternent entourés de Bantous pendant plus de mille ans. Cette période-de faible échange génétique est suffisante pour .atteindre un niveau de remplacement de plus de 90 % des gěnes originaux. Les Hadzas et les Sandawes étaient des chasseurs-récolteurs et ont donc été séparés des agriculteurs bantous par des divergence s socioéconomiques de maniěre suffisante pour avoir conservé . leur langue, mais insuffisante pour bannir tout échange génétique avec les voisins. Pour résumer, le remplacement des langues n'est .pas la seule cause de perturbation du parallélisme entre évolutions génétique et linguistique observé aujourďhui. Les gěnes aussi peuvent étre remplacés. Les voisins géographiques favorisent les échanges génétiques, méme si ces échangés ont surtout lieu entre des voisins trěs proches, li oů les groupes sociaux etpolitiques se touchent et se mélent, 11est remarquable que malgré les chances de remplacement génétique et linguistique on puisse encore 242 GENES, PEUPLES ET LANGUES trouver dans la mosaíque linguistique et génétique du monde moderne assez de cohérence pour pouvoir reconstruire un arbre commun aux deux évolutions. Les grandes expansions humaines et les familles linguistiques Nous l'avons dit, l'origine de la plupart des families linguistiques, a en juger par l'arbre génétique, semble dater de si?,:milie a vingt-cinq mille ans. Quelques familles sont plus anciennes : celle des langues australiennes et des) langues indo-pacifiques (NouvelleGuinée) peuvent dater de plus de quarante mille ans sur la base de la ~remiere entrée de l'homme moderne dans ces parties d~\:monde. Ici, la définition de la familie est . aidée par l'isolement géographique des deux grandes iles Australie e~ouvelle-Guinée. Les deux familles, correspondantes sont différentes l'une de l'autre, de měme que les Aborigěnes le sont d'un point de vue génétique entre eux. Les langues khoisanides doivent ětre anciennes, mais il est plus difficile de leur donner un age. La «familie eurasienne», postulée sur la base des ressemblances entre basque, langues caucasiques, sino-tibétaines, na-dene, burushaski, et autres langues isolées ou éteintes, était peut-ětre au maximum de son extension au temps de l'occupation de ľEurope par l'homme moderne, il y a quarante mille ans. La famille la mieux connue reste ľindoeuropéenne. On a essayé de lui trouver un lieu d'origine, avec des résultats incroyablement différents. D'un auteur a l'autre, on a proposé de nombreux espaces, de LANGUES ET GENES ,,243 ' l'Allemagne jusqu'au nord-est du Caucase, des États baltiques jusqu'á Suez. C'est un espace aussi large que celui couvertpar la familie et dans certains cas il la déborde méme. II y a peu de temps encore, l'une des théories les plus populaires était celle de l'archéologue Marjia Gimbutas, qui place leur origine au-dessus de la mer Noire 'et aSsócie les' premiers peuples parlant des langues européennes avec la civilisation des « kourganes» dans les steppes asiatiques. Mais lorsque Gimbutasa publié son hypothěse, les dates des kourganes étaient mal connues. Elle a parlé de trois milie a trois mille cinq cents ans avant Jésus-Christ, une date qui passe pour impossible, car trop ancienne, aux yeux des archéologues anglais. II semble que ces dates aient été confirmées trěs récemment par de nouvelles fouilles qui ont aussi montré que les chevaux étaient probablement domestiqués et montés, et que les chars de guerre étaient bátis dans cette région., L'archéologue Colin Renfrew a avancé en 1987 une 'autre hypothěse, trěs intéressante, selon laquelle les langues indo-européennes auraient été diffusées par les agriculteurs néolithiques a partir du Moyen-Orient. J'ai déjá eu l'occasion de mentionner ce livre, dans le chapitre 4, puisqu'il a corroboré notre hypothěse, a savoir que la diffusion}e l'agriculture néolithique a. été un phénoměne démique et non cultutel. " IIétait difficile de ne pas noter la correspondance entre la diffusion des langues indo-européennes et une partie de l'aire de diffusion de l'agriculture; mais dans mes discussions avec Ammermann, mon collaborateur .archéologue dans ce travail, nous avions décidé que le travail archéologique ne pouvait pas nous informer sur 244 GENES, PEUPLES ET LANGUES la langue lorsque l'écriture elle-měrne était absente. Un archéologue du niveau de Renfrew peut se Permettre d'ignorer la rěgle. Lorsque je lui avais rendu visíte, il y a quelques années, il m'avait donné les bases de la théorie sur laquelle il était en train d'écrire son livre. Je lui avais fait remarquer la difficulté qui existait dans les aires méridionales 'de l'expansion de l'agriculture du MoyenOrient, oů l'on parle des langues de la famille afroasiatique qui ont une origine différente. Aprěs la parution de son livre, en 1987, Renfrew a ajusté son tir en tenant compte des nouvelles connaissances linguistiques a propos de 1a famille des 1angues dravidiennes, qui ont fait qu'elle a été appelée e1amo-dravidienne. 11 a été possible de montrer que, dans la région d'E1am, dont la capitale est Soussa, au sud-ouest de l'Iran, la langue parlée et écrite en cunéiforme appartenait a la famille dravidienne. Ce fait, dont la publication du livre de Ruhlen (1987) a permis de diffuser la connaissance, donne aussi d'auttes informations intéressantes a ce sujet: il existe aujourd'hui encore des 1angues dravidiennes au Pakistan et dans l'lnde du Nord, autres que celles qui sont parlées dans toute la partie méridionale de la péninsule indienne. La diffusion des 1anguesdravi- _ diennes devait étre jadis beaucoup plus vaste que celle montrée par 1eur distribution modeme, limitée au sud de 1a péninsule indienne. Ce fait est par ailleurs l'objet d'une cO:incidence, remarquab1e: j'ai publié dans 1arevue Muniba, en 1988, a l'occasion d'une conférence sur les Basques, une figurc qui résumait une hypothěse selon laquelle, au moment du développement de l'agriculture, on parlait au Moyen-Orient trois 1angues différentes qui se sont . :. LANGUES ET GENES 245 diffusées dans trois directions avec les agriculteurs et ont donné naissance a trois families Iinguistiques. Or, a peu prěs au méme moment, Renfrew publiait une correction de son hypothěse de 1987 dans la revue Pbil. Transaetions, dont.je vis le résultat pour la premiére fois dans un article qu'il publia en 1990 dans la revue Scientifte Ameriean. Les figures que nous avons indépendamment dessinées sont extrémement semblables. La question qui nous intéresse ici est 1a proposition par Renfrew que les 1angues indo-européennes ont eu leur origine en Turquie, puis se sont répandues en Europe avec les paysans néolithiques. II est clair que tous les immigrants emportent leur langue avec eux, et s'ils ne rencontrent aucun habitant dans les terres qu'ils vont occuper, ils n'ont pas de raison de changer leur langue. TI vaut la peine d'ajouter que les peuples d'Europe, avant l'arrivée des hommes néolithiques (souvent appelés mésolithiques), étaient dans la plupart des régions en faible densité, et comme ils vivaient de chasse et de récolte, ils choisissaient de préférence des environnements de forét, différents géologiquement de ceux qui étaient meilieurs pour 1a culture. L'idée de Renfrew donne aussi une date a 1aradiation des Ianguea.indo-eurcpéennes :_sept rnille -a sept milie cinq cents ans avant Jésus-Christ, soit l'époque du départ des agriculteurs. Cette date est une des causes de la résistance que l'idée a rencontrée, car des évaluations glottochronologiques, quoique trěs approximatives, auraient donné un age de six milie ans, ce qui est en accord avec l'origine kourgane suggérée par Gimbutas. Je suis convaincu, quand méme, que les idées de Gimbutas et de Renfrew sont justes l'une et l'autre. II n'y a • ý, ...J 246 GENES, PEUPLES ET LANGUES pas de contradiction entre elles; au contraire, elles se renforcent mutuellement. La date glottochronologique sur l'origine de l'indo-européen n'est pas fiable, puisque larelation exponentielle sur laquelle elle se base n'est pas valable sur tout l'intervalle (Kruskal, 1971). D'autres objections d'ordre écologique, comme le nom des arbres de la région d'origine, qui semblent plus favorables a une origine kourgane, sont fiables seulement pour cette région; ce qui explique probablement la plupart des langues européennes. II est clair que, génétiquement parlant, les peuples de la steppe sont súrcment des descendants des néolithiques du Moyen-Orient qui ont immigré dans la région des steppes en se dirigeant vers le nord, passant a l'ouest ou a l'est de la mer Noire. Aprěs leur arrivée, ils ont domestiqué le cheval qu'on ne trouvait pas partout avec la méme abondance et cela leur a permis de survivre et de prospérer dans un environnement hostile a l'agriculture. L'adaptation a pris du temps mais avec le développement des armes en bronze, qui a commencé a cette époque, vers cinq mille ou six mille ans avant J ésus-Christ, ils se sont trouvés préts pour une expansion : ils avaient de la nourriture, des moyens de transport, des armes nouvelles et puissantes. La région est devenue pendant trois ou quatre mille ans le point de départ de nombreuses expansions qui se dirigěrent vers ' le sud-est, par l'Asie centrale, en direction de la Perse, l'Afghanistan, le Pakistan et l'Inde; et vers l'ouest,en direction de l'Europe centrale et de ľEurope du Nord. On le voit, ces deux expansions successives ont eu des origines et des directions différentes, mais elles ont toujours concerné les mérnes peuples. Les langues des . :. LANGUES ET GENES 247 kourganes avaient entre trois mille cinq cents et quatre mille ans de différence de celles qui étaient originaires du Moyen-Orient, et étaient donc déjá différenciées les unes des autrés. r::eSlangues indo-européennes, arrivées des steppes eurasiatiques avec la culture arienne, ont remplacé presque totalement les langues dravidiennes en Iran, au Pakistan et dans l'Inde septentrionale, mais a . fa périphérie de l'expansion arienne les langues indoeuropéennes ne sont pas arrivées a s'imposer tout a fait : les langues dravidiennes sont encore parlées de nos jours, en particulier dans le sud de la péninsule indienne. . IIs'avěre que les gěnes suivent l'évolution générale des langues. Tous les peuples de l'Inde sont caucasoides, mérne s'ils sont plus sombres de peau que les Caucasoídes du Nord, mais les populations du Sudqui parlent des langues dravidiennes ont une composition génique un peu différente. Dans cette partie du monde, au moins trois couches ethniques se superposent: la plus ancienne et la plus limitée, qui n'est malheureusement pas bien étudiée, montre un type physique ayant quelque ressemblance avec les aborigěnes australiens (ks Australoídes) ; puis viennent les Dravidiens, surtout au sud de l'Inde oů ils ont été moins mélés aux envahisseurs ariens; les derniers, les Ariens, sont plus clairs de peau. Dans la partie centrale et orientale de l'Inde, on a eu aussi des infiltrations du sud-est de ľAsie. Une analyse des composantes principales des cartes géniques de l'Inde, non encore publiée mais établie en collaboration avec Madhav Gadgil, de BangaIore, ses collaborateurs et Eric Minch, de Stanford, montre que la premiére composante atteint un pic vers " 248 GENES, PEUPLES ET LANGUES l'Afghanistan, oů les Ariens sont passés, et montre une forte corrélation avec les dates archéologiques qui prouve la premiére arrivée du cheval dans les différentes régions indiennes. II n'existait pas de chevaux sauvages en Inde, cet animal y ayant été introduit par les Ariens. L'association des deux idées de Gimbutas et de Renfrew me semble beaucoup plus vraisemblable que celle d'une origine de toutes les langues indoeuropéennes modernes qui proviendrait seulement de la Turquie, comme le suggěre la deuxiěme hypothěse. Cette idée nous vient d'une nouvelle étude. Les langues indo-européennes ont été analysées trěs soigneusement des le siěcle passé aprěs la naissance officielle de la famille, qu'on peut dater de 1786. Cette année-lá, le juge anglais -Sir William Jones lancait dans une fameuse conférence tenue a la Bengal Asiatic Society de Calcutta, qu'il venait de fonder et dont il était le président, la théorie que les langues sanscrite, grecque et latine, et peut-étre aussi les langues gothique et celtique, montraient des ressemblances telles qu'il fallait admettre .qu'elles avaient eu une origine commune. Auparavant, d'autres savants avaient déjá noté des ressemblances entre le sanscrit et les langues européennes, tels le marchand florentin Filippo Sassetti au xvť siěcle et le pere jésuite Coerdoux qui, a la fin du xvnť siěcle, avait envoyé de Pondichéry a l'Académie des Inscriptions de Paris des notes montrant que sanscrit, grec et latin devaient avoir une origine commune. Mais ces observations n'ont pas eu le retentissement de la conférence de Jones. En 1863, le linguiste allemand August Schleicher a publié un arbre de l'origine des langues indo- " LANGUES ET GENES 249 européennes qui est assez semblable a celui qu'on peut dessiner aujourd'hui en utilisant des méthodes modernes. Mais a cette époque il n'y avait pas de méthodes quantitatives - elles ont été développées beaucoup plus tard, dans la seconde moitié du xx' siěcle - pour des applications biologiques. Toutefois, le rapport entre biologie et linguistique a été assez étroit, méme au début. Schleicher a certainement été influencé par l'usage théorique des arbres fait par Charles Darwin pour expliquer la théorie de descente des organismes, et Darwin, dans le chapitre XN de L'Origine des espěces, publié en 1855, dít clairement que si on connaissait l'arbre de descente biologique des groupes humains ()'n pourrait en tirer celui des langues. Cet essai, comme nous l'avons vu, n'a été fait qu'en 1988pour la premiěre fois et indépendamment de la .prophétie de Darwin. La premiére analyse quantitative moderne et complěte de la ressemblance entre les langues indoeuropéennes ne date que de 1992. Elle est due au statisticien Kruskal et aux linguistes Dyen et Black, qui ont mesuré la fréquence des mots d'origine commune dans toutes les paires possibles entre environ six douzaines de langues indo-européennes, en utilisant la liste glottochronologique standard de deux cents mots. En appliquant a leurs données deux méthodes modernes de reconstruction d'arbres développées en génétique, nous avons obtenu des arbres reproduisibles qui correspondent approximativement a l'arbre de Schleicher. La plus grande différence est la position de la racine. Les groupements plus importants de langues indoeuropéennes sont .les sous-familles germanique (qui....--. . , 250 GENES, PEUPLES ET LANGUES comprend aussi la langue anglaise et les langues scandinaves), italique (issue du latin), balto-slave, celtique, indienne et iranienne (que la plupart des linguistes considěrent comme un seul branchement, tandis que, selon Kruskal et ses collěgues, elles sont séparées). Plusieurs langues ont une origine isolée et séparée de ces sous-familles: l'albanais, l'arménien et, plus tard, le grec. Les langues éteintes comme l'hittite et le tocharien ne sont pas comprises dans cette analyse. Le méme arbre a été obtenu par deux méthodes de reconstruction (UPGMA et NJ) et est donné en résumé dans la figure 3. Il est possible que les langues isolées comme l'albanais et l'arménien et, avec moins d'évidence, le grec soient originaires de la premiére vague, qui est partie de la Turquie. Leur ancienneté par rapport aux autres branches est responsable de leur position dans l'arbre. Elles sont aussi géographiquement plus proches de la Turquie. Notre analyse rassemble les langues indienne et iranienne dans une branche indo-iranienne, selon la tradition classique des études indo-européennes et a la différence des conclusions de Kruskal et al., obtenues par une méthode statistique qui n'utilise pas les arbres. Mais la partie commune aux branches, dans notre arbre, est brěve et sa longueur n'est pas significativement différente de zéro, ce qui diminue la force de la conclusion selon laquelle les langues indiennes et iranienne ont une ongme commune. Les autres branches sont peut-étre dérivées de la deuxiěme vague de migrations indo-européennes, qui part de l'aire kourgane de l'ouest, tandis que la branche indo-iranienne viendrait d'une aire kourgane de l'est. LANGUES ET GENES 251 c· " ---....lI~~.5 ~ " ~> l:: ClI ~V3 ~ fl ~ ~ -t: ~ ~ ~ " ',,>:> .g ~o:; ,~ u ~ rr) u "v~. •.. o ,~ .~ cv 'o'v § -< v: 'Cd -----~~'~.o <: 252 GENES, PEUPLES ET LANGUES Bien d'autres expansions ont apporté des langues nouvelles a des terres nouvelles. Les expansions démiques que nous connaissons ont presque toutes été accompagnées par leur langue d'origine. Entre les expansions préhistoriques étudiées soit génétiquement, soit linguistiquement, celle des populations parlant la langue bantoue présente un intérét particulier. Malgré les contacts et les échanges avec des peuplades parlant d'autres langues, comme les Nilo-Sahariens en Afrique de l'Est et les Khoisanides en Afrique du Sud, les Bantous ont gardé leur individualité génétique, qui les distingue des autres Africains de ľOuest dont ils sont issus. Partis du Nigeria et du Cameroun, ils se sont diri- . gés vers le sud, non loin de la cóte atlantique. Cette premiěre expansion a débuté a l'époque néolithique, il ya plus de trois mille ans. Plus tard, l'expansion bantoue a été favorisée par l'utilisation du fer, dont on trouve des traces archéologiques trěs claires au Nigeria des cinq cents ans avant ]ésus-Christ. Cest seulement vers l'an zéro de notre ěre que les Bantous ont atteint la région des Grands Lacs (Ouganda et Kenya) et, des cette .époque, l'archéologie trouve un fort développement de l'usage du fer. L'expansion bantoue vers le sud s'est développée du cóté occidental et du cóté oriental, les deux courants se mělant plus tard. II semble que les Bantous étaient encore a quelques centaines de kilometres du Cap lorsque les Hollandais y ont débarqué vers 1650. La vitesse de cette expansion est un peu plus rapide (environ un kilometre et demi par an) que celle de l'agriculture néolithique qui est partie du Moyen-Orient. Dans la plupart de leurs expansions, les Bantous pouLANGUES ET GENES 253 vaient utilise~ des haches de fer, plus efficaces que les haches de pierre pour ouvrir la forét. La génétique ~ontre 9ue le ~ud de ľAfrique a été atteint d'abord par 1expanslOn occidentale et que l'expansion orientale s'est arrétée bien avant, ce que prouvent a la fois les derniěres découvertes archéologiques, qui montrent que les B.antous sont arrivés trěs tót dans la région de la Namib!e, ~t les plus :~:ents résultats de la linguistique, qui n avait pas Jusqu lCl exploré suffisamment les langues de la branche occidentale. II n'est pas possible .que la corrélation entre lan~es et gěnes soit parfaite puisque les conquétes rapides de grandes régions peuvent permettre de remplacer les langues originelles par des langues nonapparent~es, mais ces phénoměnes ne semblent pas assez frequents, pour que la corrélation disparaisse, :t:Jous voyons egalement qu'en cas d'échanges génétiques pr~longés avec des voisins différents, les genes peuvent etre reml?lacés. Cependant, malgré ces deux causes , de confusion, la corrélation entre genes et langues res~e ~ositive et statistiquement significative. II est interessant de noter que méme au niveau microgéographique, les régions ayant été soumises 'a une étude détaillée ont montré des corrélations trěs élevées entre géographie, génétique, linguistique et autres aspects culturels, comme les noms de famille. Souvent la mosaíque génético-linguistique observée nous montr~ trěs cl~irement les effets des nombreuses expansions -:-c~~ames sont c~~ues ~storiquement -, leurs superposinons et leurs -mteracnons. II arrive que l'on trouve des perturbations, mais elles ne parviennent pas' clansla plupart des cas a détruire la clarté de la corrélation entre peuples, gěnes et langues. 254 GENES, PEUPLES ET LANGUES L'évolution des langues est un sujet duplus haut intérět. Dans ce chapitre, nous n'avons fait que l'aborder pour expliquer les raisons des ressemblances entr~ . gěnes et langues. Mais l'évolution linguistique est aUSSl trěs importante pour comprendre l'évolution cultureUe, que nous allons analyser dans le chapitre suivant. Chapitre 6 LA TRANSMISSION ET L'ÉVOLUTION CULTURELLES L'homme se distingue des autres animaux, méme de ses cousins les plus proches, par la richesse de sa culture etpar laplace qu'elle occupe dans savie. La culture n'est pas réservée a la seule espěce humaine comme on ne manque pas de le constater des que l'on accepte de définir le terme de facon assez large. Les anthropologues ont proposé des centaines de définítions de laculture qui sont pour la plupart trěs abstraites et excluent la technologie. Je préfěre adopter une position inverse et donner la définition la plus simple et la plus vaste possible: elle inclut la technologie, qui a joué et continue dejouer un role essentiel dans l'évolution culturelle et dans ľhistoire humaine. Dne telle définition inclut la culture animale, naturellement moins développée que la culture humaine puisque la communication est trěs réduite, mais dont les origines et les conséquences sont identiques. La culture est le résultat de cequ'on apprend ďautrui, par opposition a ce qu'onapprend seul, par soi-méme. S'il s'agit dans les deux cas ďun apprentissage, la différence est grande entre apprendre par soi_•»>: . .