研究语言的新视角

语言和基因的平行演变

作者:徐丹

来源:《当代语言学》2015年第2期

如涉版权请加编辑微信iwish89联系

哲学园鸣谢

摘要:跨学科研究语言学是时代使然。语言学应该多借鉴自然科学领域的研究及成果。对于人文科学来说,语言学是一门年轻的学科;对于自然科学来说,分子人类学是一门新兴的学科。结合两个学科(但不限于这两个学科)考察某些人群和语言,对语言学研究将大有裨益。

作者简介:徐丹,法国东方语言文化学院特级教授,研究兴趣为汉语句法、语言类型、语言接触,主要著作为Initiation à la syntaxe chinoise(中文版《汉语句法引论》),Typological Change in Chinese Syntax和《唐汪话研究》。

1、引言

在今天的研究领域,跨学科的研究越来越普遍。这是一种趋势,也是人类认识世界并对其进行研究的必然结果。文科和理科的特点不同,两个学科一般是各行其道。其实早在人类古文明时期,学者经常是文理兼通的,如古希腊时期的亚里士多德,意大利文艺复兴时期的达·芬奇、伽利略,法国的帕斯卡尔等等,这些伟人既是科学家又是哲学家。

科学研究的方法从合到分(分科分领域),又从分到合(跨学科、跨领域)都是时代使然。在特定的历史阶段都是研究方法进步到某一阶段的表现。以语言学为例,语言学创立于19世纪末20世纪初。索绪尔对语言的研究就是引用了自然科学的研究方法,即把研究对象分割为不同的单位,尽量优化研究对象,以排除干扰因素。从索绪尔开始,语言学第一次开始区分历时与共时、语言与言语、语音外壳与语义内容(一个词被诠释为音义一体的正反两面)。后来的语言学家把索绪尔创立的这些概念都扩展开来,建立了语言学不同的分支。比如汉语就分成现代汉语、近代汉语、中古汉语、上古汉语、汉语语音学、汉语音韵学、汉语构词法、汉语句法、汉语篇章、汉语语义学、汉语方言学等等。一般来说,每个语言学工作者都把自己限定在某一领域,专攻一项,不一定都关注其他领域。笔者窃以为,在索绪尔时代,这种分层次、分领域的区分是十分必要的,这是一种革命性的飞跃。而今天的社会是信息爆炸的时代,我们需要结合不同的领域,发挥各领域的长项,利用不同的资源对某一问题进行解剖。这会对研究有巨大的裨益和推动。比如语言学内部的各领域和不同学科的领域都可以在研究某一具体问题时相互借鉴甚至加以利用。举例来说,研究汉语文字必须兼通古音韵,否则很难研究透彻;研究方言最好兼通古代汉语,否则只见流,难见源;研究汉语,最好也兼顾汉语的“远亲近邻”,即其他讲非汉语的人群,这样才能挖掘汉语内部发展和外部影响的双重机制。

本文以几个具体案例讨论语言学如何利用其他学科的研究成果,从而改进我们的工作方法,开阔我们的视野。本文试图以此论证跨学科、跨领域的可行性和重要性。

2.分子人类学和语言学

分子人类学(molecular anthropology)是分子生物学和人类学的交叉学科。人类学是一个庞大的、包括众多学科的领域。分子人类学是近30年发展出来的新兴学科。它一出现就迅速发展,带动了许多相关学科,语言学就是其中一例。有新思维,才会有新方法。分子人类学家在研究人类起源的同时也注意到语言演变与生物的遗传演变有着类同的关系。他们在全球范围内对现代人群的线粒体DNA和Y染色体进行了大面积的调查,他们根据Y染色体分化的类别把人类定为20个主干单倍群。一些分子人类学家开始关注语言学和考古学,利用其他学科的研究成果佐证自己的假设和论断。英国的生物学家达尔文早在1859年就已断言:“如果我们拥有一个完好的人类谱系,那么人类种族的谱系分布就可以为目前世界上各种语言提供最好的分类。如果所有灭绝的语言,所有处于中间状态、正在渐变的方言也包括进去的话,我想这种分类才是唯一可行的。”①(Darwin 1859:第13章)

达尔文的著作发表两年后,德国语言学家施莱赫尔发表了他的不朽著作(Schleicher 2009[1861])。他似乎在达尔文未发表其旷世之作之前也想到了用生物学的原理对语言进行谱系分类。他认为语言也是有机体,有生、有死。这也许是语言学家第一次利用生命科学的例子。但后来这种跨学科的研究没有真正发展起来。直到分子人类学产生后,研究者又重新实践达尔文的预测。Cavalli-Sforza是这个领域的创始人。从1980年代起,他就呼吁基因研究应当和语言学、考古学结合起来。请看他画的语言和基因对比的树形图(见下页图1)。

图1中左栏为民族(基因),右栏为语言,描绘的是两棵系统发生树。其结果表明,遗传谱系和语言分类大致是平行演化的关系。不甚完美的是极少数,而且必有其历史、地理、文化等原因。生物学者已经发表多篇论文证明,从全球范围来讲,绝大部分地区的语言和基因是匹配的。从图1我们也可以看到生物科学和语言学之间的差异。这种差异实际上也可以叫做差距:遗传谱系的枝杈比语言学层次丰富,结构分明,各组的距离也一目了然。而语言学的分类或系统发生树还嫌粗糙。这是因为语言学的研究有其困难之处,在某些研究手段上也不占优势。后来许多学者的研究,如Renfrew(2000)、Bellwood(2001)、Dediu和Ladd(2007)、Atkinson等(2008)、李辉(2008)、Bowern(2011)、Forster和Renfrew(2011)、Atkinson(2011)、Cysouw等(2012)、Burlak(2013)、Diamond和Bellwood(2013)等将语言学和生物学这两个学科与考古学结合起来探索人类演变的历史。他们比语言学家大胆、乐观,充分利用语言学家提供的统计材料,提出基因和语言平行演变的证据。王士元很早就开始了跨学科、跨领域的研究。他在分子人类学发展初期就曾和Cavalli-Sforza联手工作过(Cavalli-Sforza and Wang 1986)。王士元(Wang 2000)通过赵桐茂等(1991)对中华民族起源的研究已经注意到,“跟一个汉族群体有着密切关系的往往并不是汉人,而是某个其他少数民族的群体”。潘悟云(2006)也曾与复旦大学的金力教授合作过。他们的研究在汉语研究方面开启了两个学科联合研究的序幕。

现在西方许多语言学家都开始关注生命科学的研究。从目前的研究看,西方的生物学家和语言学家对印欧语系、班图语系、南岛语系及拉美地区的基因和语言的平行演变的研究成果累累。结合基因研究探讨中国境内汉藏语系、阿尔泰语系的研究尚不多见,西方学者对中国境内的基因及语言的研究仍是空白,笔者主持的研究项目(请见题注)正在对中国西北部分语言做相关的研究,正在尝试着和生物学、遗传学研究者联合起来观察汉语及非汉语在西北地区的演变情况。

语言研究前沿与热点:研究语言的新视角(1)

遗传学者的研究成果表明,人类是从非洲走出来的,这一点已是共识。随着人群的分散和迁徙,历史上曾多次产生瓶颈效应,人类的基因也开始发生多样化。假设人类最初的语言或交流的共同语码是由这一群祖先扩散开去的话,那么从理论上讲人类的基因和语言应该是平行演化并具有相关性。但由于各种原因,如气候、地理、社会等因素,语言可以在极短的时间内被强势语言影响甚至替代,即人群的遗传结构并未发生变化,但语言却发生了变化。基因演变是随机的、天择的,而语言演变除了突发性的事件,还受到社会、文化、宗教等因素的巨大影响。这使得语言和基因演变有时不匹配。时至今日,语言和基因有相关性、在全球大部分地区都平行演变的观点已被广泛接受。但这种平行发展的普遍性经常在中国西北地区有“例外”。这些例外从微观或局部看其实是很普遍的现象,也正是我们的项目所关注或研究的对象。

3.两种领域研究方法的异同

遗传学是理科的领域,语言学是文科的领域。二者研究的方法当然有所不同。理科最大的特点是可以量化,可以被检验;而文科的软肋就是难以量化,这样被检验的困难大大增加,所以研究结果经常因难以有说服力而被其他学者质疑。语言学在文科领域里算是严谨的一支,我们应该尽量利用理科的研究方法和手段。许多计算语言学的专家和学者一直在做跨领域的工作,江荻等(2014)的近期研究也是一个典型的例子,并代表了一定的研究方向。

生物学和语言学有很多相似之处,二者的研究方法也可以互相参照。Pagel发表了一系列有影响的文章(参见Pagel 2009的文献)。他根据达尔文里生物和语言的平行观点和例证,对生物学和语言演变的相似点做了比较,Pagel(2009:406)的图表很好地总结了二者之间的相似性和可比性。现将他的图表内容概括如下(语言学部分笔者加入了个人的观点):生物学和语言学的研究对象都具有离散性质,可以切分为不同的单位。生物学上可以研究基因的基本组成单位单核苷酸;语言学上可以研究音位(语言里可切分的最小的、具有区别性特征的单位)、语素(以音位构成的最小的、有语意的单位)、句法等。两个学科都运用可以重复(复制)的概念,生物上的重复指基因组上的一些片段有多个拷贝,复制是指父母双方的遗传物质通过该过程得以代代相传。笔者认为语言上的复制应当有两层含义,一个是语言本身的递归性质,使语言运用有限的句法规律,生成无限的句子;另一个是通过习得过程,人类代代口耳相传、模仿口头语言(有的语言包括文字)。生物学上有基因突变,语言学上有创新。生物学上可以研究同源关系,语言学上可以研究同源词。生物学上是自然选择(或天择),语言学上的许多选择是由社会因素决定的。生物学上有遗传漂变,语言学上有漂移或演化。生物学上有横向的基因转移,语言学则表现为不同语言之间词的借用乃至句法成分、句法结构的借用。生物学上物种可以杂交,语言学上语言可以产生混合。生物学上有地理渐变群,语言学上有方言链。生物学上有化石可利用,语言学上有古籍文献,尤其有出土文献、碑文或铭文可以利用。生物学上有物种灭绝,语言上有语言死亡或消失。

上面谈到的是两个领域相同的地方。二者不同的地方也是很多的。语言和基因一样一般是渐变的。由ATGC四种碱基组成的DNA序列在复制时会发生错误,这种错误就会导致突变,使人们之间产生差异。正像Cavalli-Sforza(2000:150)指出的那样:基因的突变是较少发生的,而且只发生在父母和孩子之间;而语言的变化是常态,且可以在毫无关系的两个个体之间发生。结果使得语言变化的速度比基因快得多。一个词如果能够一千年不变,那么一个基因可以上万年都不发生大的变化。这样的特性使两个学科衡量变化的尺度也大相径庭。语言学以千年为单位的很少见(近年来,这类研究在西方学者里多了起来),而生物科学较少顾及千年内发生的变化,因为他们想了解史前人类的来源及迁徙的历史和路线。他们的尺度常以万年计算。他们利用现代人类的母系线粒体DNA或者父系Y染色体的非重组区,可以追溯现代人群的远古祖先。但语言的变迁却难以构拟远古的词汇。Swadesh(1955)的基本词词表力图用比较客观的标准,计算出两个语言之间存在的同源词的比例,以估算出两个姊妹语言或语言树上的平级节点大约何时分离。对于他的词表(100词和200词),有些语言学家并不接受,比如基本词汇也可以发生借用,很难设想各语言在不同的时期按同一速度演变。最困难的问题是,过了一定的时间长度,语音对应规律怎样建立,可靠程度如何?但是在语言学者没有其他更好的方法之前,这一词表仍然被广泛使用,仍不失为有用的工具。这好比人类还没有发明其他交通工具以前,牛车、马车即是便利的工具。近年来不少学者仍然利用同一词表,但改进了Swadesh词表的计算方式,获得的效果就比较好。

生物学的数据很容易量化,他们更偏好非零即一的统计建立模型,而语言学很难如是操作,因为语言学在各个层面上都呈现连续统或渐变链。生物学是一门实验科学,语言学也很类似,但语言学很难做到排除一切干扰因素做纯而又纯的实验(除了语音实验),如词汇、句法等都同时要兼顾许多因素,因为排除语义和社会文化因素的句法是不存在的。所以语言学的研究很多时候甚至是经验式的。这些因素使得生物学家和语言学家研究不能采取同样的策略,比如基因采样时样本的代表性就很重要,以免结论不可靠。但是语言研究,不可能是绝对纯的,尤其是做语言接触研究,混杂的语言区域正是语言学家的兴趣所在,而对遗传学者来说,隔离人群往往可遇而不可求。

生物学家需要采样、整理样本,语言学家需要录音、整理材料。取什么类型人群的样本能说明问题,找什么样的发音人才有代表性,这都是两个学科时刻面对的问题。采样和找发音人都出自一个道理,即搜集最具典型性的个体。因为我们不可能采所有人的样,不可能录所有人的音。一是经济上不允许,二是没有这个必要。那么多少个体才能代表一个群体?根据统计学的经验,生物学家最低限度需要采集30个个体,就可以代表一个族群。那么语言应该录多少人的音,整理多少人的音系才算最佳选择呢?似乎这一问题没有太多的讨论(或者有不少,恕笔者孤陋寡闻,没有读到这些文章)。研究任何事情都需花人力、物力。如果明确在多小的范围内(即下限)基本可以满足需要的话,那将给我们省去很多不必要的花费。语言类型学有两个例子可以给人以启迪。Greenberg(1963)带领一个团队对30种语言(不包括汉语)进行了探索,分析、总结出类型学上的45条普遍规律。三十多年后,计算机科学有了飞跃性的发展,Dryer(1992)对625种语言又做了一次大规模的研究和统计,主要结果与Greenberg的完全相符不悖。那么是否可以认为语言类型学上最低限度30个样本也可以做出可靠的结论?当然在条件允许的情况下,多多益善,这是大数定理。但在条件不允许的情况下(而我们的研究更常处于这种不理想的状态),如果我们能在语言学每一层级的范围内制定出一个被广泛接受的最小基数,那对我们的研究将会事半功倍。

为什么语言学需要生物学呢?这是匿名审稿人等不少人提出的疑问。上面已经讲过,由于遗传学、生物学研究对象的特点(Y-染体只父子代代相传,线粒体只母女代代相传,从现代人可以追踪人类祖先)和手段上的优势(易于量化、模型化),生物学的研究成果为我们提供了可靠的人类迁徙、人类历史发展的全景图。按照语言和基因平行发展的理论,他们的研究可以作为语言谱系分类的可靠依据和参考。他们的实验结果也可以给语言学提供有力的佐证或反证。近年来许多西方学者研究的语系、超语系、原始宏语系等等都或多或少依赖生物学家提供的信息。再如我们做语言接触的研究,一些历史记载,语言证据都需要确凿的佐证,尤其是物证,而这点对语言学来讲,如果时间久远是最难做到的。遗传学由于突变率稳定、抗衰期极长、研究结果趋于客观等特点,这个领域恰恰可以为我们提供有力的证据。那么生物学需要语言学吗?回答也是肯定的。因为语言学、历史学、考古学可以从不同的侧面为生物学提供线索甚至佐证思路。2013年复旦大学对甘肃省文县铁楼乡的白马人进行了测试。白马人的Y-染色体的单倍群主要属于D类型,于大约5万年前进入亚洲,是东亚最古老的人群。藏族人的主要遗传类型也为单倍群D,但也有其他成分。为了弄清白马人和藏人的遗传关系,生物学工作者走访了语言学家。语言学提供的证据与人群遗传结构分析的结果完全吻合,即白马人与藏人最近,但不同于藏人。由于人的语言对识别一个群体有着至关重要的作用,所以生物学家需要通过语言学家对现代人语言的识别和分类提供的线索,去证实或证伪他们的假设。

4.基因和语言研究的具体案例

分子人类学和语言学的相关性至少可以从两个层面进行,一个是寻找人类语言的基因,另一个是理清人类语言和基因发展是否平行,如果不平行,原因是什么。寻找人类能控制语言能力的基因,一直是生物学家关心的热点,也是人类共同关心的题目。1990年代,科学家发现了第一个与人类语言有关的基因FoxP2,这一发现是研究了英国伦敦KE家族三代的基因图谱时得到的。这个家族某些成员有语言障碍,无法组织符合语法的句子。请看来自他们的基因图谱(图2)。

研究者对比基因图谱,研究和对比了该家族正常成员和语言有障碍者的基因,从而发现了与语言有关的染色体上的区域,从此开启了人类语言基因研究的新阶段。与此相隔不久,Dediu(2007)等人又发现了与声调有关的基因。他们发现声调和ASPM与MCPH等位基因有很强的相关性,即单倍群ASPM-D和MCPH-D频率高的地区,大多是非声调语言,频率低的地区则多为声调语言。

语言研究前沿与热点:研究语言的新视角(2)

图3中A代表ASPM单倍群的地理分布,B代表Microcephalin基因单倍群的地理分布,C表示声调语言的分布。作者指出,图上的人群分布建立在有基因材料的基础上。言外之意,有可能有不全或遗漏的统计。尽管人类语言的基因研究还在初级阶段,但意义重大,生物学家毕竟迈出了第一步。我们语言学工作者应该多关注他们的研究。尤其汉语属于地道的声调语言,与这类研究更是密切相关。当然,分子生物学并不是万能的,这一学科也需要参考其他学科如语言学、历史学、人类学、考古学等才能更好地解释某些现象。各个学科只有携起手来,进行互补性的研究,将来才会有更多的发现和重大的突破。

语言研究前沿与热点:研究语言的新视角(3)

分子人类学和语言学的另一个研究领域,就是语言和基因演变的相关性。我们在第一节已经说过,自从Cavalli-Sforza开创这一领域以来,这方面的研究一直在蓬勃发展。笔者曾和兰州大学遗传医学中心的研究者们合作(徐丹等2012),研究了东乡语和东乡人的情况。结果表明,东乡语的少数阿拉伯语、波斯语、突厥语词汇,不是东乡语的借词,而应是该语言的底层,即东乡人祖语的遗留。兰州遗传医学中心的研究者们通过实验告诉我们东乡人的祖先主体由中亚族群组成,约占83%左右,蒙古族占0.08%,汉族占0.05%,藏族占的比例约0.02%。如果我们观察一下东乡语各种来源的词汇比例,我们就会发现一种根本的变化,即这些中亚族群的语言彻底被蒙古语(中古蒙古语)替换了,在这个基础上,汉语是近代加上去的一个层面。这些不同时期加上去的词汇特征反映了语言接触的历时变化,就像地质学家考察地层各个层面,就能测出各个地层形成的时代是一个道理。徐丹等(2012)已经指出,东乡语的现有词汇主体是蒙古语,约占60%,汉语约占35%,波斯语、阿拉伯语、突厥语词汇约占5.54%,可以说这些人群的祖语几乎荡然无存,藏语词汇和藏人的基因比例都微不足道。请看下面的图示:

语言研究前沿与热点:研究语言的新视角(4)

我们对比两个数据可以看到,东乡人的祖先群体在形成初期(14世纪左右)彻底转用了中古蒙古语,这与当时的历史事件紧密相连,请参看马志勇(1983,2009)、马虎成(1992,1993)、刘迎胜(2003)、周伟洲(2004)等文献。13世纪成吉思汗一度成为中亚、东亚北部的主宰,他带回大批的壮丁、工匠,其后代至今还留存在西北民间。这些来自异国他乡的族群,各自操着不同的语言、方言、土语。当时波斯在1365年和1372年进行过两次大的人口普查和语言普查(Amani 2005;Bahǎr 2005),他们多语并存的状况从侧面佐证了来华的族群也应是这种多语并存兼使用通用语的状况(徐丹2014)。东乡人的祖先也应是这一时期来到东乡的。他们今天的许多地名都是中亚地区的地名(马志勇1983;徐丹2014)。汉语词汇的大批进入应该是比较晚近的事情。假设东乡语大约形成于14世纪初期,那么700年的时间足够使一个群体或几个合并为一的群体的语言彻底丧失。由于突发的事件(如战争战败,天灾出逃而被迫移民等),一种语言不到100年的时间就可以被替换,如东乡语的形成就是个例子。马志勇(1983:40)、马虎成(1993:61)都曾经指出,东乡语的基本词汇和语言结构“基本上是十二、十三世纪蒙古语形式”;“现代东乡语与《蒙古秘史》中使用的蒙古语更为相似,这表明中亚撒尔塔人④使用的是十四世纪以前的蒙古语,以后没有与周围的蒙古族发生过关系”。又时隔600多年,一个在另一个语言的基础上发展变化出来的新的语言又开始被别的语言影响,汉语词汇的大批借人就是第二个大的冲击。但根据刘照雄(1981)、包萨仁(2006)的研究,东乡语的根基还没有被动摇。据笔者的研究,唐汪话受东乡语影响,虽然东乡语的借词在唐汪话生活用语中比例很小(不到2%,如果算上寺院传教用语,比例应比这个大),但东乡语的许多构词方式、句法形式却深深地植入了唐汪话,使其开始发生质的变化。我们由此看到,一个群体祖先的遗传成分与语言变化的速度不呈比例关系,一个语言词汇借用的比例与一个语言的变化深度也不呈比例关系,需要对每一个具体情况进行具体分析。

这种语言和基因不匹配的状况在别的地方也可以看到,比如西北地区的保安语。根据杨亚军(2008)的研究,保安族的族源也是多元的,是13世纪成吉思汗西征时强制从军的色目人。他还指出,从父系遗传背景看,保安族的族源来自中亚。这些信仰伊斯兰教的色目人逐渐和当地的其他民族混合,形成了今天的保安族。我们看到,保安人从形成时间来看,和东乡人差不多。我们可以同样推测,保安人的祖先也是操各种中亚语言的人群,来到中国以后,为了生存学习当地语言(蒙古语),逐渐形成了今天的保安语。西北一带的非汉语言,基本都是以类似方式形成的。遗传研究为我们提供了确凿的“物证”。

基因和语言是否平行演变的研究在国外比较多,比如Burlak(2013)发现,匈牙利人的语言属于芬兰-乌戈尔语系,但他们的基因类型更接近于邻近的斯拉夫人群。类似的研究时有报导,而大多是生物学家、考古学家等发表的,把两个领域结合起来的语言学论文到目前为止似乎还不多见。我们当然不可能对两个领域都精通或熟悉,但我们语言学工作者起码可以多关注别的领域的研究,因为“他山之石可以攻玉”。

本文想说明跨学科研究的重要性。历史学、人类学、语言学和分子人类学结合起来有广阔的前景。对于人文科学来说,语言学是一门年轻的学科,对于自然科学来说,分子人类学是一门新兴的学科。结合两个学科(但不限于这两个学科)考察某些人群和语言,是我们将来要做的工作。如果不研究一个民族的历史、文化,只限于单纯的语言学研究,有时会给我们的研究带来偏误。比如说在研究语言接触这个领域里,哪个是“源语言”、哪个是“目的语”、借用方向是什么等等,如果离开历史学、人类学等学科的考察,单纯从语言的表面现象下断言,有时会得出与事实相反的结论。中国境内的语言及人群资源是人类宝贵的财富,语言学工作者应当而且可以更多地利用自然科学的研究成果。当然,我们的研究才刚刚开始,还有许多艰苦而有意义的工作在等着我们。

释:

①If we possessed a perfect pedigree of mankind,a genealogical arrangement of the races of man would afford the best classification of the various languages now spoken throughout the world; and if all extinct languages,and all intermediate and slowly changing dialects had to be included,such an arrangement would,I think,be the only possible one.

②此数据来自徐丹等(2012),基因部分为文少卿和谢小冬的研究及统计。

③刘可有同学曾协助笔者作过统计。

④即东乡人。——笔者注

参考文献:

[1]Amani,M.2005.Quelques aspects démographiquesrelatifs aux langues locales en Iran.In T.Azadarmaki,C.

语言研究前沿与热点:研究语言的新视角(5)

,and M.Bozdémir,eds.,Contact des Languesdans L' espacearabo-turco-person.Téhéran:

语言研究前沿与热点:研究语言的新视角(6)

de recherchesen Iran.Pp.45-54.

[2]Atkinson,Q D.,A.Meade,C.Venditti,S.J.Greenhill,and M.Paget.2008.Languages evolve in punctuational bursts.Science 319,588.

[3]Atkinson,Q D.2011.Phonemic diversity supports a serial founder effect model of language expansion from Africa.Science.332,346-9.

[4]Bahaǎr,M.2005.Interérences linguistiquesetculturellesen Iran.In T.Azadarmaki,C.,and M.Bozdémir,eds.,Contact des Languesdans L' espacearabo-turco-persan.Téhéran: de recherchesen Iran.Pp.1-12.

[5]Bellwood,P.2001.Early agriculturalist population diasporas? Farming,languages,and genes.Annual Review of Anthropology 30,181-207.

[6]Bowern,C.2010.Historical linguistics in Australia:Trees,networks and their implications.Philosophical Transactions of the Royal Society Biological Sciences.12,3845-54.

[7]Burlak,S.A.2013.Languages,DNA,relationship and contacts.Journal of Language Relationship(Boпpoсы языковoгo pодства)9:55-67.

[8]Cavalli-Sforza,L.L.1997.Gene,peoples,and languages.Proceedings of National Academy of Sciences of United States of America(PNAS)94,7719-24.

[9]——.2000.Gene,Peoples and Languages.London:Penguin Group.

[10]Cavalli-Sforza,L.L.and W S.-Y.Wang(王士元).1986.Spatial distance and lexical replacement.Language 62,1:38-55.

[11]Cysouw,M.,D.Dediu,and S.Moran.2012.Comment on "Phonemic diversity supports a serial founder effect model of language expansion from Africa".Science 335,657b.

[12]Darwin,C.1859.On the Origin of Species.London:J.Murray.

[13]Dediu,D.2007.Non-spurious correlations between genetic and linguistic diversities in the context of human evolution.Ph.D.diss.,University of Edinburgh.

[14]——.2011.Are languages really independent from genes? If not,what would a genetic bias affecting languages diversity look like? Human Biology 83,2:279-96.

[15]Dediu,D.and D.R.Ladd.2007.Linguistic tone is related to the population frequency of the adaptive haplogroups of two brain size genes,ASPM and Microcephalin.PNA S 104,10944-9.

[16]Diamond,J.and P.Bellwood.2013.Farmers and their languages:The first expansions.Science 300,597-603.

[17]Dryer,M.S.1992.The Greenbergian word order correlations.Language 68,1:81-138.

[18]Dunn,M.,S.J.Greenhill,S.C.Levinsion,and R.D.Gray.2011.Evolved structure of language shows lineage-specific trends in word-order universals.Nature 473,79-82.

[19]Forster,P.and C.Renfrew.2011.Mother tongue and Y chromosomes.Science 333,1390-1.

[20]Greenberg,J.H.1963.Some universals of grammar with particular reference to the order of meaningful elements.In J.H.Greenberg,ed.,Universals of Languages.Cambridge,MA:The MIT Press.Pp.73-112.

[21]Lai,C.S.L.,S.E.Fisher,J.A.Hurst F.Vargha-Khadem,and A.P.Monaco.2001.A forkheaddomain gene is mutated in a severe speech and language disorder.Nature 413,519-23.

[22]Pagel,M.2009.Human language as a culturally transmitted replicator.Genetics 10,405-15.

[23]Renfrew,C.2000.At the edge of knowability:Towards a prehistory of language.Cambridge Archaeological Journal 10,7-34.

[24]Schleicher,A.2009[1861].Compendium dervergleichenden Grammatik der indogermanischen Sprachen.Cambridge:Cambridge University Press.

[25]Swadesh M.1955.Towards greater accuracy in lexicostatistic dating.International Journal of American Linguistics 21,121-37.

[26]Wang,W.S.-Y.2000.Linguistic diversity and language relationships.In C.-T.J.Huang(黄正德)and Y.-H.A.Li(李艳惠),eds.,New Horizons in Chinese Linguistics.Dordrecht:Kluwer Academic.Pp.235-67.

[27]包萨仁,2006,蒙古语族东乡语与汉语的接触研究。北京大学博士学位论文。

[28]江荻、康才畯、燕海雄,2014,词形结构进化与世界语言的多样性。《科学通报》第21期,2083-90页。

[29李辉,2008,人类语言基本元音体系的多样性分析。《现代人类学通报》第2期,42-51页。[30]刘迎胜,2003,回族语言800年发展史简要回顾——从波斯语到“回族汉语”。《中国文化研究》冬之卷,143-53页。

[31]刘照雄,1981,《东乡语简志》。北京:民族出版社。

[32]马虎成,1992,撒尔塔:一个曾经被忽略的民族名称(上)。《西北民族研究》第2期,65-72页。

[33]——,1993,撒尔塔:一个曾经被忽略的民族名称(下)。《西北民族研究》第1期,55-67页。

[34]马志勇,1983,“撒尔塔”与东乡族族源。《西北民族学院学报(哲学社会科学版)》第1期,31-48页。

[35]——,2009,《甘肃东乡族史话》。兰州:甘肃文化出版社。

[36]潘悟云,2006,中国的语言与方言。见金力、褚嘉祐主编《中华民族遗传多样性研究》。上海:上海科学技术出版社。118-38页。

[37]徐丹,2014,《唐汪话研究》。北京:民族出版社。

[38]徐丹、文少卿、谢小冬,2012,东乡语和东乡人。《民族语文》第3期,59-65页。英文版:2013.The Dongxiang language and people.Cambridge Journal of China Studies 8.2:40-8.

[39]杨亚军,2008,基因分析视野下的保安族源流探微。见迈尔苏目·马世仁主编,《在田野中发现历史》。北京:中国社会科学出版社。332-51页。

[40]赵桐茂、张工梁、朱永明、郑素琴、顾文娟、陈琦、章霞、刘鼎元,1991,中国人免疫球蛋白同种异型的研究:中华民族起源的一个假说。《遗传学报》第2期,97-108页。

本文转自:哲学园

,