日前,由科学技术部高技术研究发展中心(基础研究管理中心)牵头组织的“2020年度中国科学十大进展”遴选成果揭晓。古基因组揭示近万年来中国人群的演化与迁徙历史的研究入选其中。
“十大进展”评选词指出,中国科学院古脊椎动物与古人类研究所付巧妹研究团队首次针对中国南北方早期人群展开时间跨度最大、最系统的古基因组研究,为阐明中国族群的形成过程及修正东亚南方人群演化模式做出重要科学贡献。
人类来自何方是科学研究中的一个重要课题。科学家们通过考古学、遗传学、基因组学等各学科的方法,探索人类演化历史,而最新的古DNA实验技术与分析方法的发展,通过直接研究过去人群的遗传成分,为我们揭示人类演化的过程细节提供了更有力的证据。
那么,中国人是从何而来?我们的祖先在历史的长河里曾经历了怎样的演变?他们的DNA向我们传递了哪些信息?对现在的人群又有着怎样的影响?中国科学院古脊椎动物与古人类研究所付巧妹团队的古DNA研究,将帮助我们了解近万年来中国人群在中华大地上繁衍生息、迁徙互动的遗传历史。
北京日报特约研究团队成员平婉菁工程师、张明博士和读者讲讲他们的新发现。
典型的北方人群生活环境。
典型的南方人群生活环境。
问:在介绍我们对南北方人群演化之谜的发现之前,能否向读者科普一下我们的研究方法,比如,为什么DNA可以揭示不同人群之间的遗传差异?
答:中国人见面很喜欢猜一猜,你是南方人还是北方人,以此来拉近距离或是开启话题,这是因为我国南北两地人群的差异由来已久。从地理上来看,以秦岭淮河为界大致划分中国南方和北方。从饮食上来看,我国素来有“南米北面,南甜北咸”的说法。从外貌特征来看,南方人大多娇小、性格细腻,比如有江南的小家碧玉;北方人则偏高大、性格豪爽,比如有东北的彪形大汉。
那么从科学的角度,怎么判断你是南方人,还是北方人呢?看遗传基因。
人类体内的遗传物质是DNA(脱氧核糖核酸),是亲代与子代之间传递遗传信息的物质。DNA存在于染色体内,呈现长链状结构,而基因是DNA的片段,碱基又是构成基因的小单元。A、T、C、G这四种碱基按照不同顺序排列组合,便形成不同功能的基因。
人类基因组约含有31.6亿个碱基对,通过碱基互补的半保留复制,我们一方面将遗传信息传递给子代,这也就是为什么可以利用DNA检测来进行亲子鉴定的原理,另一方面又因为在极少的情况下复制时会产生突变,使某些碱基发生“错误”改变,导致相关基因的结构和功能发生变化。随着这些“错误”不断地保存和累积,从而形成人和人之间的遗传差异。
这种“错误”对于人类的演化是非常重要的,可以说是我们现代人类得以从众多古人类分支里分化出来,成功适应地球各区域环境并生存下来的重要原因。众所周知,人类和黑猩猩有共同的祖先,而他们仅有约百分之一的遗传差异。人与人之间遗传差异平均是约千分之一,但由于人类基因组的数据量十分庞大,这些微小的差异也能记录极为丰富的人类遗传演化信息,是形成全世界各种人群不同肤色、发色、眼睛颜色、外貌、体型等的本质原因。
研究者们便是通过解析不同地理区域生活的人群体内的DNA信息,具体来说就是基因或碱基的特点,来了解他们在遗传上有什么不同、有什么联系、又有什么变化。
问:在我们这项研究中,主要使用了古DNA研究的方法,为什么古DNA研究对揭示南北方人群源流十分重要?
答:我们现在常说的南方人和北方人,大多数人群比如汉人,已经过不断的迁徙融合,没有当地的少数民族更具代表性。因为少数民族人群长期定居在南方或北方,他们的流动相对较少,他们的遗传成分便更具地方代表性。
因此,有研究通过比较现在中国南北方少数民族人群的基因组,来观察他们在遗传成分上的相似性和差异性。研究发现北方的少数民族(如:达斡尔族、赫哲族、鄂伦春族、锡伯族、蒙古族)和南方的少数民族(如:阿美族、泰雅族、布农族、拉祜族、苗族、傣族、土家族),在遗传成分上具有明显差异,也就是说典型的南北方人有着明显的遗传差异。
这就衍生出了新的问题:南方人和北方人的这种遗传差异和分化是从什么时候开始的?在不同的历史时期,这种差异是否发生变化?
为回答这个问题,付巧妹的研究团队历时8年,获取距今近万年以来的南北两地人群的古DNA信息。
古DNA是指古代生物遗骸中残存的DNA片段,包括古代人类、动植物和微生物等。如果从现代人的血液里提取DNA,那么提取到的DNA片段是连续、相对完整的。可是古DNA却并非如此。经过千年、万年以至数十万年的历史变迁,生物遗骸中的DNA长时间自然降解,还受到外界环境中微生物、水等因素的不断影响,变得十分破碎。此外,其中还充斥着大量微生物DNA的污染,有时还可能有现代人DNA的污染,属于目标个体的DNA的含量极低,甚至不存在。
古DNA特征示意图。
古DNA研究者的工作,就是要找到依然含有古DNA的生物遗骸样本;通过各种复杂实验从中提取出短的DNA片段,并将它们通过比对,还原出正确的顺序;然后测序评估数据,并在得到可靠数据的基础上进行相关生物信息分析和群体遗传学研究,比如探索古代和现代生物的谱系关系、追溯相关的祖先来源、遗传成分混杂和变化的模式等等。可以想见,这个实验与研究过程非常不易。尤其是针对中国南北方人群的大规模古DNA研究,在过程中存在许多难题和挑战。
一是古DNA研究材料少。可用于古DNA研究的人类化石、骨骼遗骸等相关材料非常稀少。尤其是南方材料更少,这是由于中国南方气候温暖潮湿,这种环境下有机质更容易被微生物降解,而土壤中丰富的腐殖质,造成土壤呈现酸性,又会严重降解骨骼中的无机质,有些骨骼已经被侵蚀得只剩下一个轮廓,甚至完全消失。在这项研究中,仅南方地区,付巧妹团队就曾经采集30多个遗址的257例古代人类样本,其中绝大多数完全不含人类古DNA。仅剩的少部分样本中的人类古DNA含量极低,使得以原有的技术条件根本难以获取有效的DNA数据以开展研究。
二是古DNA获取难度大。样本的保存情况已无法改变,要提取到有效的古DNA,只能从实验技术入手。为了从保存极低含量古人类DNA的样品中成功获取可供分析的DNA片段,付巧妹团队进行了大量实验尝试、改进和验证,最终开发出一种高效的核DNA捕获技术。
这是一种什么样的技术呢?我们可以形象地把它比喻为“钓鱼”技术。利用人类DNA的相似性,团队利用现代人DNA设计出一种针对目标DNA的特异性、互相吸引的“探针”。这种DNA“探针”如同钓饵一般,可以将目标的古代人类DNA片段从DNA混合溶液中吸附、“钓取”出来。
应用这种共同创新的古DNA技术,团队最终成功捕获中国北方山东、内蒙古及南方福建、台湾等地11个遗址25个距今9500年至4200年间的个体和1个300年前个体的DNA。
问:通过我们的研究发现,古北方人和古南方人的分野什么时候就开始出现了?他们各自有着什么样的来源,后来又经历了怎样的融合演化?
答:这些古DNA数据告诉我们,在近万年前,已经明确出现两种含有不同遗传成分的人群——以距今9500年至7700年间山东个体为代表的古北方人,及以距今8400年至4200年间福建和毗邻岛屿个体为代表的古南方人,这两种不同的遗传成分被称为古北方人成分和古南方人成分。
通过比较不同时期欧亚其他人群与古南北方人群的远近遗传关系及相关遗传成分的比例,研究进一步发现,古北方人群与西伯利亚东部草原人群共享祖先成分,而古南方人群与东南亚人群共享祖先成分。同时,古北方人成分与古南方人成分在南北方人群之间发生了流动和变化,使得他们的遗传差异和分化程度逐渐缩小。
在新石器时代早期,也就是距今9500年至7500年间,古南方人成分主导着南方地区,古北方人成分主导着北方地区。直到新石器时代晚期,也就是距今5000年至3000年间,仍是如此。
不过,距今8300年至7700年间山东人群的基因组中已经发现有古南方人成分;同样的,8300年前的台湾海峡亮岛1号个体也发现含有少量的古北方人成分。这表明在新石器时代早期,南北两地的人群已经开始存在融合与互动,由此产生基因上的双向影响。
而后,距今4800年至4200年间的福建和毗邻岛屿人群,显示含有更多的古北方人成分,这表明到新石器时代晚期,南北人群的融合与交流进程出现强化趋势。
但是直到现在,南方人群中的古南方人成分整体比例下降非常多,多到有些甚至以古北方成分占主导;而北方人群仍是以古北方人成分占主导。研究推测,在新石器时代以后,可能出现黄河以北人群大规模地向南迁徙,使得古北方人成分大量传播、扩散到南方,由此对南方人群产生显著的基因影响。
整体来看,中国人群在南北地域之间的演化和互动历程,反映出我国近万年来人群的基本连续性,也就是说这些人群的演变更多是由于内部的基因流动所带来的变化,并没有受到大量外来人群的影响。
东亚南北方不同时期人群的遗传特点变化示意图。图中绿色越深表示与古北方人关系更近,蓝色越深表示与古南方人关系更近,由此可出看古北方人向南扩散的趋势。
问:据说我们这项研究有一个十分重要的发现,就是南岛语系人群起源于中国大陆南方。能否介绍一下这个发现的含义是什么?
答:这项研究还有一个意外的发现,南方大陆距今8400年前的福建奇和洞人,显示与太平洋的岛屿人群有着非同寻常的遗传联系。由此可见,我们的祖先向外探索的脚步,其实比我们想象的要早得多。
这又是一段怎样的历史呢?在详细讲述之前,我们需要先了解一个特殊的人群——南岛语系人群。南岛语系是现在世界上唯一主要分布在岛屿上的一个语系,包括大概1300种语言,也是世界上分布面积最广的语系之一。南岛语系人群就是指使用这些语言的人群,他们的分布非常广泛,从非洲的马达加斯加岛,到南美洲西面的复活节岛,从北边的台湾岛和夏威夷群岛,到南边新西兰广阔海域内的岛屿。
关于这一人群的起源,学术界长期存在争议。考古学研究发现台湾地区早期的考古学文化与大陆东南沿海考古文化之间具有很多共同点,这种密切联系反映出南岛语系人群的起源地可能在中国东南沿海地区。部分现代遗传学研究认为,台湾岛是南岛语系人群起源地。还有部分现代遗传学研究通过某些方法推断,东亚南方内陆是南岛语系人群起源地,却没有确凿的证据。对此,付巧妹团队的这项古DNA研究,给出了明确的回答。
这项研究获取的古南方人基因组有:南方大陆8400年前的福建奇和洞人、距今4800年至4200年间的福建昙石山人和溪头村人,及台湾海峡距今8300年至7500年间的亮岛人、4800年前的锁港人等的古基因组。通过分析研究发现,4千多年前南方大陆上的古人群与台湾岛屿上的古人群都含有8千多年前的古南方人成分,他们都属于古南方人群。
福建8400年前奇和洞人的出土头骨图/供图范雪春
通过主成分分析,可以发现古南方人群跟3000多年前的瓦努阿图人和现在的南岛语系人群,比如台湾的少数民族(阿美族、泰雅族)因高度的遗传相似性而“聚”在了一起,而且相较于现在的南方大陆人群,明显向南岛语系人群倾斜。此外,通过结合欧亚其他地区的古代和现今人群的基因组数据,构建起系统发育关系树,可以发现不管是新石器时代早期还是晚期的古南方人,都与太平洋岛屿上的古南岛语系人群——3000多年前的太平洋西南部瓦努阿图岛民是相似人群。
这些证据表明,南岛语系人群明确起源于以中国南方福建及毗邻地区为代表的古南方人群,而且时间至少可以追溯到8400年前。
如果从更广阔的视角来看,东亚人群的迁徙在主体上呈现出“从北向南,从南向更南”的趋势。也就是说,我们可以观察到,东亚古北方人群对古南方人群产生影响,南方人群受到后期北方人群的压力后,继续向更南迁徙扩散到太平洋岛屿上。
问:听说我们这项研究还发现了一个有意思的现象,海洋不但没有对人群造成隔离,反而很有可能是当时人群互动和基因交流的一个非常重要的通道。能否详细地和读者介绍一下这是怎么回事?
答:在研究之初,付巧妹团队便获得台湾海峡的亮岛人基因组,虽然亮岛离福州仅仅24公里,但是团队依然存疑,亮岛人能否代表典型的古南方人?因为岛屿是一个非常特殊的环境,岛屿上的人群和邻近的大陆人群可能也会存在很大差异。例如印度安达曼群岛的一个人群,叫Onge(翁奇人),他们过着狩猎采集的生活,人口只有不到100人。由于地理的隔离,他们跟印度半岛大陆上的人群有很大的遗传差异。所以,亮岛岛屿上的古人群也有可能与南方大陆古人群存在很大差异。
于是,基于研究的严谨性追求,付巧妹团队排除万难、历时5年获得更具代表性的南方大陆古人群样本的基因组,从而明确:新石器时代早期中国南方大陆和毗邻岛屿的人群就已经互通往来,并没有形成隔离。
此外,研究进一步发现,东亚和东南亚地区所有沿海人群之间都很少存在隔离的情况。比如,越南4000多年前的人群跟我国沿海同时期的福建人群有遗传上的密切联系。而在日本,2700年前的绳纹文化人群,跟新石器时代的西伯利亚和我国福建地区的沿海人群也有遗传上的联系。
人类的过去是神秘而复杂的,古DNA研究者们一直在探索用更先进的技术方法带来更海量的遗传学数据,不管是人的还是动物的,通过解读这些遗传编码,去探知我们的来处,去了解我们一路走来的历程和风景,也给我们的今天带来启示。
,