杜若甫|從DNA看56個民族是血緣相連的一家人

〔摘要〕本文根據(jù)?38 個基因座的基因頻率,對我國各地的漢族人群與少數(shù)民族之間的血緣關(guān)系及各族的人種歸屬進(jìn)行了分析。作者認(rèn)為,全國各地的漢族與少數(shù)民族可分為南北兩大群,南方各地漢族及各族間的遺傳距離都比北方要大;長江以北的漢族與少數(shù)民族屬北方蒙古人種,長江以南的漢族與少數(shù)民族屬南方蒙古人種。且南、北漢族均與當(dāng)?shù)厣贁?shù)民族的血緣相近,而南、北漢族間的血緣卻很遠(yuǎn)。這說明,長期以來,漢族與少數(shù)民族之間有很多血緣交流。
〔作者〕杜若甫,1930 年生,中國科學(xué)院遺傳研究所研究員;肖春杰,1960 年生,云南大學(xué)生物系教授。
?
我們根據(jù)中國各地漢族人群和少數(shù)民族(共38個)基因座上的基因頻率數(shù)據(jù),計算了這些人群和民族兩兩之間的Fst遺傳距離;然后根據(jù)遺傳距離進(jìn)行了聚類分析,繪出了聚類圖,用的是相鄰單位連接法(Neighbor-joining method)。此外,還利用這些基因頻率數(shù)據(jù)進(jìn)行主成分分析,然后以第一二主成分為坐標(biāo),繪制了主坐標(biāo)圖。這些基因頻率數(shù)據(jù)來自國內(nèi)外的有關(guān)文獻(xiàn)和我們尚未公開發(fā)表的調(diào)查數(shù)據(jù)。
經(jīng)過計算與分析,一共有1923套基因頻率數(shù)據(jù)可用(一個人群一個基因座上的基因頻率算一套數(shù)據(jù))。當(dāng)同一少數(shù)民族或同一省、市、自治區(qū)的漢族人群在一個基因座上有不止一套的基因頻率數(shù)據(jù)時,便用加權(quán)法得出其加權(quán)平均值,用平均值計算遺傳距離,從而提高了基因頻率的準(zhǔn)確性。
?
一、漢族各地人群
30 個漢族人群間相互間的遺傳距離共有 435 個數(shù)值(見表 1)。從表 1 所列數(shù)值可以看出,遺傳距離最小的是 0—3 ,如黑龍江與吉林、山西、山東,遼寧與吉林、山東,山東與河南、吉林,湖北與云南,寧夏與安徽、甘肅、山東、天津,新疆與北京、天津、江蘇、陜西、安徽、吉林、寧夏,吉林與天津,這些省、市、自治區(qū)的漢族彼此間遺傳距離都很小。而廣西與吉林、山東,青海與廣東、廣西,江蘇與湖北,貴州與山西等遺傳距離則很大,都在 1000 左右或以上。
由于表?1 所列遺傳距離數(shù)據(jù)很多,不容易看出 30 個人群相互關(guān)系的主要特點(diǎn),而從根據(jù)這 435 個遺傳距離值進(jìn)一步進(jìn)行聚類分析所繪出的聚類圖(見圖 1)和主成分分析后繪出的主坐標(biāo)圖(見圖 2),則可以比較明確地看出一些特點(diǎn)。
從圖?1 可以看到,全國漢族分南、北兩大支,圖中臺灣以上,都是長江以南的省、自治區(qū),它們是浙江、海南、云南、福建、廣東、江蘇、湖北、四川、湖南、貴州、廣西,而新疆以下除上海、江蘇、安徽以外都是北方的省、市、自治區(qū):天津、陜西、河北、吉林、山西、黑龍江、青海、山東、河南、遼寧、內(nèi)蒙、甘肅、北京、寧夏。江蘇與安徽分別包括了對蘇北與淮北的調(diào)查結(jié)果,因此雖然與北方其他人群相距較遠(yuǎn),但仍與北方人群聚到一起了。上海漢族來自四面八方,比較雜,這可能是上海漢族與北方人群聚到一起的原因。
從圖?1 還可看出,南方人群間分得比較開,即每一枝杈均較長,枝杈長表示彼此間遺傳差異大。而在北方人群中,一些真正完全是北方人的人群都緊密地聚到了一起,只有安徽、江蘇、上海、新疆漢族人群才離得較遠(yuǎn)。南方人群間遺傳差異比北方人群間的大,這是歷史、地理原因造成的:1、當(dāng)北方戰(zhàn)亂與人口遷移頻繁時,南方戰(zhàn)爭少,遷移也少。漢朝以后北方人口開始大批南遷,才迫使原來長江流域居民南遷,以后又西遷至貴州、云南,有一部人(苗、瑤等)一直遷至境外緬甸、越南等地。2、南方山多,交通不便,而北方有華北平原、關(guān)中平原、松遼平原等,交通方便,地理隔離少,因而北方各地相互間基因流動多,而南方各人群間隔離較多。

漢族?32 個人群(包括香港與澳門的人群)的主坐標(biāo)圖(見圖?2)與系統(tǒng)樹十分一致,北方人群在上方,南方人群在下方。北方人群中,包括了安徽、江蘇、臺灣、上海等,安徽、江蘇、上海等漢族人群與北方人群相近的原因在上面已有解釋。臺灣人群實際上也來自四面八方,早期移民主要是從福建、廣東等遷去的,而后來,由于蔣介石被逐而到臺灣,有不少北方人去了臺灣。在整個坐標(biāo)圖上,廣西、湖南、廣東、江西、福建、貴州等人群在最下方,而青海、山西、吉林、山東、內(nèi)蒙、甘肅等人群在最上方,說明這兩組人群彼此間的遺傳結(jié)構(gòu)差異最大。

總之,對漢族人群的遺傳距離聚類分析以及主成分分析都明確顯示,漢族分南、北兩大群。南方漢族各地人群之間差異較大,北方漢族各地人群之間差異較小。
二、少數(shù)民族
37 個少數(shù)民族相互間的遺傳距離見表2。表中數(shù)字表明,布依族與鄂倫春族(1611)、京族與鄂倫春族(1598)、布依族與哈薩克族(1555)、畬族與哈薩克族(1553)、達(dá)斡爾族與哈薩克族(1494)、佤族與鄂倫春族(1482)、布依族與錫伯族(1452)、黎族與柯爾克孜族(1413)、布依族與東鄉(xiāng)族(1381)、壯族與柯爾克孜族(1365)等遺傳距離較大,它們一般都是一個南方民族與一個北方民族,只有達(dá)斡爾族與哈薩克族都是北方民族,不過一個在東,一個在西。遺傳距離較近的是德昂族與傈僳族(3)、赫哲族與錫伯族(10)、赫哲族與達(dá)斡爾族(25)、赫哲族與東鄉(xiāng)族(26)、東鄉(xiāng)族與回族(30)、東鄉(xiāng)族與達(dá)斡爾。族(41)、達(dá)斡爾族與錫伯族(37)、達(dá)斡爾族與鄂倫春族(37)等,它們一般是兩個北方民族或兩個南方民族。可是也出現(xiàn)一些乍一看不太容易理解的數(shù)值,例如佤族與塔吉克族的遺傳距離只有54,這可能有一定的偶然性,因為這兩個民族目前都有基因頻率的基因座數(shù)較少。而聚類分析和主成分分析,一般可以得出更符合實際的結(jié)論。
在用鄰接法繪出的聚類圖上,全國?37 個少數(shù)民族明確地分為兩支,右邊一支是17個北方民族,左邊一支是 20 個南方少數(shù)民族(見圖 3)。
在南方民族中,佤族不再與塔吉克很接近了,而是與傈僳、德昂、高山、傣等南方民族聚在一起了。四個新疆民族(維吾爾、哈薩克、塔吉克、柯爾克孜)單獨(dú)成為一支,彼此間遺傳距離不大(在圖中以平行線的長度表示),最后與其他民族相聚。其中研究得較多因而基因頻率數(shù)據(jù)較多的維吾爾族與哈薩克族,已可基本肯定應(yīng)屬蒙古人種,據(jù)初步分析,他們的蒙古人種血緣成分約占 70% 左右。
有點(diǎn)令人奇怪的是300多年前從東北遷到新疆的錫伯族,居然也和早在新疆的柯爾克孜、塔吉克、維吾爾、哈薩克等族聚在一起了。圖3中東北的一些民族除鄂倫春外,彼此十分靠近。藏族屬北方民族,但歷史上卻融入了少量中亞細(xì)亞人、波斯人、阿拉伯人的血緣。羌族也屬北方民族。全國回族實際上并無統(tǒng)一起源,本文所用數(shù)據(jù)雖然也有一部分是海南島回族的數(shù)據(jù),但主要是寧夏等地北方回族的數(shù)據(jù),所以回族仍歸北方民族。
在?20 個南方民族中,彝、納西、哈尼、白、阿昌、景頗、土家等族仍與北方民族比較靠近,說明這些民族或由于起源于北方,或歷史上原來已融入相當(dāng)多的北方蒙古人種血緣,但目前卻以南方蒙古人種血緣為主了。傈僳族本來應(yīng)與上述一些民族中的彝語系統(tǒng)民族比較靠近,但卻與傣、德昂等更近,這可能也因傈僳族有基因頻率的基因座數(shù)(10 個)較少,因而結(jié)果有些不太可靠。
壯、京、黎成為一群,說明他們遺傳結(jié)構(gòu)特別相近。瑤、侗、苗、畬、布依等也陸續(xù)歸入這一群。
佤、德昂與高山等族在南方民族中離其他族較遠(yuǎn)。佤族、德昂兩族和布朗族的語言屬孟—高棉語系,他們是云南最早的土著,與其他民族差異必然較大。高山族實際上有9個人群,即泰雅、雅美、阿美、賽夏、布農(nóng)、鄒、卑南、魯凱與排灣。在本文中,我們?nèi)园茨壳皣鴥?nèi)習(xí)慣統(tǒng)稱為高山族,把這九個人群的基因頻率數(shù)據(jù)合在一起作為高山族的數(shù)據(jù)進(jìn)行分析,結(jié)果表明,他們與我國其他少數(shù)民族差異較大。高山族是最后才與南方其他民族相聚的。
圖?3?表明,南方民族這一支上的遺傳距離一般都要比北方民族間的大。

在主坐標(biāo)圖(圖?4)上,少數(shù)民族也同樣分為兩部分,即上半部分是北方民族,下半部分是南方民族。在北方民族中,哈薩克、維吾爾、塔吉克等族位置都偏左,彼此間比較相近。滿、蒙古、朝鮮、藏、保安、回等族相聚在一起,說明他們遺傳結(jié)構(gòu)十分相似。藏族和滿、蒙古、朝鮮等典型北方民族仍十分靠近,羌族、赫哲族等也仍與北方民族在一起。
在南方各民族中,高山、德昂、佤、京等族與其他民族相距較遠(yuǎn),其中均操孟—高棉語系的德昂與佤兩族十分靠近。納西族與阿昌族和用鄰接法所作系統(tǒng)樹中的情況一樣,十分靠近北方民族。土家、白、彝、景頗、哈尼在南方諸民族中也比較靠近北方民族。

?
三、漢族與少數(shù)民族間的關(guān)系
在根據(jù)表3所列的遺傳距離用相鄰連接法繪制的系統(tǒng)樹(見圖5)上可以看到,無論漢族和少數(shù)民族,都分南、北(即圖中下、上)兩大群。不過,總的說來,漢族人群間還比較靠近,而少數(shù)民族則分得很散。尤其是北方內(nèi)蒙、甘肅、黑龍江、陜西、吉林等地的漢族更是緊靠在一起。南方漢族中,四川、湖南、貴州在一枝上,而且比較靠近;廣東與廣西在另一枝上,而且廣西漢族與壯族緊靠在一起。土家族、彝族處在南方這一大群的最上方,靠近北方人群。

在主坐標(biāo)圖(見圖6)上,同樣也是上半部是北方人群,下半部是南方人群。在北方人群中,甘肅、內(nèi)蒙、黑龍江、陜西等漢族及蒙古、朝鮮等族十分靠近,與滿族、藏族也較近,散開得較遠(yuǎn)的是吉林漢族、鄂倫春族及維吾爾族。吉林漢族與黑龍江漢族等相距較遠(yuǎn)似乎有一定偶然性。在南方人群中,五個漢族人群都在右邊,但分得較散,少數(shù)民族均較靠左。

?
四、一些初步結(jié)論
1、中國人(包括漢族與少數(shù)民族,從遺傳學(xué)看,俄羅斯等個別少數(shù)民族也許應(yīng)除外),可分為南北兩大群,即南方蒙古人種與北方蒙古人種。長江以南的漢族與少數(shù)民族屬南方蒙古人種,長江以北的漢族與少數(shù)民族屬北方蒙古人種。
2、漢族起源于黃河中、下游的華夏族,本屬北方蒙古人種,由于不斷融合各地的其他民族,今天南方的漢族卻屬南方蒙古人種。
3、各地漢族與當(dāng)?shù)厣贁?shù)民族在血緣上相近,而南、北漢族間的血緣卻很遠(yuǎn)。這說明,長期以來漢族與少數(shù)民族間有很多血緣交流,主要是少數(shù)民族大批地融入漢族,其次是漢族與少數(shù)民族相互間通過通婚和小批移民融合。
4、漢族今天成為世界上人口最多的民族,主要是不斷地融入大量其他民族的結(jié)果。
5、北方少數(shù)民族中,蒙古、朝鮮、滿、鄂倫春、鄂溫克、錫伯、赫哲、達(dá)斡爾等是典型的北方蒙古人種。北方的回族、保安族也屬北方蒙古人種。維吾爾、哈薩克等民族中雖有一小部分來自高加索人種的血緣,但仍屬北方蒙古人種。羌、藏兩族也屬北方蒙古人種。
6、南方少數(shù)民族中,黎、壯、傣、布依、侗、瑤、京等是典型的南方蒙古人種民族,苗、畬等也屬南方蒙古人種,德昂、布朗、佤三個民族和高山族,在我國南方蒙古人種各民族中有一定的特殊性,他們最接近于東南亞的一些民族。彝、傈僳、白、納西、哈尼、阿昌等起源于北方的民族,由于現(xiàn)在已融入了大量南方民族的血緣,應(yīng)算南方蒙古人種。土家族也屬南方蒙古人種,但在南方各民族中,土家族與北方蒙古人種十分接近。
(本文原題為《從遺傳學(xué)探討中華民族的源與流》,有刪節(jié))