圖說:上海科學家領銜創建新的全基因組分析方法并發現人類在早、中更新世過渡期經歷嚴重的群體瓶頸 采訪對象供圖
你敢信?長達11.7萬年的時間里,人類祖先成年個體數僅剩1280!
你敢信?在距今93.0萬年前,人類祖先由于早、中更新世過渡期的氣候劇烈變化,在短期內喪失了約98.7%的成員個體,幾乎滅絕!
這些發現,來源于中國科學院上海營養與健康研究所李海鵬研究組與華東師范大學腦功能基因組學研究所潘逸萱研究組合作的結晶。相關成果于北京時間今天(1日)凌晨2時在國際頂尖學術期刊《科學》(Science)上在線發表。
圖說:中國科學院上海營養與健康研究所研究員李海鵬介紹科研成果 郜陽 攝
缺少DNA“逼出”新方法
很多人應該還記得去年諾貝爾生理學或醫學獎爆出的大冷門,在人類演化以及已滅絕的人類基因組研究方面作出杰出貢獻的斯萬特·帕博摘下桂冠——十多年前,他發表了首個尼安德特人基因組序列。
這位古DNA研究界大神的獲獎也讓人們開始思考一個問題:我們為什么要追溯過去?
這個問題,在2013年時,同樣縈繞在中國科學院上海營養與健康研究所研究員李海鵬的心頭。
“史前人口數量的變化,綜合反映了該時期氣候環境的變遷,所以通過群體遺傳學的研究方法進行回溯,可以更深入地了解現代人類的形成。”他解釋。
最近400萬年內的人科化石,展示了我們的祖先如何一步步進化演變為現代人;而最近100萬年是人類進化的關鍵時期,即由直立人到現代人的關鍵時間段。不過,人類群體歷史的研究多局限于最近的10萬年內,也就是現代人走出非洲、擴散到全世界的那段歷史。
“雖然古DNA測序技術發展迅猛,但非洲氣候炎熱,不利于DNA的保存,所以無法從10萬年前非洲人類祖先化石中提取古DNA。”李海鵬表示。
史前雖然沒有文字記載群體數量,但有效群體大小會影響每個世代的溯祖率——兩個譜系在上一世代來自同一祖先的概率。人類祖先曾在群體基因組中留下印記,反映當時的群體大小,群體歷史越久遠,留存至今的印記信號越微弱。
為準確解讀這些信號,進而準確估算百萬年前人類群體歷史,研究人員創建了群體遺傳學和計算生物學新理論:快速極小時間溯祖(FitCoal)。
為古人類群體“人口普查”裝上“八倍鏡”
“此前,已有方法對10萬年以內的群體歷史有較為準確的估計,為了估計百萬年前的群體歷史,就需要設計一個高精度的新方法了。”李海鵬打比方說,以前的方法就好像100米內用手槍瞄準,而FitCoal就像是裝上了“八倍鏡”,可以看清千米內的目標了。
據了解,遵循這一理論進行數學推導,獲得在任意群體模型下突變頻譜對應溯祖樹枝長期望值的解析解,計算出觀察到樣本突變頻譜的概率,進而估計群體歷史。通俗來說,FitCoal無需事先獲得群體歷史的先驗知識,即可自動快速搜尋出極大似然值,從而估算群體歷史,對古人類群體進行“人口普查”。
研究人員通過設定群體歷史模型并分析模擬產生的DNA多態數據,衡量估計群體歷史的無偏性和95%置信區間,評判了FitCoal的準確程度:FitCoal估計的群體歷史不但是無偏的,而且置信區間小于目前領域內常用的三種方法。
研究人員進一步通過大量的計算機模擬,分析不同條件下的群體歷史,包括群體交融和自然選擇,所有結果均表明FitCoal可以精準地估計百萬年內的人類群體歷史。
長期從事群體遺傳學和進化基因組學方面研究的美國南佛羅里達大學教授劉曉明認為,這是目前為止最為準確地估計有效群體規模歷史的方法,而且這個方法具有數據形式適應性強,計算速度快等一系列優點,有非常廣泛的應用前景。
基于FitCoal,研究人員分析了來自千人基因組和HGDP-CEPH基因組計劃產生的、共50個現代人類群體的基因組數據,首次發現在距今93.0萬年前,人類祖先由于早、中更新世過渡期的氣候劇烈變化,在短期內喪失了約98.7%的成員個體,幾乎滅絕。在長達11.7萬年的時間里平均成年個體數僅為1280。
“回顧之前的人類有效群體規模歷史的研究,其實這一瓶頸事件也并非無跡可尋。”劉曉明教授指出,這項研究是一個非常好的方法學推動科學發展的案例。
發現“古事”更要啟迪未來
值得一提的是,上海科學家領銜發現的這一嚴重的遠古群體瓶頸,恰好與非洲人類祖先化石的缺失環節、非洲直立人化石的消失、新的古人類物種的形成、兩條古人類2號染色體的融合階段相對應。
“這一遠古時期群體數量的衰減,降低了65.85%現代人群的遺傳多樣性,對人類生命和健康產生了深遠的影響,很可能決定了現代人類許多關鍵表型的形成。”李海鵬表示。
他介紹,在長達11.7萬年的時間內,平均成年個體數剛過千,饑荒是個無法排除的假設。那么科學家們就會進一步想到,什么樣的人能在當時的環境下生存,是否是他們能更有效利用能量呢?他進而思考,如今肥胖率上升,又是否和相應的基因突變有關。“我們已經定位了相關基因,今后的研究會靶向遺傳學上的改變。”李海鵬透露,如果這一假設成立,則證實全人群都對糖尿病易感,或許會顛覆長久以來人們對該疾病的認識。
在李海鵬看來,這項研究成果有著諸多“溢出效應”:有助于揭示腫瘤的演化,幫助揭開腦容量快速增長的分子機制的秘密……甚至,“千人幸存”的歷史或許是人類命運共同體的最早實踐。
中國科學院院士、中國科學院上海營養與健康研究所學術所長李林則點了“計算生物學”的名。在此次成果中,這門方興未艾的學科大顯身手。據悉,計算生物學可應用的領域很多,如支持創新藥研發、幫助科學家找到疾病背后的科學機理等。“生命科學是基礎研究中最重要的組成部分之一,計算生物學在其中占有重要的一席之地,上海營養與健康所將充分發揮融‘營養、大數據、健康’為一體的特色優勢,持續產出高質量的基礎研究成果。”李林表示。
(新民晚報記者 郜陽)