對于古生物學(xué)家而言,如何通過形態(tài)性狀準(zhǔn)確還原遠(yuǎn)古化石的“生命之樹”是一項核心挑戰(zhàn) 。連續(xù)性狀在系統(tǒng)發(fā)育推斷中具有重要作用,但由于軟件支持有限以及高效處理缺失數(shù)據(jù)的挑戰(zhàn),它們往往被離散化甚至舍去,造成信息的弱化或缺失。
近日,中國科學(xué)院古脊椎動物與古人類研究所張馳研究員和北京大學(xué)生命科學(xué)學(xué)院本科生王子燁在國際專業(yè)期刊《古生物學(xué)》(Paleobiology)上發(fā)表了最新的研究成果,題為《An implementation of the Brownian motion model for Bayesian phylogenetic inference using continuous traits with missing states》。他們開發(fā)了貝葉斯系統(tǒng)發(fā)育軟件 MrBayes的新功能,即支持連續(xù)性狀演化的布朗運(yùn)動模型。該方法能夠高效處理任意比例的缺失數(shù)據(jù),并支持性狀之間和數(shù)據(jù)分區(qū)之間的演化速率差異,同時兼容無鐘模型與寬松鐘模型。
他們通過隨機(jī)模擬驗證了該方法的準(zhǔn)確性,并將其應(yīng)用于翼龍和古人類的實證數(shù)據(jù)集,結(jié)果顯示連續(xù)性狀可以提升系統(tǒng)發(fā)育樹的解析度。這一進(jìn)展拓展了形態(tài)數(shù)據(jù)與全證據(jù)系統(tǒng)發(fā)育研究的分析工具,并適用于諸多不同的分類群。
本研究得到了國家重點研發(fā)計劃和國家自然科學(xué)基金的支持 。
論文鏈接:https://doi.org/10.1017/pab.2025.10088

圖1: 無缺失狀態(tài)和有缺失狀態(tài)時的剪枝算法。此處使用一個連續(xù)性狀進(jìn)行示例(其狀態(tài)值位于五個分類單元樹的末端)。我們假設(shè)樹根位于分類單元 A 的分支上。算法以后根方式遍歷樹的內(nèi)部節(jié)點,即依次訪問I、J、K和根。對于具有兩個后代節(jié)點i和j的內(nèi)部節(jié)點k,我們計算對比量(x??= m??? m?)、祖先狀態(tài)(m?)以及變換后的分支長度(v?)。這些對比量服從相互獨立的正態(tài)分布。根據(jù)滑輪原理(pulley principle),根的位置不會影響似然值,因此可以放置在樹上的任意位置。當(dāng)分類單元B和D的狀態(tài)缺失時,我們只需剪去連接它們的分支,從而得到一棵具有A、C和E三個末端的星形樹。更嚴(yán)格的計算可參考原文。

圖2: 比較翼龍的系統(tǒng)發(fā)育樹:將貝葉斯支端定年分析得到的50%多數(shù)和意樹(A)與 TNT 分析的最簡約樹的嚴(yán)格和意樹(B)進(jìn)行對比。兩種分析均使用了翼龍的連續(xù)(經(jīng)標(biāo)準(zhǔn)化)和離散形態(tài)性狀。在支端定年分析中,采用的松弛鐘模型為獨立對數(shù)正態(tài)分布,并在兩個性狀分區(qū)之間共享。

圖3: 比較古人類的系統(tǒng)發(fā)育樹:使用連續(xù)(經(jīng)標(biāo)準(zhǔn)化)與離散形態(tài)性狀得到的50%多數(shù)和意樹(A)以及使用離散化的連續(xù)性狀與離散性狀得到的50%多數(shù)和意樹(B)。兩項分析均采用白噪聲松弛鐘模型,并在兩個性狀分區(qū)之間獨立。原研究(右側(cè))施加了 10個拓?fù)浼s束,這些約束基于使用連續(xù)與離散性狀在TNT中獲得的最簡約樹(Ni et al. 2021)。