發(fā)布日期:2018-03-28
家譜在遺傳學(xué)、人類學(xué)、經(jīng)濟(jì)學(xué)等多個(gè)領(lǐng)域有著廣泛的應(yīng)用。然而,擴(kuò)展家譜的收集是繁瑣的,且通常依賴于有限地理范圍和有使用權(quán)限的復(fù)雜數(shù)據(jù)資源。近日,一項(xiàng)發(fā)表在《科學(xué)》雜志上的研究報(bào)告稱,利用家譜網(wǎng)站上公開的在線數(shù)據(jù)收集到了千萬(wàn)規(guī)模人口的家譜。
Cienpies Design/Alamy
研究人員首先從Geni.com(該網(wǎng)站為全球最大的合作家譜網(wǎng)站之一,用戶在Geni上分享他們的家譜)那里獲得了8600萬(wàn)條記錄(其中4300萬(wàn)有家族信息)。其使用自動(dòng)化管道刪除任何無(wú)效拓?fù)洌ɡ鐡碛袃蓚€(gè)以上父母的個(gè)人)。這種自動(dòng)化方法與系譜學(xué)家在關(guān)于無(wú)效拓?fù)涞臎Q策上擁有90%以上的一致性。數(shù)據(jù)集中最大的一個(gè)家譜包括1300萬(wàn)人,在創(chuàng)始人和他們的后代之間平均跨越了11代。通過評(píng)價(jià)線粒體DNA (母系傳遞)和Y染色體短串聯(lián)重復(fù)序列(父系傳遞)等單系標(biāo)記的遺傳分離模式,也證實(shí)了家譜質(zhì)量的真實(shí)。
接下來,作者從在線檔案中提取人口統(tǒng)計(jì)數(shù)據(jù)(包括出生和死亡日期以及個(gè)人的地理位置)。通過關(guān)聯(lián)相關(guān)歷史事件(例如,重要戰(zhàn)爭(zhēng)中死亡率上升),對(duì)平均壽命與歷史數(shù)據(jù)進(jìn)行密切匹配,分析并證實(shí)人口出生和死亡期,進(jìn)一步得出主要城市中個(gè)人的首次歷史出現(xiàn)與其建立日期相一致,從而確定了位置數(shù)據(jù)的準(zhǔn)確性。
作者還創(chuàng)建了一個(gè)模型來檢測(cè)遺傳變異(包括可加性,優(yōu)勢(shì),上位性等)對(duì)長(zhǎng)壽的影響,該模型表現(xiàn)出了使用全基因組關(guān)聯(lián)研究難以解剖的復(fù)雜遺傳學(xué)。對(duì)300萬(wàn)對(duì)親屬壽命的分析揭示遺傳成分具有顯著的加性(約16%),顯性貢獻(xiàn)率較低(2~4%),沒有檢測(cè)到上位性,(表明基因?qū)﹂L(zhǎng)壽的作用可能比科學(xué)家們想象的小)。這些新數(shù)據(jù)中的加性遺傳因素低于先前的估計(jì)值(約25%),表明致力于從基因組數(shù)據(jù)中檢測(cè)致病基因的遺傳變異以尋求長(zhǎng)壽基因可能比預(yù)期的更困難。
此外,作者使用他們的數(shù)據(jù)集來分析人類遷徙模式時(shí),發(fā)現(xiàn)西方社會(huì)中的女性移民比男性多,盡管都是短距離遷移。因此,作者推測(cè),大規(guī)模的跨國(guó)移民活動(dòng)可能更多的涉及男性而不是女性。
作者通過分析婚姻半徑(配偶出生地之間的距離)—隨著它的增加,根據(jù)“隔離距離”理論可預(yù)測(cè)會(huì)導(dǎo)致夫妻遺傳相關(guān)性降低。在當(dāng)時(shí)主要的社會(huì)政治事件中,平均婚姻半徑也如預(yù)期的那樣發(fā)生了變化,例如在1750年和1870年工業(yè)革命出現(xiàn)后婚姻半徑增長(zhǎng)。有趣的是,在1800年之后,婚姻半徑的增加和夫妻的基因相關(guān)性下降之間存在50年的延遲,在此期間,盡管距離越來越遠(yuǎn),但是個(gè)人繼續(xù)與親戚結(jié)婚。作者將這種現(xiàn)象歸因于文化規(guī)范的改變,(而不是19世紀(jì)早期遠(yuǎn)程交通的出現(xiàn))。
這項(xiàng)研究證明了研究人員和公眾之間(通過在線數(shù)據(jù)庫(kù))合作的有效性。在將基因組測(cè)序數(shù)據(jù)覆蓋到這些譜系上之后,用這種方法建立的龐大家系將有助于對(duì)遺傳學(xué)和公共健康方面的定量評(píng)估。
參考資料:
Human genetics: Population-scale family trees from publicly available data
來源:生物探索