【
儀表網 儀表研發】1月20日,中國科學院上海營養與健康研究所李海鵬研究組等在Human Genetics上,在線發表了題為Fine human genetic map based on UK10K data set的研究論文。遺傳重組是生命進化的基礎,在有性生物形成配子的過程中,來自父方和母方的染色體相互交換遺傳物質,從而增加了相鄰基因間不同等位基因的組合,豐富了遺傳多樣性。精確度量基因組不同區域的遺傳重組率是生物學研究的熱點。精確的遺傳重組圖譜對探究遺傳重組的發生機制、雜交育種、準確定位致病突變和某一性狀的決定基因,均非常重要。
遺傳重組率估值的精確度與數據囊括的遺傳重組次數成正比,若數據囊括了越多的遺傳重組事件,則遺傳重組率估值越精確,反之亦然。無論是基于家系或單精子測序的研究,還是基于群體遺傳數據的研究,這一原則均成立。基于群體遺傳數據的分析,局限于已有的分析方法,較難運用以分析大樣本。本研究中,科研人員擴展了前期開發的機器學習方法,運用新開發的FastEPRR 2.0分析了公開的UK10K共3,781個非相關個體(n=7,562個基因組)測序數據,基于Out-of-Africa群體歷史模型,準確估計了遺傳重組率,構建出精確的遺傳重組圖譜。總體上看,少數已知的遺傳重組熱點在UK10K遺傳圖譜中依然存在,但在UK10K遺傳圖譜中,遺傳重組率估值波動較為平緩,遺傳重組異質性較低。為了剖析樣本大小對估值的影響,研究從UK10K數據中隨機選取2,000、400和200個基因組測序數據,分析結果顯示隨著樣本量的降低,遺傳重組率的估值波動加大。上述結論不依賴分析時所用的群體歷史模型,研究人員在使用群體數量恒定模型中也觀察到同樣的現象。該研究提供了精確的人類遺傳重組圖譜,并發現遺傳重組在基因組上的分布或比預期的更均勻。
理論群體遺傳學領域擁有完善的數學基礎,與機器學習中的黑盒子概念相反。2008年初,研究人員預見有監督的機器學習對群體遺傳學的促進作用,因而在2011年與合作者首次將有監督的機器學習引入了群體遺傳學(Genetics),并在2013年(Genetics)、2016年(G3)持續發展這一新范式。在某些方面,雖然有監督的機器學習比極大似然法、貝葉斯等方法更好,但是這一新范式能否為進化生物學領域帶來新發現,依然未知。結果表明,新范式帶來了新發現,也回應了領域中某些質疑意見。
研究工作得到國家自然科學基金、中科院戰略性先導科技專項、國家重點研發計劃和營養與健康所的支持。
所有評論僅代表網友意見,與本站立場無關。