本報記者 張夢然
近期發(fā)布的幾組研究報告顯示,科學家們正以前所未有的力度考察人類的遺傳變異。其中在一項關于人類基因組外顯子組(蛋白質編碼區(qū))的深度分析中,研究人員提供了迄今為止有關該區(qū)域最全面的遺傳變異記錄;而在另一項研究中,科學家們改進了對基因變體的解讀。
基因組分析 外顯子組領先
簡單來說,外顯子組就是遺傳代碼中蛋白質編碼的組分,占整個基因組的1%到2%。對于基因測序儀來說,每測一次只能讀取一定數(shù)量的堿基,而通過外顯子組測序,科學家就能以更快的速度生成更多堿基。因此與全基因組相比,它也可以用更低的成本獲得更好分辨率的結果。
除效率因素之外,還有一個重要原因是,現(xiàn)在人們對外顯子組的解讀能力明顯強于對全基因組的解讀。全基因組測序產(chǎn)生的海量數(shù)據(jù)包括了非編碼堿基、結構和單倍型相位信息,但目前大多數(shù)核苷酸的作用仍然成謎。換句話說,外顯子組所不具備的,恰恰是現(xiàn)在掌控力不足的部分。
因此,當全基因組分析的成本、效率、難易程度都趕不上外顯子組時,后者在解讀“生命密碼”領域仍然魅力非凡。
最全面記錄 前所未有精細
此次,美國哈佛—麻省理工博德研究所丹尼爾·麥克阿瑟參與了人類外顯子組整合數(shù)據(jù)庫(ExAC)的項目,他與同事們分析了60706位被試者的外顯子組測序數(shù)據(jù),這些被試者來自包括歐洲、非洲、南亞、東亞和拉美在內的不同地理人口系譜。研究中發(fā)現(xiàn)了約740萬個遺傳子多態(tài),對人類低頻蛋白質編碼多態(tài)的分析,其分辨率達到前所未有的程度。
麥克阿瑟團隊通過分析該數(shù)據(jù)集來表征全球遺傳變異的模式,在較小的遺傳變異數(shù)據(jù)集上達到了此前無法實現(xiàn)的分辨率,遺傳變異密度令他們得以在同一位點分辨多重序列多態(tài),而數(shù)據(jù)集的規(guī)模則令團隊首次獲得一些有關疾病復發(fā)突變的發(fā)現(xiàn),這篇論文發(fā)表在最新一期《自然》雜志上,其研究結果有助于從臨床上發(fā)現(xiàn)與人類疾病相關的遺傳變異。
人類外顯子組整合數(shù)據(jù)庫項目提供了一個可公開獲取的參照數(shù)據(jù)庫,事實已證明這是一個有用的臨床工具,可用于評估潛在的孟德爾遺傳病(單基因?。┑闹虏』蚨鄳B(tài),其中一些多態(tài)在人口中的普遍程度令人難以置信。論文作者們分析了過往研究所報告的192個此類多態(tài),結果發(fā)現(xiàn),僅9個有充足的數(shù)據(jù)表明其與疾病相關。
是技術成就 也是政治成就
與此同時,在一篇發(fā)表于《醫(yī)學遺傳學》雜志的論文中,英國帝國理工學院羅迪·沃什與同事們評估了一種最常見的嚴重孟德爾病——心肌病的遺傳變異情況。心肌病表現(xiàn)為心肌損害引起心臟擴大,最終發(fā)展成心力衰竭,但發(fā)病原因一直以來都不是十分清楚。此次研究發(fā)現(xiàn),之前認為與特定心肌病相關的許多基因和基因多態(tài),可能并沒有關系。不過,現(xiàn)在利用ExAC項目已可以顯著改進對基因變體的解讀。
在發(fā)表于《自然·遺傳學》雜志上的另外一篇論文中,美國西奈山伊坎醫(yī)學院道格拉斯·魯?shù)路蚺c同事們也分析了ExAC項目數(shù)據(jù)集內罕見的拷貝數(shù)變異(CNV)。這是一種基因組結構變異,通常由基因組發(fā)生重排而導致,是人類疾病的重要致病因素之一,對其展開研究分析,將加深人們對符合孟德爾遺傳規(guī)律的單基因病與罕見疾病的了解。
一直以來都有研究設法記錄外顯子組內的遺傳變異,而人類外顯子組整合數(shù)據(jù)庫是其中規(guī)模最大最全面的一個項目。在本期《自然》雜志伴隨的新聞與觀點文章中,華盛頓大學杰·森德魯總結道,ExAC項目主要針對的是各種常見疾病的遺傳問題,其既是一項技術成就,也是一項政治成就,不僅曾面臨數(shù)據(jù)爭議,也是研究者、審批許可和14余項研究之間的角力。