“人類基因組不再是一個(gè)空殼了。”國際科學(xué)界5日宣布,“DNA元素百科全書”計(jì)劃(簡稱ENCODE)獲得了迄今最詳細(xì)的人類基因組分析數(shù)據(jù),以30篇論文的形式同時(shí)發(fā)表在英國《自然》雜志等多份學(xué)術(shù)刊物上。
人類基因研究再突破
這是“人類基因組計(jì)劃”之后國際科學(xué)界在基因研究領(lǐng)域取得的又一重大進(jìn)展。人類基因組計(jì)劃讓我們得到了人類基因組圖譜,但其中許多基因過去都不知道有什么功能。研究者最常關(guān)注的是與編碼蛋白質(zhì)相關(guān)的基因,但它們只占整個(gè)基因組的約2%。一個(gè)聚集了422位科學(xué)家的國際團(tuán)隊(duì),完成了解析基因組剩余部分(非編碼區(qū)域)的工作,人類基因組中約80%的基因都有某種確定的功能。
參與這項(xiàng)計(jì)劃的英國桑格研究所研究人員珍妮弗·哈羅說,如果說人類基因組計(jì)劃提供了一張地圖,那么ENCODE計(jì)劃就在這張地圖上標(biāo)出了各個(gè)基因的功能信息。
這兩個(gè)計(jì)劃之間也有承上啟下的關(guān)系,在人類基因組計(jì)劃基本完成的2003年,國際科學(xué)界創(chuàng)建了ENCODE計(jì)劃。這也是一個(gè)大型國際合作項(xiàng)目,來自美國、英國、西班牙、日本和新加坡五國32個(gè)研究機(jī)構(gòu)的科學(xué)家參與了此次項(xiàng)目,耗資1.5億美元。他們獲得并分析了超過15萬億字節(jié)的原始數(shù)據(jù),目前已經(jīng)全部公布。研究對(duì)147個(gè)組織類型進(jìn)行了分析,以確定哪些能打開和關(guān)閉特定的基因,以及不同類型細(xì)胞之間的“開關(guān)”存在什么差異。
中科院北京基因組研究所副研究員嚴(yán)江偉認(rèn)為,如果說人類基因組序列只是確定了字典里的字,現(xiàn)在ENCODE計(jì)劃等于為這些字加了注釋。“比如說研究先天性心臟病就可以去查心臟方面的基因。但目前人類基因功能的研究成果還是基礎(chǔ)研究,離應(yīng)用研究還有一段距離。”
“垃圾DNA”并非垃圾
基因是遺傳的基本單位,到上世紀(jì)60年代,科學(xué)家認(rèn)為基因是用以制造蛋白的DNA編碼。人類基因組中2.1萬個(gè)蛋白質(zhì)編碼基因只占了整個(gè)基因組的1.2%,那么,其余98.8%的基因是做什么的?1972年,日本遺傳學(xué)家大野干給這些不能編碼蛋白質(zhì)的DNA片段起了個(gè)名字,叫做“垃圾DNA”。
ENCODE項(xiàng)目的一個(gè)主要目的就是去分析那些“垃圾”的功能。經(jīng)過ENCODE合作項(xiàng)目的初步努力,現(xiàn)在科學(xué)家們可以說“80%的基因組是有功能的”。
其余的20%也不是垃圾,該項(xiàng)目的首席分析員伊萬·伯尼解釋說,雖然ENCODE只分析了147種不同類型的細(xì)胞,但總數(shù)上千。如果還檢測(cè)其他類型的細(xì)胞,功能可能會(huì)出現(xiàn)比例分化。“這就像是從80%到100%,”伊萬·伯尼說,“我們真的沒有任何多余的大區(qū)域DNA。這個(gè)‘垃圾’的比喻沒有多大用處。”
開關(guān)調(diào)控基因活性
人類基因組中的“垃圾DNA”實(shí)際上是一個(gè)龐大的控制面板,能調(diào)控?cái)?shù)以百萬計(jì)基因的活性。如果沒有這些開關(guān)調(diào)控,基因?qū)⒉荒苷9ぷ?,而這些區(qū)域也許會(huì)導(dǎo)致人類患上疾病。
從遺傳學(xué)角度來看,同卵雙生的孿生子具有完全相同的基因組。但是雙胞胎即使在同樣的生活環(huán)境下也會(huì)表現(xiàn)不同的性格,這是因?yàn)榛蚧钚允遣煌?,同樣的基因,有些基因活性大,有些活性小?/p>
比如一種叫柳穿魚的花卉,大多是對(duì)稱的白色花瓣,有一些卻長成黃色五角星。這兩種花是同一種植物,樣子不同并不是因?yàn)樗鼈兊幕蛴胁町悾且驗(yàn)镈NA甲基化模式讓一些基因“閉嘴”,這個(gè)基因活躍的時(shí)候花就是左右對(duì)稱的,如果它沉默,花朵就變成軸對(duì)稱。
這樣的例子在植物中很多,在動(dòng)物中也被發(fā)現(xiàn)不少,甚至可以幫助了解癌癥起源。長久以來,人們了解到,當(dāng)DNA發(fā)生變異時(shí)細(xì)胞很容易發(fā)生癌變。最近的一些研究表明,當(dāng)表觀遺傳標(biāo)記被干擾時(shí),細(xì)胞也會(huì)更容易發(fā)生癌變,因?yàn)槟切┲陵P(guān)重要的基因被關(guān)閉了,而那些應(yīng)當(dāng)被關(guān)閉的基因卻被打開了。
正如同人類基因組計(jì)劃帶給生物醫(yī)學(xué)研究領(lǐng)域的革新意義,ENCODE項(xiàng)目也將推動(dòng)生物醫(yī)學(xué)的前進(jìn),開辟研究新道路。這份基因組功能圖譜,其中包含有400萬基因的“開關(guān)”,這一重要的參考數(shù)據(jù)將有助于研究人員找到與人類疾病密切相關(guān)的區(qū)域。
專家訪談
人類基因“天書”有了注解
——專訪中科院北京基因組研究所曾長青研究員
記者:ENCODE計(jì)劃的成果對(duì)人類有何意義?
曾長青:意義非常重大。完成了人類基因組計(jì)劃和國際單體型圖計(jì)劃,相當(dāng)于讓我們知道了我們的基因組的DNA排序與個(gè)體之間的差異。而ENCODE計(jì)劃則是分析在DNA序列上的各種功能信息,例如了解除了編碼蛋白的序列之外,在基因上或基因周邊還有哪些序列促進(jìn)或抑制一個(gè)基因的表達(dá),以及這些功能元件各自以什么樣的方式發(fā)揮作用。這相對(duì)于在全基因組范圍內(nèi),即在人類基因組這本天書上,加上了對(duì)于重要字詞、句式的注解,使我們能夠解讀天書中這些字句的含義。
記者:了解基因的功能有什么作用?對(duì)人類治療某些疾病有幫助嗎?
曾長青:ENCODE對(duì)于DNA上調(diào)控基因表達(dá)的體系做了詳細(xì)和深入的解析,這些知識(shí)結(jié)合其它研究所獲得的大量疾病相關(guān)基因,就可能幫助科學(xué)家針對(duì)這些基因的關(guān)鍵元件設(shè)計(jì)藥物靶點(diǎn),或者針對(duì)不同個(gè)體易感基因上功能元件的多態(tài)性設(shè)計(jì)個(gè)體化治療方案,達(dá)到有的放矢的治療目的。另外,很多基因產(chǎn)物,例如多種有分解作用的酶蛋白參加藥物的代謝,了解了這些基因的功能元件,就可以根據(jù)這些元件上的遺傳多樣性檢測(cè)不同個(gè)體對(duì)于藥物的反應(yīng)和代謝能力,從而設(shè)計(jì)個(gè)體特異的用藥方案,使藥物治療更加合理和準(zhǔn)確有效。
記者:我國人類基因組學(xué)研究有哪些進(jìn)展?
曾長青:我國雖然沒有直接參加ENCODE計(jì)劃,但像全球其他研究人員一樣,很多中國學(xué)者也在進(jìn)行類似的探索。只是大家多是針對(duì)某一類型的功能元件或是某一區(qū)域的元件進(jìn)行的研究,而ENCODE的研究則非常全面和系統(tǒng),在整個(gè)基因組范圍研究所有功能元件的類型、特點(diǎn)與機(jī)制。所有這些工作同ENCODE計(jì)劃的結(jié)果都對(duì)于徹底讀懂、讀通人類基因組這本天書有重要意義。此外,我國參加貢獻(xiàn)了1%和10%的人類基因組計(jì)劃和國際單體型圖計(jì)劃,這兩個(gè)計(jì)劃所獲得的對(duì)于基因組序列和多態(tài)性的信息正是ENCODE得以開展的基礎(chǔ)。(北京日?qǐng)?bào))