發(fā)布日期:2016-08-04
David Baker非常欣賞大自然的杰作。“這是我最喜歡的地方。”這位出生在美國西雅圖市的科學家站在華盛頓大學的一個臺階上,欣賞著遠處海拔4400米的雷尼爾雪山說。但如果跟著他走進實驗室,你很快就會發(fā)現(xiàn)這位計算生化學家明顯不只滿足于自然界的饋贈,至少在分子領域是這樣的。在其辦公室里一張低矮的咖啡桌上,放著8個玩具大小的3D打印蛋白質(zhì)復制品。
David Baker正在展示他所在團隊設計制作的人工蛋白模型。圖片來源:Rich Frishman
一些呈環(huán)狀和球狀,一些則呈管狀和籠狀,在Baker及同事設計制作出它們之前,這些蛋白質(zhì)模型均不存在。
過去幾年,得益于基因組學和計算機學的革命性成果,Baker的團隊已經(jīng)解決了現(xiàn)代科學領域一個最大的挑戰(zhàn):解釋氨基酸長鏈如何折疊為讓“生命機器”運轉(zhuǎn)的三維蛋白質(zhì)?,F(xiàn)在,他和同事已經(jīng)通過這種方法設計并合成了非天然的蛋白質(zhì),這些蛋白質(zhì)可以在醫(yī)藥到材料等不同領域發(fā)揮作用。
目前,這位蛋白質(zhì)設計大師已經(jīng)開發(fā)了一種實驗性艾滋病病毒疫苗、旨在同時抵抗所有流感病毒毒株的新蛋白、將重組后的DNA運入細胞內(nèi)的載體分子以及幫助微生物吸收大氣二氧化碳并將其轉(zhuǎn)化為有用化學物質(zhì)的新酶。Baker團隊及其合作者還報告稱,他們正在用多達120種設計蛋白質(zhì)制作進行可自我聚合的“籠子”,這將會打開通往新一代分子機器的大門。
如果說讀寫DNA引發(fā)了分子生物學的一場革命,那么設計新蛋白的本領將會在幾乎所有事物身上帶來革命。“沒有人知道它意味著什么”,因為它有著影響數(shù)十個不同學科的潛力,馬里蘭大學帕克分校蛋白折疊專家John Moult說,“它完全是革命性的。”
從DNA到蛋白質(zhì)
構(gòu)建蛋白質(zhì)的機制對地球上的所有生命來說都是最根本的。解決這一問題的一個方法是在實驗上確定蛋白質(zhì)的結(jié)構(gòu),比如通過諸如X光結(jié)晶法以及核磁共振(NMR)檢測等。然而,這些方法不僅緩慢,而且昂貴。即便在今天,國際蛋白質(zhì)數(shù)據(jù)庫僅儲存著大約11萬種蛋白質(zhì)的結(jié)構(gòu),而科學家認為蛋白質(zhì)的種類卻有億萬種,乃至更多。
了解其他蛋白質(zhì)的三維結(jié)構(gòu)有助于生化學家洞察每個分子的功能。為此,Baker等計算機建模專家嘗試利用計算機模型解決蛋白折疊的問題。
研究人員想到了兩種主要的折疊模型。其中,同源建模是將一個目標蛋白的氨基酸序列與一個模板(擁有類似序列且已知其三維模型的蛋白質(zhì))進行對比。但這種方法卻存在一個主要問題:盡管研究人員已經(jīng)進行了大量昂貴的X光結(jié)晶法以及核磁共振檢測,但依然沒有足夠的已知其結(jié)構(gòu)的蛋白質(zhì)可以用作模板。
而在20多年前,當Baker開始在華盛頓大學任教時,當時的模板數(shù)量就更少。這促使他跟蹤第二種方式,即從頭建模,該方法是通過計算相鄰氨基酸之間的拉力和推力,以此預測蛋白質(zhì)的結(jié)構(gòu)。Baker還成立了一個生化實驗室研究氨基酸之間的互動,從而幫助他建模。
通過這種更加強大的計算能力,他們創(chuàng)建了一個眾包性的外延項目(名字是Rosetta@home),該項目可以讓人們將閑置的計算機用于需要進行的計算,從而研究所有潛在的蛋白折疊。隨后,他們還添加了一個叫作Foldit的視頻游戲外延,可以讓偏遠用戶的獨特蛋白折疊觀點指導Rosetta的計算。該方法吸引了來自國際科學界的100多萬名用戶,此外還收到了包括從設計新蛋白到預測蛋白與DNA互動方式等在內(nèi)的20多個軟件包。
“David做的最聰明的一件事是成立了一個社群。”Baker此前的博士后、華盛頓大學蛋白設計研究所研究員Neil King說。現(xiàn)在約有400名活躍的科學家持續(xù)更新及改進Rosetta軟件。該項目可供科研人員和非營利用戶免費使用,但是會向企業(yè)收取3.5萬美元的費用。
基因組學線索
盡管Rosetta非常成功,但其仍有局限性。該軟件在預測氨基酸長度小于100的小蛋白質(zhì)結(jié)構(gòu)方面非常精確,但是和其他從頭建模的軟件一樣,它在構(gòu)建大蛋白質(zhì)分子時卻存在困難。幾年前,Baker開始設想能解構(gòu)大多數(shù)蛋白質(zhì)結(jié)構(gòu)的方法。
上世紀90年代計算生物學家Chris Sander提出的一項技術給他打開了一扇窗戶。Sanders等人很好奇基因序列是否有助于分辨那些展開時距離遙遠、折疊成三維結(jié)構(gòu)后彼此臨近的氨基酸對。他推理認為,那些比鄰的氨基酸對對蛋白質(zhì)的功能非常關鍵,并提出那些對蛋白質(zhì)結(jié)構(gòu)非常必要的特定氨基酸對可能會共同演化。
Baker和同事意識到掃描基因組能夠給Rosetta的從頭建模提供新的約束條件,他們抓住了這個機會寫了一個叫作Gremlin的新軟件,可以同時對比基因序列,并呈現(xiàn)所有可能同時進化的氨基酸對。“我們很自然地將它運用到Rosetta中。”Baker說。
其產(chǎn)生的結(jié)果非常有力,它讓Rosetta成為普遍認為的最好的從頭建模方式,而且它背后還有著更加深遠的含義。5年前,從頭建模僅僅確定了約8000個沒有模板的蛋白質(zhì)家族的56個蛋白。而從那以后,僅是Baker的團隊就補充了900個蛋白質(zhì)結(jié)構(gòu)。哈佛醫(yī)學院的Debora Marks認為,這種方式已經(jīng)適用于4700個蛋白質(zhì)家族。隨著基因組數(shù)據(jù)大規(guī)模涌入科學庫,Baker和Sander預測,讓蛋白折疊模型擁有足夠共同演化的氨基酸對數(shù)據(jù)以解開幾乎任何蛋白質(zhì)結(jié)構(gòu),可能只需要兩三年時間。
“萬能”蛋白質(zhì)
對于Baker來說,這只是開始。隨著Rosetta運算能力的穩(wěn)步提升以及計算能力的日益強大,Baker的團隊已經(jīng)掌握了蛋白折疊的規(guī)律,他們已開始利用這些知識嘗試“超越大自然的創(chuàng)作物”。“生物醫(yī)學界幾乎所有的東西都會因為能夠制作出更好的蛋白質(zhì)而受到影響。”哈佛大學合成生物學家George Church說。
Baker注意到,數(shù)十年來科學家一直在追求一種他稱之為“尼安德特人蛋白質(zhì)設計”的策略,它意味著可以扭曲現(xiàn)有的蛋白基因,使其做一些新事情。“我們過去一直受限于自然界存在的物質(zhì)……現(xiàn)在我們能夠讓生物進化走捷徑,設計出解決現(xiàn)代問題的蛋白質(zhì)。”
而且,非天然蛋白質(zhì)的潛在應用不只局限于醫(yī)藥領域。Baker及其同事還將一種叫作綠色熒光蛋白分子的120個副本聚合到一個籠子上,創(chuàng)建了當它們在組織內(nèi)移動時能夠通過光亮輔助研究的“納米燈籠”。
預測氨基酸序列如何折疊的能力有助于了解蛋白質(zhì)如何發(fā)揮作用,由此打開了設計出能夠催化特定化學反應或是可用作醫(yī)藥、材料的新蛋白通道。這些蛋白基因能夠在合成之后植入自然界生成蛋白質(zhì)的微生物體內(nèi)。去年,Baker的團隊和合作者報告稱他們在細菌體內(nèi)設計了一種全新的新陳代謝通道,它是用一個人工設計的能讓微生物將大氣二氧化碳轉(zhuǎn)化為燃料和化學物質(zhì)的蛋白質(zhì)實現(xiàn)的。
在一項或許可以稱為迄今為止最發(fā)人深省的研究中,Baker團隊設計了能夠攜帶信息的蛋白,模仿DNA的4個核酸信使在DNA分子有名的雙螺旋結(jié)構(gòu)中結(jié)合、纏繞?,F(xiàn)在,這些蛋白質(zhì)螺旋結(jié)構(gòu)尚不能傳遞細胞能讀取的遺傳信息。但它們具有深遠的象征意義:蛋白設計者已經(jīng)超越了自然的限制,現(xiàn)在限制他們的只有自己的想象力。“我們可以利用功能性蛋白建立一個全新的世界。”Baker說。
來源:中國科學報