亚洲精品成人av观看,日韩精品亚洲aⅴ在线影院 ,国产精品 中文字幕 亚洲 欧美,精品成人av国产在线观看

详细内容

AlphaFold2同源建模

2020年12月,谷歌人工智能 AlphaFold2在第十四屆國際蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽CASP14比賽中,以摧枯拉朽之勢擊敗了所有對手,成功根據(jù)氨基酸序列預(yù)測了生命基本分子——蛋白質(zhì)的三維結(jié)構(gòu)。

圖片1.png

請記住AlphaFold這個(gè)名字,它是我們今天的主角。對于非專業(yè)的人來說,您可能覺得這個(gè)名字有點(diǎn)陌生,但您一定聽過AlphaGo,這個(gè)打敗了世界圍棋冠軍柯潔,被圍棋界公認(rèn)為棋力超過人類水準(zhǔn)的超級算法。而AlphaFold和AlphaGo則是一母所出的孿生兄弟,都是由谷歌DeepMind公司開發(fā)的頂級人工智能。AlphaGo在圍棋界已經(jīng)一騎絕塵,而前者,更是轉(zhuǎn)向了生命科學(xué)中最棘手的問題之一----蛋白質(zhì)折疊問題!

現(xiàn)在我們回到最初,了解一下蛋白質(zhì)的三維結(jié)構(gòu)是什么,CASP比賽又是什么。

蛋白質(zhì)的三維結(jié)構(gòu)

蛋白質(zhì)是一切生命的物質(zhì)基礎(chǔ),是機(jī)體細(xì)胞、組織和器官的重要組成成分。而一切生命的表現(xiàn)形式,本質(zhì)上都是蛋白質(zhì)功能的體現(xiàn),可以說沒有蛋白質(zhì)就沒有生命。

圖片2.png

蛋白質(zhì)是由氨基酸序列組成,但真正決定蛋白質(zhì)作用的是它的折疊方式,即氨基酸序列的三維結(jié)構(gòu)。人體中存在眾多類型的蛋白質(zhì),如血液中的白蛋白、球蛋白、血紅蛋白,肌肉中的肌蛋白,骨骼、皮膚、筋腱中的膠原蛋白,各種細(xì)胞中的酶蛋白等,每種蛋白質(zhì)都有自己獨(dú)特的蛋白質(zhì)三維結(jié)構(gòu)。換句話說,蛋白質(zhì)的三維結(jié)構(gòu)信息蘊(yùn)含著生命信息的密碼,決定了蛋白質(zhì)的工作方式和功能。

圖片3.png


很多人體疫病,都是由蛋白質(zhì)的錯(cuò)誤折疊引發(fā)的,比如帕金森癥、阿爾斯海默癥、亨廷頓癥等。藥物原理類似于一把鑰匙,鎖就是疫病靶點(diǎn),通常可以把它認(rèn)為是一種蛋白質(zhì)。鑰匙小分子加入鎖孔就是和蛋白質(zhì)發(fā)生結(jié)合,抑制蛋白質(zhì)正常作用,或者激活蛋白質(zhì)的某些作用。只有繪制出人體內(nèi)某些蛋白質(zhì)的三維地圖,才能找到藥物靶點(diǎn),完成精準(zhǔn)制導(dǎo)。因此,了解和預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),對于癌癥的預(yù)測、藥物靶點(diǎn)的選擇、新藥物的研發(fā)、免疫疾病的精準(zhǔn)治療具有重要的價(jià)值。

CASP的設(shè)立

那如何得到蛋白質(zhì)的三維結(jié)構(gòu)呢?目前世界上蛋白質(zhì)結(jié)構(gòu)發(fā)現(xiàn)的主要方法包括X-ray晶體衍射法、核磁共振法,以及2013年后成為熱門的冷凍電鏡三維重構(gòu)法等。但是這些設(shè)備采購成本高昂,比如一臺冷凍電鏡的售價(jià)大概是數(shù)千萬人民幣(600萬美元左右),外加上一些其他配置,維護(hù)成本高昂,實(shí)在難以廣泛推廣。且圖像重構(gòu)需要耗費(fèi)大量的計(jì)算力,往往需要很長時(shí)間才能解出一個(gè)新的蛋白質(zhì)3D結(jié)構(gòu)。

那有沒有簡單的獲取蛋白質(zhì)三維結(jié)構(gòu)的方式呢?理論上講,計(jì)算機(jī)是能夠推算出來的。由于氨基酸折疊成蛋白質(zhì)的力學(xué)原理很明確,包括氫鍵、范德華力、疏水作用等相互作用,上千個(gè)氨基酸折疊后形成的三維結(jié)構(gòu),達(dá)到了力學(xué)最穩(wěn)態(tài)。1972年,生物化學(xué)家Christian Anfinsen在發(fā)表諾貝爾獲獎(jiǎng)感言時(shí),提出一個(gè)著名的假設(shè):理論上,蛋白質(zhì)的氨基酸序列應(yīng)該完全決定其三維結(jié)構(gòu)。不過實(shí)際上,蛋白質(zhì)折疊問題的難度非常大。在形成三維結(jié)構(gòu)之前,蛋白質(zhì)的理論折疊方式是一個(gè)天文數(shù)字。分子生物學(xué)家Cyrus Levinthal 估計(jì),一種蛋白質(zhì)大約存在 10^300 種可能構(gòu)象。這個(gè)數(shù)字是什么概念呢,就是說即使把世界上所有的計(jì)算機(jī)算力加在一起,枚舉一種蛋白質(zhì)可能存在的構(gòu)象,從宇宙誕生計(jì)算到宇宙毀滅也算不完。所以如果僅依靠超級計(jì)算機(jī)的蠻力計(jì)算,是無法根據(jù)氨基酸序列預(yù)測出蛋白質(zhì)結(jié)構(gòu)的�?茖W(xué)界為了解決這一問題做出了很多探索,很多蛋白質(zhì)結(jié)構(gòu)預(yù)測算法應(yīng)運(yùn)而生,開頭我們提到的CASP蛋白質(zhì)結(jié)構(gòu)預(yù)測比賽即為了檢驗(yàn)預(yù)測蛋白質(zhì)結(jié)構(gòu)的技術(shù)水平而設(shè)立。

AlphaFold2的簡介

圖片4.png

2021年7月15日,關(guān)于AlphaFold2的論文在“Highly accurate protein structure prediction with AlphaFold”在Nature上發(fā)表[1],公布了AlphaFold2的原理,并在Github上將AlphaFold2的代碼開源[2]。

圖片6.png

AlphaFold2使用多序列比對,將蛋白質(zhì)結(jié)構(gòu)整合到算法。2018年的AlphaFold使用的神經(jīng)網(wǎng)絡(luò)是類似ResNet的殘差卷積網(wǎng)絡(luò),到了AlphaFold2則借鑒了AI研究中最近新興起的Transformer構(gòu)架。Transformer使用注意力機(jī)制興起于NLP領(lǐng)域,用于處理一連串的文本序列。而氨基酸序列正是和文本類似的數(shù)據(jù)結(jié)構(gòu),AlphaFold2利用多序列比對,把蛋白質(zhì)的結(jié)構(gòu)和生物信息整合到了深度學(xué)習(xí)算法中。

AlphaFold2的應(yīng)用方向:

通過同源建模預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),可預(yù)測蛋白質(zhì)之間的功能是否發(fā)生變化;計(jì)算藥物虛擬篩選即蛋白質(zhì)與小分子對接;預(yù)測蛋白與蛋白的互作結(jié)合位點(diǎn),為突變位點(diǎn)的設(shè)計(jì)提供重要的參考。對于癌癥的預(yù)測、藥物靶點(diǎn)的選擇、新藥物的研究具有重大貢獻(xiàn)。

案例展示:

蛋白A和蛋白C互作的結(jié)合位點(diǎn)  

蛋白B和蛋白C互作的結(jié)合位點(diǎn)

微信圖片_20230328151057.png

參考文獻(xiàn):

[1] Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold. Nature. 2021 Aug; 596(7873):583-589. doi: 10.1038/s41586-021-03819-2. Epub 2021 Jul 15. PMID: 34265844; PMCID: PMC8371605.

[2] GitHub - deepmind/alphafold: Open source code for AlphaFold.

南京源寶生物科技有限公司

南京市江北新區(qū)新錦湖路 3-1 號中丹生態(tài)生命科學(xué)產(chǎn)業(yè)園一期 B 座 16 層源寶生物




科研服務(wù)

新聞中心

技術(shù)資料

電話:025-52299880




手機(jī):18005142886




企業(yè)官方公眾號



聯(lián)系我們

產(chǎn)品中心

品質(zhì)源于專業(yè)

歡迎關(guān)注“源生課堂”公眾號


seo seo