計(jì)算機(jī)人工智能體系A(chǔ)lphaFold近來展望了數(shù)萬種蛋白質(zhì)的之前未知的三維布局。
美因茨約翰內(nèi)斯·古騰堡大學(xué)(JGU)的研討團(tuán)隊(duì)專注于具有高置信度分?jǐn)?shù)的子集,研討人員經(jīng)過算法闡發(fā)這一些猜測,發(fā)明蛋白質(zhì)骨架表現(xiàn)出稀有的拓?fù)鋸?fù)雜性,即打結(jié)。
個(gè)中,研究人員發(fā)覺了一個(gè)71-結(jié),這是迄今為止正在蛋白質(zhì)中發(fā)覺的最龐雜的拓?fù)浣Y(jié),和一些由兩個(gè)甲基轉(zhuǎn)移酶或碳酸酐酶結(jié)構(gòu)域構(gòu)成的六交織復(fù)合結(jié),每一個(gè)結(jié)構(gòu)域皆包括一個(gè)簡樸的三葉結(jié)。這一些深深嵌入的復(fù)合結(jié)顯然是經(jīng)由過程基因復(fù)制和打結(jié)二聚體的相互連接而產(chǎn)生的。

別的,該團(tuán)隊(duì)還報(bào)告了兩個(gè)新的五穿插結(jié),包羅第一個(gè)51-結(jié)。該事情闡發(fā)的構(gòu)造列表構(gòu)成了將來實(shí)驗(yàn)研討的根底,以確認(rèn)這一些新型打結(jié)拓?fù)洳⑻剿髌潺嫶蟮恼郫B機(jī)制。
該研討以「AlphaFoldpredictsthemostcomplexproteinknotandcompositeproteinknots」為題,于2022年7月13日宣布正在《ProteinScience》。
谷歌DeepMind開辟的人工智能(AI)體系A(chǔ)lphaFold兩次核心蛋白質(zhì)構(gòu)造展望技能(CASP)的關(guān)頭評價(jià)。AlphaFold2是一個(gè)深度進(jìn)修體系,它連系了基于蛋白質(zhì)構(gòu)造的進(jìn)化、物理和多少束縛的鍛煉順序。它的特點(diǎn)是展望的迭代細(xì)化,并答應(yīng)利用自蒸餾和自預(yù)計(jì)準(zhǔn)確性從未符號的蛋白質(zhì)序列中進(jìn)修,以利用一級構(gòu)造和同源物的對齊序列直接展望給定蛋白質(zhì)的一切重原子的3D坐標(biāo)。
AlphaFold2今朝曾經(jīng)猜測了數(shù)十萬種蛋白質(zhì)構(gòu)造,個(gè)中絕多數(shù)沒有包括在蛋白質(zhì)數(shù)據(jù)庫(PDB)中,該數(shù)據(jù)庫重要存檔實(shí)驗(yàn)肯定的構(gòu)造。是以,AlphaFold的猜測數(shù)據(jù)庫大概具有偉大的價(jià)值,稀奇是關(guān)于研討沒有普遍但仍與領(lǐng)會(huì)蛋白質(zhì)折疊潛在機(jī)制的復(fù)雜性具有高度相關(guān)性的蛋白質(zhì)現(xiàn)象。關(guān)于在其多肽骨架中包括拓?fù)浣Y(jié)的蛋白質(zhì),會(huì)呈現(xiàn)一個(gè)稀奇使人沉迷的現(xiàn)象,即從兩頭拉出后沒有會(huì)完整解開的蛋白質(zhì)。
正在曩昔的二十年中,僅發(fā)現(xiàn)了約莫20種不一樣的含有結(jié)的卵白質(zhì)家族。然而,打結(jié)的卵白質(zhì)對卵白質(zhì)折疊和進(jìn)化提出了挑釁。模仿算法常常高估卵白質(zhì)的打結(jié)幾率,由于后者低于隨機(jī)鏈的打結(jié)幾率。
另外,同源物之間的蛋白質(zhì)拓?fù)錁?gòu)造一般類似,這意味著正在進(jìn)化中密切關(guān)系的蛋白質(zhì)中往往會(huì)保存打結(jié)的折疊。因?yàn)檫@一些緣由,而且因?yàn)樽匀坏鞍踪|(zhì)之間打結(jié)的罕見性,正在展望蛋白質(zhì)構(gòu)造的龐大新數(shù)據(jù)庫中大概存正在打結(jié)拓?fù)錁?gòu)造引起了人們的濃厚興趣。
現(xiàn)正在,正在蛋白質(zhì)中發(fā)明的最龐大的結(jié)是單個(gè)結(jié),正在任何投影到平面上都有六個(gè)根本交叉點(diǎn);還沒有觀察到復(fù)合結(jié)。
復(fù)合結(jié)的發(fā)生機(jī)制
研究人員通過調(diào)查發(fā)現(xiàn)了9個(gè)之前未知的復(fù)合結(jié)案例。這一些全是兩個(gè)基本上自力的三葉滾存在于一個(gè)較長的蛋白質(zhì)鏈中的例子。
因而他們提出了一種基于基因復(fù)制和打結(jié)同源二聚體互連來生成這類復(fù)合結(jié)的新機(jī)制。風(fēng)趣的是,這類機(jī)制類似于適用于建立第一個(gè)人工蛋白質(zhì)結(jié)的計(jì)謀,個(gè)中未打結(jié)的二聚體被「毗連」以構(gòu)成三葉草。
顛末考證,復(fù)合三葉結(jié)能夠認(rèn)定為俗稱的「奶奶結(jié)」。復(fù)合結(jié)的手性取先前講演甲基轉(zhuǎn)移酶和碳酸酐酶中單個(gè)三葉結(jié)的正手性的成果同等。研究人員正在兩個(gè)分歧的蛋白質(zhì)家族和兩種構(gòu)造變更中觀察到了不異的現(xiàn)象,他們以為這是一種發(fā)生復(fù)合結(jié)的潛正在機(jī)制。
圖示:蛋白質(zhì)P54212(碳酸酐酶)的3D布局(上)和簡化暗示(下)。
蛋白質(zhì)中的第一個(gè)71-結(jié)
下圖描寫了蛋白質(zhì)P73136和Q9PR55,其長度分別為112和89個(gè)氨基酸。二者都沒有特點(diǎn),運(yùn)用PDBeFold沒法辨認(rèn)也許的同源物。然而,它們具有48%的序列同一性和71%的二級構(gòu)造婚配,這表明它們多是同源物。
蛋白質(zhì)Q9PR55包羅最龐雜的結(jié),一個(gè)71-結(jié),迄今為止已知正在殘基27和83之間有一個(gè)打結(jié)的中心。蛋白質(zhì)P73136的相似布局包羅一個(gè)51-結(jié),正在殘基45和94之間有一個(gè)打結(jié)的中心。之前沒有觀察到這兩種蛋白質(zhì)具有分歧的非尋常拓?fù)洳季值倪@類同源物對。
仔細(xì)觀察會(huì)發(fā)覺,蛋白質(zhì)Q9PR55更龐大的拓?fù)錁?gòu)造是由一個(gè)引入分外纏繞的蛋白質(zhì)片斷造成的;71環(huán)面結(jié)本質(zhì)上是一個(gè)51環(huán)面結(jié),正在環(huán)面上有一個(gè)分外的纏繞;兩個(gè)結(jié)皆具有正手性。
新的51和52結(jié)
該團(tuán)隊(duì)發(fā)現(xiàn)了兩個(gè)從前未知的具有五個(gè)根基交叉點(diǎn)的結(jié),包孕第一個(gè)51-結(jié)。
準(zhǔn)確性測試
因?yàn)樵摪l(fā)明的新穎性,根據(jù)自力方式開展考證將很主要。正在實(shí)驗(yàn)研討之前,研討人員使用正交測算東西ERRAT來評價(jià)展望的打結(jié)布局。ERRAT算法評價(jià)C、N和O原子之間的非鍵合接觸形式,并取高分辨率布局開展統(tǒng)計(jì)對照。根據(jù)取AlphaFold(和其他展望方式)中利用的目標(biāo)分歧,它給予了自力的評價(jià)。
研究人員在打結(jié)構(gòu)造集上運(yùn)行了ERRAT。剔除某些模子中間或呈現(xiàn)的擴(kuò)大結(jié)尾,一切測試的模子皆顯示出較好的分?jǐn)?shù);一切卵白皆有>90%的卵白質(zhì)鏈落在(低于)謝絕不可能構(gòu)象的95%閾值內(nèi)。因而,整體來看,猜測的構(gòu)造是精確的,至少在很大程度上是精確的。
然而,正在某些情況下,構(gòu)造的部分地區(qū)好像存正在潛正在題目。主要的是要注意蛋白質(zhì)鏈途徑中的渺小差別——比方,那些會(huì)改動(dòng)上/下穿插的差別——也許會(huì)改動(dòng)拓?fù)錁?gòu)造,也許招致結(jié)的毛病分派。
研究人員注意到,關(guān)于復(fù)合結(jié)Q4D5S2,ERRAT法式將殘基100-110四周的beta鏈段標(biāo)記為布局上大概不正確。值得注意的是,該區(qū)域中鏈的經(jīng)過關(guān)于打結(jié)拓?fù)浜苤饕?/p>
結(jié)語
總之,該團(tuán)隊(duì)闡發(fā)了AlphaFoldAI體系對新拓?fù)潺嬰s蛋白質(zhì)的一切蛋白質(zhì)3D布局展望。我們對AlphaFold供應(yīng)的數(shù)據(jù)的完好闡發(fā)揭露了幾種包括深度龐雜結(jié)的高置信度蛋白質(zhì),這一些蛋白質(zhì)適用于對其3D布局的實(shí)驗(yàn)考證。
正在這里個(gè)數(shù)據(jù)集合,研究人員發(fā)明了一個(gè)71-結(jié),這是迄今為止正在蛋白質(zhì)中發(fā)明的最龐雜的一個(gè),和同源構(gòu)造中的一個(gè)新的51-結(jié),和復(fù)合蛋白質(zhì)節(jié)的第一個(gè)實(shí)例。關(guān)于后者,研究人員提出了一種根據(jù)基因復(fù)制制造它們的進(jìn)化機(jī)制。
因?yàn)榈鞍踪|(zhì)拓?fù)洳季质堑鞍踪|(zhì)折疊算法的延續(xù)挑釁,因而經(jīng)過實(shí)驗(yàn)考證所計(jì)議的布局展望將非常主要。不但可以獲得對AlphaFold體系精確展望龐雜蛋白質(zhì)拓?fù)洳季值谋绢I(lǐng)的精致權(quán)衡,并且主要的是確認(rèn)這里發(fā)明的大批新蛋白質(zhì)結(jié)。