展會信息港展會大全

                          物理學家使用人工智能來尋找迄今為止最復雜的蛋白質結
                          來源:互聯網   發布日期:2022-08-01 09:09:37   瀏覽:10173次  

                          導讀:編輯 | 蘿卜皮 計算機人工智能系統 AlphaFold 最近預測了數萬種蛋白質的以前未知的三維結構。 美因茨約翰內斯古騰堡大學(JGU)的研究團隊專注于具有高置信度分數的子集,研究人員通過算法分析這些預測,發現蛋白質骨架表現出罕見的拓撲復雜性,即打結。 其...

                          編輯 | 蘿卜皮

                          計算機人工智能系統 AlphaFold 最近預測了數萬種蛋白質的以前未知的三維結構。

                          美因茨約翰內斯古騰堡大學(JGU)的研究團隊專注于具有高置信度分數的子集,研究人員通過算法分析這些預測,發現蛋白質骨架表現出罕見的拓撲復雜性,即打結。

                          其中,研究人員發現了一個 71-結,這是迄今為止在蛋白質中發現的最復雜的拓撲結,以及幾個由兩個甲基轉移酶或碳酸酐酶結構域組成的六交叉復合結,每個結構域都包含一個簡單的三葉結。這些深深嵌入的復合結顯然是通過基因復制和打結二聚體的相互連接而發生的。

                          另外,該團隊還報告了兩個新的五交叉結,包括第一個 51-結。該工作分析的結構列表構成了未來實驗研究的基礎,以確認這些新型打結拓撲并探索其復雜的折疊機制。

                          該研究以「AlphaFold predicts the most complex protein knot and composite protein knots」為題,于 2022 年 7 月 13 日發布在《Protein Science》。

                          物理學家使用人工智能來尋找迄今為止最復雜的蛋白質結

                          谷歌 DeepMind 開發的人工智能(AI)系統 AlphaFold 兩次主導蛋白質結構預測技術(CASP)的關鍵評估。AlphaFold 2 是一個深度學習系統,它結合了基于蛋白質結構的進化、物理和幾何約束的訓練程序。它的特點是預測的迭代細化,并允許使用自蒸餾和自估計準確性從未標記的蛋白質序列中學習,以使用一級結構和同源物的對齊序列直接預測給定蛋白質的所有重原子的 3D 坐標。

                          AlphaFold 2 目前已經預測了數十萬種蛋白質結構,其中大部分不包含在蛋白質數據庫(PDB)中,該數據庫主要存檔實驗確定的結構。因此,AlphaFold 的預測數據庫可能具有巨大的價值,特別是對于研究不常見但仍與了解蛋白質折疊潛在機制的復雜性具有高度相關性的蛋白質現象。對于在其多肽骨架中包含拓撲結的蛋白質,會出現一個特別令人著迷的現象,即從兩端拉出后不會完全解開的蛋白質。

                          在過去的二十年中,僅發現了大約 20 種不同的含有結的蛋白質家族。然而,打結的蛋白質對蛋白質折疊和進化提出了挑戰。模擬算法經常高估蛋白質的打結概率,因為后者低于隨機鏈的打結概率。

                          此外,同源物之間的蛋白質拓撲結構通常相似,這意味著在進化中密切相關的蛋白質中往往會保留打結的折疊。由于這些原因,并且由于天然蛋白質之間打結的罕見性,在預測蛋白質結構的龐大新數據庫中可能存在打結拓撲結構引起了人們的濃厚興趣。

                          目前,在蛋白質中發現的最復雜的結是單個結,在任何投影到平面上都有六個基本交叉點;尚未觀察到復合結。

                          JGU 團隊搜索了整個 AlphaFold 2 數據庫,包括「模式生物蛋白質組」、「Swiss-Prot」和「全球健康蛋白質組」數據集,以尋找包含以前未知的深結的拓撲復雜蛋白質。研究人員從分析中排除了那些具有較低置信度得分(600 aa)的蛋白,其中預測的準確性和實驗驗證結構的能力可能受到限制;谶@種搜索和目視檢查,該團隊已經確定了第一個 71-結(在平面上的任何投影中至少有七個交叉點)以及生成 31#31 復合結的可能進化機制。

                          復合結的產生機制

                          研究人員通過調查發現了 9 個以前未知的復合結案例。這些都是兩個基本上獨立的三葉結存在于一個較長的蛋白質鏈中的例子。

                          于是他們提出了一種基于基因復制和打結同源二聚體互連來生成這種復合結的新機制。有趣的是,這種機制類似于用于創建第一個人工蛋白質結的策略,其中未打結的二聚體被「連接」以形成三葉草。

                          該團隊已經觀察到包括甲基轉移酶和碳酸酐酶在內的多個實例,其中含有復合三葉結(31#31)的蛋白質與每條鏈中具有一個三葉結的已知打結同源二聚體同源。

                          經過驗證,復合三葉結可以認定為俗稱的「奶奶結」。復合結的手性與先前報告甲基轉移酶和碳酸酐酶中單個三葉結的正手性的結果一致。研究人員在兩個不同的蛋白質家族和兩種結構變化中觀察到了相同的現象,他們認為這是一種產生復合結的潛在機制。

                          物理學家使用人工智能來尋找迄今為止最復雜的蛋白質結

                          圖示:蛋白質 Q313J9(甲基轉移酶)中六交叉復合結的 3D 結構(上)和簡化表示(下)。(來源:論文)

                          物理學家使用人工智能來尋找迄今為止最復雜的蛋白質結

                          圖示:蛋白質 P54212(碳酸酐酶)的 3D 結構(上)和簡化表示(下)。

                          蛋白質中的第一個 71-結

                          下圖描述了蛋白質 P73136 和 Q9PR55,其長度分別為 112 和 89 個氨基酸。兩者都沒有特征,使用 PDBeFold 無法識別可能的同源物。然而,它們具有48%的序列同一性和71%的二級結構匹配,這表明它們可能是同源物。

                          蛋白質 Q9PR55 包含最復雜的結,一個 71-結,迄今為止已知在殘基 27 和 83 之間有一個打結的核心。蛋白質 P73136 的類似結構包含一個 51-結,在殘基 45 和 94 之間有一個打結的核心。以前沒有觀察到這兩種蛋白質具有不同的非平凡拓撲結構的這種同源物對。

                          仔細觀察會發現,蛋白質 Q9PR55 更復雜的拓撲結構是由一個引入額外纏繞的蛋白質片段引起的;71環面結本質上是一個 51環面結,在環面上有一個額外的纏繞;兩個結都具有正手性。

                          物理學家使用人工智能來尋找迄今為止最復雜的蛋白質結

                          圖示:蛋白質 P73136(左)和 Q9PR55(右)的結構和拓撲結構。(來源:論文)

                          新的 51和 52

                          該團隊發現了兩個以前未知的具有五個基本交叉點的結,包括第一個 51-結。

                          物理學家使用人工智能來尋找迄今為止最復雜的蛋白質結

                          圖示:蛋白質 A0A0K0IQS9(左)和 C1GYM9(右)的結構和拓撲結構。(來源:論文)

                          準確性測試

                          由于該發現的新穎性,通過獨立方法進行驗證將很重要。在實驗研究之前,研究人員應用正交計算工具 ERRAT 來評估預測的打結結構。ERRAT 算法評估 C、N 和 O 原子之間的非鍵合接觸模式,并與高分辨率結構進行統計比較。通過與 AlphaFold(和其他預測方法)中使用的指標不同,它提供了獨立的評估。

                          研究人員在打結結構集上運行了 ERRAT。剔除某些模型中偶爾出現的擴展末端,所有測試的模型都顯示出良好的分數;所有蛋白都有 >90% 的蛋白質鏈落在(低于)拒絕不太可能構象的 95% 閾值內。因此,總體來看,預測的結構是正確的,至少在很大程度上是正確的。

                          然而,在某些情況下,結構的局部區域似乎存在潛在問題。重要的是要注意蛋白質鏈路徑中的微小差異例如,那些會改變上/下交叉的差異可能會改變拓撲結構,可能導致結的錯誤分配。

                          研究人員注意到,對于復合結 Q4D5S2,ERRAT 程序將殘基 100-110 周圍的 beta 鏈段標記為結構上可能不正確。值得注意的是,該區域中鏈的通過對于打結拓撲很重要。

                          結語

                          總之,該團隊分析了 AlphaFold AI 系統對新拓撲復雜蛋白質的所有蛋白質 3D 結構預測。我們對 AlphaFold 提供的數據的完整分析揭示了幾種包含深度復雜結的高置信度蛋白質,這些蛋白質適用于對其 3D 結構的實驗驗證。

                          在這個數據集中,研究人員發現了一個 71-結,這是迄今為止在蛋白質中發現的最復雜的一個,以及同源結構中的一個新的 51-結,以及復合蛋白質節的第一個實例。對于后者,研究人員提出了一種通過基因復制創造它們的進化機制。

                          由于蛋白質拓撲結構是蛋白質折疊算法的持續挑戰,因此通過實驗驗證所討論的結構預測將非常重要。不僅可以獲得對 AlphaFold 系統正確預測復雜蛋白質拓撲結構的能力的精細衡量,而且重要的是確認這里發現的大量新蛋白質結。

                          論文鏈接:https://onlinelipary.wiley.com/doi/10.1002/pro.4380

                          相關報道:https://phys.org/news/2022-07-physicists-ai-complex-protein.html

                          人工智能×[ 生物 神經科學 數學 物理 材料 ]

                          「ScienceAI」關注人工智能與其他前沿技術及基礎科學的交叉研究與融合發展。

                          歡迎注標星,并點擊右下角點贊在看。

                          點擊讀原文,加入專業從業者社區,以獲得更多交流合作機會及服務。

                          贊助本站

                          人工智能實驗室
                          AiLab云推薦
                          展開
                          Copyright © 2010-2022 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態 | 免責聲明 | 隱私條款 | 工作機會 | 展會港 | 站長號
                          停...不要...别揉了动态图