文章信息
文章題目:Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints
期刊:Cell
發(fā)表時間:2025 年 7 月 7 日
主要內容:中國科學院遺傳與發(fā)育生物學研究所高彩霞團隊在 Cell 雜志發(fā)表題為“Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints”的研究論文。該研究基于整合了結構與進化約束的通用逆折疊模型,開發(fā)了一種新型人工智能蛋白質工程計算模擬方法 AiCE (AI-informed Constraints for protein Engineering)。該方法無需訓練專屬人工智能模型,即可實現(xiàn)蛋白質高效進化模擬和功能設計。研究團隊利用 AiCE 對多種基因編輯工具進行進化優(yōu)化,成功實現(xiàn)了其效率和精度的快速提升。
原文鏈接:
https://www.cell.com/cell/abstract/S0092-8674(25)00680-4
使用TransGen產(chǎn)品:
TransDetect? PCR Mycoplasma Detection Kit (FM311)
背景介紹
蛋白質工程通過人工改變氨基酸序列修飾改造蛋白質結構和功能,相比基因組工程能直接操縱蛋白質分子,借助突變迭代積累快速優(yōu)化創(chuàng)新蛋白功能,速度遠超自然演變,市場潛力巨大。但目前主要改造策略存在依賴經(jīng)驗、實驗周期長、成本高的問題,限制規(guī)?;瘧?,而近年來興起的基于特定蛋白專有 AI 模型的方法,又面臨通用性欠佳及模型訓練和下游驗證成本高的問題,因此有必要開發(fā)高效、普適且無需復雜模型訓練的蛋白質工程計算模擬策略,以減少計算負荷、實現(xiàn)性能最大化,這對推動蛋白質改造意義重大。
文章概述
蛋白質逆折疊是借助 AI 模型,根據(jù)給定三維結構預測可兼容序列的過程,像 ESM-IF1 和 ProteinMPNN 這類通用逆折疊模型,通過對天然蛋白質結構和序列的訓練,能隱式學習蛋白質骨架的幾何與物理特性,捕捉由進化動力學塑造的蛋白質序列的復雜分布模式。研究團隊基于現(xiàn)有通用逆折疊模型開發(fā)出 AiCEsingle 模塊,具體是依據(jù)給定的蛋白質三維結構,對逆折疊模型輸出的氨基酸序列進行采樣,提名高頻出現(xiàn)的氨基酸類型,再通過結構約束對氨基酸頻率進行差異篩選,得到最終預測的單個氨基酸替換類型。團隊用 60 個深度突變掃描(DMS)數(shù)據(jù)測試該模塊性能,發(fā)現(xiàn)其預測準確率達 16%;通過消融實驗和邏輯回歸分析,證實結構限制在該方法中的必要性,相比無限制方案性能提升 37%;進一步平行比較分析顯示,其性能較其他常見 AI 模型提升 36%-90% 以上。從蛋白類型而言,AiCEsingle 能有效進化復雜蛋白和蛋白質-核酸復合物(如 CRISPR 蛋白、SARS-CoV-2 病毒蛋白等),通用性廣泛。為克服突變組合中常見的負向上位效應,研究團隊假設存在進化耦合的氨基酸位置可能具有功能協(xié)同性,進而構建了通過預測進化耦合性來確定突變組合位置的 AiCEmulti 模塊。對 6 個突變文庫的分析結果表明,AiCEmulti 與蛋白質大模型 SaProt 的預測能力相當,但計算成本很低。團隊建立的包含這兩類模塊的 AiCE 方法,可快速有效預測單突和組合突變,該方法利用現(xiàn)有通用逆折疊模型,無需重新或遷移訓練專有蛋白模型,大大降低了計算成本,僅需 1.15 個 CPU 時就能識別 SpCas9 蛋白(>1000 個氨基酸)的單突和雙突變體。
利用這一方法,研究團隊進一步在濕實驗層面完成了對脫氨酶、核定位序列、核酸酶和逆轉錄酶等 8 種結構與功能各異的蛋白質的 AiCE 功能驗證,由此證明了該方法具有簡單、高效且通用的特點。依托優(yōu)化后的脫氨酶,團隊深入研發(fā)出可應用于精準醫(yī)療和分子育種的新型堿基編輯器,其中包括編輯窗口縮小近一半的新型胞嘧啶堿基編輯器 enABE8e、保真度提升 1.3 倍的新型腺嘌呤堿基編輯器 enSdd6-CBE,以及活性提升 13 倍的新型線粒體堿基編輯器 enDdd1-DdCBE。
綜上所述,這項研究開發(fā)了一種基于人工智能的新型蛋白質工程計算模擬方法 AiCE。與傳統(tǒng)蛋白質工程方案相比,該方法在效率、可擴展性和通用性方面均展現(xiàn)出顯著優(yōu)越。通過計算模擬甚至替代濕實驗,是當前生命科學領域的重要發(fā)展趨勢和前沿方向,而本研究在此方面開展的探索具有積極意義。當前,基于人工智能的蛋白質分析工具往往依賴大量計算資源,這對許多實驗室而言難以獲取。而本項工作表明,通過開發(fā)更高效的生物信息學工具,能夠最大限度降低計算負荷,從而讓更多生物學家切實享受到人工智能技術帶來的科研便利。
常見蛋白質工程方法的示意圖和 AiCE 方法概述
全式金生物產(chǎn)品支撐
優(yōu)質的試劑是科學研究的利器。全式金生物的支原體檢測試劑盒(PCR法)(FM311)助力本研究。產(chǎn)品自上市以來,深受客戶青睞,多次榮登知名期刊,助力科學研究。
TransDetect? PCR Mycoplasma Detection Kit (FM311)
一款通過 PCR 方法檢測培養(yǎng)細胞等生物材料中的支原體,針對支原體 16S rRNA 序列保守區(qū)域設計特異引物,直接使用細胞培養(yǎng)液作為模板,特異性擴增支原體 DNA。
產(chǎn)品特點
? 檢測靈敏度高、準確性好。
? 特異性強,只擴增支原體 DNA。
? 操作簡便,無需提取基因組 DNA。
全式金生物的產(chǎn)品再度亮相 Cell 期刊,不僅是對全式金生物產(chǎn)品卓越品質與雄厚實力的有力見證,更是生動展現(xiàn)了全式金生物長期秉持的“品質高于一切,精品服務客戶”核心理念。一直以來,全式金生物憑借對品質的執(zhí)著追求和對創(chuàng)新的不懈探索,其產(chǎn)品已成為眾多科研工作者信賴的得力助手。展望未來,我們將持續(xù)推出更多優(yōu)質產(chǎn)品,期望攜手更多科研領域的杰出人才,共同攀登科學高峰,書寫科研創(chuàng)新的輝煌篇章。
使用 TransDetect? PCR Mycoplasma Detection Kit (FM311) 產(chǎn)品發(fā)表的部分文章:
? Liu J L, Yan X Q, Wu H, et al. RNA codon expansion via programmable pseudo uridine editing and decoding[J]. Nature, 2025.(IF 50.5)
? Fei H Y, LI Y J,Liu Y J, et al. Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints[J]. Cell, 2025.(IF 45.6)
? Nian Z, Dou Y, Shen Y, et al. Interleukin-34-orchestrated tumor-associated macrophage reprogramming is required for tumor immune escape driven by p53 inactivation[J]. Immunity, 2024.(IF 25.5)
? Xu J, Liang Y, Li N, et al. Clathrin-associated carriers enable recycling through a kiss-and-run mechanism[J]. Nature Cell Biology, 2024.(IF 17.3)
? Wang J, An Z, Wu Z, et al. Spatial organization of PI3K-PI (3, 4, 5) P3-AKT signaling by focal adhesions[J]. Molecular Cell, 2024.(IF 14.5)
? Nian Z, Zheng X, Dou Y, et al. Rapamycin pretreatment rescues the bone marrow AML cell elimination capacity of CAR-T cells[J]. Clinical Cancer Research, 2021.(IF 11.4)
? Xu D, Zhao H, Jin M, et al. Modulating TRADD to restore cellular homeostasis and inhibit apoptosis[J]. Nature, 2020.(IF 50.5)