編輯丨王多魚
排版丨水成文
繼諾獎團隊開發的AlphaFold3和RFDiffusion-AA橫空出世后,通用式生物分子結構預測已達到令人驚嘆的精度,為 AI 賦能藥物研發領域打下了堅實基礎。在藥物研發漫長的研發環節中,通用式生物分子設計是下一個 AI 賦能藥物研發領域的“圣杯”。
2025 年 10 月 27 日,由臨港實驗室牽頭,聯合上海人工智能實驗室、香港中文大學、上海交通大學、浙江大學、華盛頓大學、哈佛大學等合作機構,發布了國際首個通用分子設計世界模型——ODesign。
該模型允許科學家在任意類型靶標上指定目標位點,并以精準可控的方式實現蛋白質、多肽、核酸、小分子及金屬離子等多類型生物配體的一鍵式設計。
在多個行業標準測試集上,ODesign 顯著優于 RFDiffusion、BindCraft 等主流單形態分子設計模型,標志著生成式 AI 藥物研發從“單點突破”邁向“通用智能”的關鍵跨越。
![]()
從“單點突破”到“通用智能”:ODesign 讓分子設計進入大統一時代
生命的奇妙,在于“協同”。核酸、蛋白質、小分子和金屬離子等生物分子共同構成生命的語言體系,它們彼此作用、相互演化,塑造出復雜的生物秩序。經典藥物設計主要聚焦于蛋白靶標,以小分子作為主要干預手段,試圖通過“單點突破”實現疾病治愈。然而,這一模式正面臨系統性瓶頸,約 85–90% 的人類蛋白仍被視為“不可成藥”靶點,缺乏可被小分子精準調控的結合位點。同時,RNA、DNA 等非蛋白靶標在疾病調控中愈發重要,其復雜性卻使傳統藥物發現難以有效介入,限制了我們對疾病機制的系統理解。
由于生物分子結構和功能上的多樣性,當前主流AI分子設計方法仍多停留在“單模態突破”的階段,如單一的蛋白質或者小分子設計。這些模型在各自領域中表現出色,但不同模態之間依然存在難以跨越的表征鴻溝:蛋白質模型難以理解小分子的化學特征,而小分子模型又無法捕捉蛋白體系的結構語義。這種“模態孤島”現象,使人工智能在復雜生命體系的整體建模與協同設計中仍受制約。
ODesign的出現打破了這一壁壘。它像是一位能同時理解蛋白、核酸、小分子和金屬離子等生命分子的“通用分子生物學家”,既理解它們在形狀、能量和電荷分布上的規律,也能掌握它們相互作用的底層法則,從而實現逆向設計。ODesign 作為一種通用的世界模型,能在原子層面上像搭積木一樣精準構筑新的相互作用模式。由此,研究者可以像編程一樣指定靶標分子的表位或口袋,在統一范式下完成不同形態分子的一鍵式可控設計。
![]()
基于 ODesign 的多形態分子設計案例,允許用戶在任意類型靶標上指定目標位點,并以精準可控的方式實現蛋白質、多肽、核酸、小分子及金屬離子等多類型生物配體的一鍵式設計。
更重要的是,ODesign 在速度和規模上也實現了質的飛躍:在相同硬件條件下,其設計效率較同類模型提升近 50 倍,將完整的計算設計周期從過去的數天壓縮至短短數小時。對于藥物研發而言,這不僅意味著生產力的重塑,更標志著一個AI 分子設計的“通用智能時代”的開啟。
從理解到創造:ODesign 構筑生物分子的萬相世界
AlphaFold3 的問世已經證明 AI 在“預測”生物大分子結構的任務上可以達到接近實驗精度的水平。
而 ODesign 的核心創新,則是更進一步地以“指定任意靶標,生成任意結合配體”為核心目標,在生物大分子領域讓 AI 從“預測”邁向了真正的“創造”。
ODesign 的研發團隊意識到,一個高性能的結構預測模型往往蘊含豐富的原子間相互作用知識,而這種知識對“創造”也至關重要。基于這一認識,研究團隊以 AlphaFold3 為參考,訓練了一套全模態分子設計的基座模型。ODesign 采用了全新的結構生成架構,由五個核心模塊協同驅動:
1、不同分子模態的多層級表征:面向蛋白質、DNA、RNA、小分子和離子采用了不同層級的表征方式,并設定不同分子模態基本單元的抽象表征以進行設計。
2、多尺度靈活可控的條件模塊:在條件模塊中通過掩碼機制的方式實現原子級、殘基級和分子級的條件約束,從而實現不同的分子設計功能。
3、建模分子間相互作用模塊:通過 pairformer 模塊建模不同分子間的相互作用,并利用模板信息實現靶點蛋白的結構柔性約束。
4、三維重建的條件解碼器:通過擴散模型實現原子級結構生成并利用結構條件實現剛性約束。
5、分子序列生成模塊:OInvFold 模塊基于生成的骨架 token 推斷對應模態的最小單元類型,從而針對不同分子模態實現特異性的序列生成。
通過跨模態共享的生成語言,ODesign 將蛋白的氨基酸、RNA 和 DNA 的堿基、小分子原子以及金屬離子統一映射到一個通用的分子生成空間中。在這個空間里,AI 不再區分分子形態,而是基于原子間相互作用和化學鍵約束進行“協同構建”。這種從概念到物理世界的統一,讓模型在三維空間中能以原子精度生成符合真實化學規律的分子結構。
![]()
ODesign通用分子設計框架概覽,通過統一掩碼機制與擴散生成架構,ODesign在剛性與柔性構象下均可精準控制分子交互,實現可編程的生物設計。
性能驗證:在 11 項分子設計任務中全面領先
為了證明 ODesign 的通用性與可行性,研究團隊在蛋白、核酸和小分子三大模態的 11 項分子設計任務上進行了系統測試。這些任務覆蓋了從蛋白質、RNA 和 DNA 單體結構到多種分子模態結合體的設計領域。
蛋白質因其序列的可編程性和合成可行性,是當前分子設計領域最成熟的模態。ODesign 在現有基礎上進一步擴展了蛋白設計的能力邊界,在蛋白質結合體、基序骨架生成、復合物界面重構和酶功能優化方面取得了生成精度和結構可控性等關鍵指標的顯著優勢。這全面反映 ODesign 模型的多層級設計能力和結構生成的泛化性能。
![]()
ODesign在蛋白設計任務中展現速度與精度的雙重優勢。a) ODesign與BindCraft、RFDiffusion及BoltzDesign以單塊GPU每日成功設計數量為指標進行比較,ODesign具有顯著優勢;b) MotifBench基準測試上,ODesign取得相比于RFDiffusion和RFDiffusion-AA更高的蛋白設計成功率。C) 在AME數據集上,ODesign在基于骨架的設計上比 RFDiffusion-AA 和 RFDiffusion2 有顯著優勢。
核酸作為另一類具有序列可編程性的生物分子,在分子識別、基因調控與藥物開發中發揮著關鍵作用。然而由于結構數據相對稀疏,現有設計方法局限單一模態,且滯后于蛋白設計領域。ODesign 融合多模態分子數據,實現 DNA 和 RNA 的統一生成體系,并在 60nt 的 RNA 和 DNA 單體設計任務中實現約 60% 和 20% 的 RMSD 成功率,且生成的復合物具有合理的分子相互作用界面。
![]()
ODesign 在核酸設計基準測試中顯著優于基準模型RNAFrameFlow,可以設計出高質量的DNA和RNA適配體。
小分子設計是結構最復雜、應用最廣泛的分子模態,其環系、支鏈和手性等復雜的拓撲結構,對模型的化學理解和空間推理能力提出更高的要求。ODesgin 在 6 個蛋白靶標上相對主流 RFDiffusion-AA 提升約 4 倍的成功率;在靶向 RNA 的小分子設計任務中實現高置信度的分子生成;并且成功在 DNA 結合體設計任務上生成結合界面合理且能量穩定的候選分子。
![]()
ODesign在小分子設計基準測試中顯著優于系列基準模型,針對復雜的GPCR受體口袋可以一鍵設計出具備優質結合模式的小分子。
從科研工具到創制平臺:開啟 AI 驅動的分子創制新紀元
ODesign 研發團隊已經推出了在線試用系統,向科研機構和產業用戶開放,支持各形態分子生成、結構可視化與分析等核心功能,幫助研究人員以序列或結構輸入的方式快速獲得高質量分子候選。
![]()
ODesign 分子設計平臺試行版,全面開放給科研和產業研究人員使用
技術報告地址:https://odesign1.github.io/static/pdfs/technical_report.pdf
模型試用地址:https://odesign.lglab.ac.cn/
特別鳴謝諾獎得主 David Baker 對該工作的啟發,指導和支持。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.