供需大廳

登錄/注冊

公眾號

更多資訊,關注微信公眾號

小秘書

更多資訊,關注榮格小秘書

郵箱

您可以聯系我們 info@ringiertrade.com

電話

您可以撥打熱線

+86-21 6289-5533 x 269

建議或意見

+86-20 2885 5256

頂部

榮格工業資源APP

了解工業圈,從榮格工業資源APP開始。

打開
榮格工業-圣德科

英偉達發布RNA基礎模型CodonFM,密碼子層面建模開辟藥物設計新路徑

來源:榮格醫藥商情 發布時間:2025-11-20 2300
智能制造軟件及平臺智能制造解決方案醫藥自動化系統/工廠管理合同外包、定制服務及咨詢 人工智能藥物制劑醫藥加工 制藥自動化生物醫藥
RNA AI 進入“底座時代”,醫藥研發提速

2025 年接近尾聲,AI 在生物制藥領域的滲透正從單純的結構預測邁向更深層的“生物編程”。

 

10 月 28 日,英偉達(NVIDIA)發布了首個 RNA 基礎模型 CodonFM ;同日也宣布與禮來(Eli Lilly)展開算力基礎設施合作。制藥行業正見證一種從“被動解讀”遺傳信息向“主動設計”可編程藥物的范式轉變……

 

 

 

Part 1

核心突破:

破解同義密碼子的“沉默”語法

 

長期以來,生物學界的蛋白質語言模型主要關注氨基酸序列,往往忽略了同義密碼子(Synonymous Codons)之間的細微差別——即不同的核苷酸組合雖編碼相同的氨基酸,卻會導致截然不同的蛋白質產量和 mRNA 穩定性。

 

據英偉達最新發布的研究顯示,其新推出的 CodonFM(Codon Foundation Model) 正是為填補這一空白而來。

 

 

該模型基于 BERT 式雙向編碼器架構,在來自 2.2 萬個物種的 1.31 億個蛋白質編碼序列上進行了訓練。

 

與以往模型不同,CodonFM 將每三個核苷酸組成的密碼子(codon)視為“單詞”(token),學習其在生物進化中的上下文語法。其核心突破在于——

 

精準預測“沉默”突變風險:傳統觀點認為不改變氨基酸的同義突變是“沉默”的,但 CodonFM 證明這些突變可能通過改變翻譯效率或 mRNA 結構引發疾病。模型在 ClinVar 數據集上的測試顯示,其區分致病性與良性同義突變的能力超越了現有的 RNA 基準模型。

 

 

mRNA 療法設計的“導航儀”:對于近年來火熱的 mRNA 疫苗和療法,CodonFM 能夠進行零樣本預測(Zero-shot prediction),優化序列以提升蛋白質表達豐度和翻譯效率。這標志著 mRNA 藥物設計正從試錯法走向基于規則的“可編程設計”。

 

在技術細節方面,由英偉達、Arc Institute、加州大學伯克利分校、加州大學舊金山分校、斯坦福大學的研究人員共同完成的 CodonFM 的學術論文提供了模型設計和性能評估的詳細信息。

 

 

《國際醫藥商情》觀察到,論文展示了不同規模模型在多個任務上的性能對比。在發育障礙和自閉癥譜系障礙隊列的從頭錯義突變數據中,EnCodon 模型顯示出比其他無監督蛋白質和 RNA 序列模型更強的病例對照變異分離能力。零樣本設置下,模型使用參考和突變密碼子之間的對數似然差異進行評分,無需任何任務特定訓練。

 

 

論文還描述了模型嵌入空間的結構。通過對 PCA 降維后的嵌入進行 UMAP 投影,可以看到較大的 EnCodon 模型在所有系統發育分組中實現了更低的掩碼語言建模損失,顯示出改進的預測準確性和對密碼子關系的上下文理解。較大的模型在分類學劃分中也顯示出更高的 K 近鄰純度,說明它們的嵌入在生物分組方面組織得更加連貫。

 

主成分與氨基酸疏水性的相關性分析顯示,最小的模型在前 10 個主成分中與疏水性等基本性質的相關性更高。這表明高容量模型在生化特征之外還平衡了與密碼子使用相關的額外上下文信號。

 

論文的討論部分指出了一些局限性。EnCodon 的結果基于計算推斷,需要實驗驗證來確認其生物學相關性。具有實驗驗證功能效應的同義變異數量仍然很少,這限制了驗證數據集,需要謹慎解釋統計顯著性。模型目前在不明確整合細胞類型特異性 tRNA 豐度、RNA 修飾或二級結構動力學的情況下建模序列特征,而這些因素在體內調節翻譯。

 

研究團隊表示,通過擾動分析、核糖體圖譜分析和合成 mRNA 設計實驗整合這些上下文依賴數據并驗證預測,對于將 EnCodon 的見解轉化為機制和治療應用至關重要。

 

 

Part 2

基礎設施:

算力與生態的雙重加持

 

單純的模型算法并不足以撼動萬億級的制藥產業,算力和生態的協同至關重要。在 CodonFM 發布的同時,《國際醫藥商情》留意到,兩項關鍵的行業動態為其落地提供了堅實支撐。

 

首先是算力工廠(AI Factory)的建立。

 

就在 CodonFM 亮相的同期,制藥巨頭禮來(Eli Lilly)宣布與英偉達達成歷史性合作,利用超 1000 個 GPU 構建制藥行業“最強”超級計算機。

 

 

“AI 工廠”不僅服務于新藥發現,更將貫穿從規劃到制造的全生命周期。這表明,頭部藥企已不再滿足于外包 AI 服務,而是正在構建能運行如 CodonFM 這類大模型的自有基礎設施。

 

 

其次是開源生態的構建。

 

為了加速科研轉化,英偉達與 Chan Zuckerberg Initiative (CZI) 達成深度合作,將 CodonFM 及其他 Clara 開放模型集成至 CZI 的虛擬細胞平臺(Virtual Cells Platform)。

 

 

這一舉措極大降低了科研人員使用高門檻 AI 模型的障礙,使得從斯坦福 RNA 醫學計劃到各類生物科技初創公司,都能直接調用該模型進行變異效應預測和 mRNA 設計。

 

 

Part 3

行業趨勢:

從“假設”走向“臨床驗證”

 

回顧 2025 年全年,AI 制藥行業正處于去偽存真的關鍵期。雖然 AI 在藥物發現中的應用已有時日,但過去的 2024-2025 這兩年是真正的“臨床驗證年”。

 

Insilico Medicine 等企業的 AI 設計藥物進入臨床,賽諾菲(Sanofi)、阿斯利康(AstraZeneca)等巨頭在腫瘤和免疫領域的重金布局之下,行業焦點已從“AI 能不能發現分子”轉移到了“AI 設計的分子的臨床成功率是否更高”。

 

英偉達 CodonFM 這類技術的出現,為這一進程提供了新的維度的工具。它不再局限于尋找靶點或小分子篩選,如以往的 MolMIM 和 DiffDock 流程等,而是深入到了基因表達調控的底層邏輯。這對于難以成藥的靶點,或是需要精細調控表達量的基因療法而言,無疑是一劑強心針。

 

正如大語言模型學會了人類語言的語法從而能撰寫文章,CodonFM 正在通過學習遺傳密碼的“語法”來理解生物學行為。

 

未來,結合藥企的龐大實驗數據與更強的算力底座,我們或許很快就能看到由 AI 完全“編程”設計的 mRNA 療法進入臨床,不僅精準治療疾病,且副作用更低、研發周期更短。

 

在此刻,生物學正在真正成為一門數據科學。

 

 

 

參考資料:
Introducing the CodonFM Open Model for RNA Design and Analysis - NVIDIA
Lilly Deploys World’s Largest, Most Powerful AI Factory for Drug Discovery Using NVIDIA Blackwell-Based DGX SuperPOD - NVIDIA
CZI and NVIDIA Accelerate Virtual Cell Model Development for Scientific Discovery - The Chan Zuckerberg Initiative

來源:國際醫藥商情

作者:John Xie

關注微信公眾號 - 榮格醫藥商情
聚焦國內外醫藥、制藥領域的最新訊息,涵蓋藥用原輔料、制藥加工技術、藥物傳遞與制劑、藥品包裝、自動化等整個產業鏈,是上游制藥供應商與藥企的鏈接紐帶。
推薦新聞