10月27日,在第三屆中國生物計算大會上,BioMap百圖生科正式發(fā)布了全新一代生命科學基礎大模型——xTrimo?。郑场?/p>
據(jù)介紹,這是目前全球規(guī)模最大(2100億參數(shù))、首個全模態(tài)覆蓋(覆蓋蛋白質、DNA、RNA等7大生命科學主流模態(tài))大模型。能夠建模更加廣泛的基因組學、細胞、系統(tǒng)等問題,為基因編輯、靶點發(fā)現(xiàn)、細胞調(diào)控、菌株改造、生命科學圖像分析等場景帶來新的能力。
百圖生科由百度創(chuàng)始人李彥宏與原百度風投CEO劉維共同創(chuàng)立,致力于結合前沿AI和生物技術,構建高通量干濕閉環(huán)的生物計算引擎,實現(xiàn)特定的生物學功能,并解決生命科學行業(yè)如靶點發(fā)現(xiàn)、藥物設計、酶的從頭設計和優(yōu)化等痛點問題。公司在硅谷、北京、蘇州、香港設立研發(fā)了中心,先后獲得超過2億美元風險投資。
據(jù)悉,2022年和2023年,百圖生科先后發(fā)布xTrimo?。郑?、V2,實現(xiàn)了世界首個千億參數(shù)的生命科學基礎大模型。xTrimo基礎大模型平臺上,已有200余個任務模型取得評測SOTA水平,在藥物研發(fā)中涉及通用蛋白、多種構型的抗體、細胞療法、基因療法等多個領域,以及靶點發(fā)現(xiàn)、工藝優(yōu)化、合成生物學、生物制造、生命科學工具等多樣的方向。已先后助力開發(fā)了20余種前沿抗體和酶、實現(xiàn)了10余個創(chuàng)新靶點的挖掘,并都經(jīng)過了實驗驗證,推進進入臨床前研發(fā)等后續(xù)階段。
據(jù)介紹,此次發(fā)布的基礎大模型xTrimo V3,覆蓋DNA、RNA、蛋白質、細胞、小分子、生物視覺和生物知識文本等生命科學7個主流模態(tài),并在各個原有模態(tài)上依靠新的數(shù)據(jù)、新的架構,做了顯著的增強。
百圖生科技術副總裁張曉明介紹說,與V2平臺相比,V3不僅鞏固了之前在蛋白質領域的基礎和繼續(xù)了在細胞領域的發(fā)展,還拓展至基因組學、轉錄組學、細胞復雜任務、影像分析和文本分析等領域,支持從分子早期研發(fā)到生產(chǎn)放大再到后期實驗分析的全流程AI建模需求。
百圖生科方面公布,xTrimo?。郑硡?shù)量已突破2100億。在蛋白質大模型領域,已成為全球首個引入先進專家混合(MOE)架構的生命科學大模型,參數(shù)量達到千億級規(guī)模;DNA大模型序列長度躍升至128K,實現(xiàn)超長序列解碼生命。
2023年3月,百圖生科發(fā)布了基于?。裕颍椋恚铩◎寗拥摹。粒桑牵校ǎ粒伞。牵澹睿澹颍幔簦澹洹。校颍铮簦澹椋睿┢脚_,號稱“能生成蛋白質的ChatGPT”,即使是不具備編程能力的科研人員也可利用大模型和數(shù)十個蛋白質相關任務模型、配套軟硬件系統(tǒng),開展創(chuàng)新蛋白設計研究。此次xTrimo?。郑称脚_還發(fā)布了專為生命科學AI模型設計的模型工具鏈——包含面向多種數(shù)據(jù)場景和用戶需求的Model Builder模塊,支持模型管理和組裝的Model Hub模塊,以及加速模型調(diào)用和物理計算的Model?。拢铮铮螅簦澹蚰K等。
張曉明表示:“基于xTrimo平臺構建專屬任務模型,讓大模型能力與企業(yè)的私有數(shù)據(jù)、特定需求相結合,快速為企業(yè)打造專屬的AI工具,是V3平臺的重要特征之一。我們還結合已有模型與模型定制能力,在不同行業(yè)提出了藥物研發(fā)解決方案、生物制造解決方案和AI4LS平臺解決方案,通過AI模型和配套的服務,幫助企業(yè)加速創(chuàng)新,提升研發(fā)效率、優(yōu)化流程,讓企業(yè)能夠更快地從實驗室走向市場,直觀感受到大模型作為直接生產(chǎn)力的巨大效能,推動行業(yè)的全面智能化發(fā)展?!?/p>
注:文章來源于網(wǎng)絡,如有侵權,請聯(lián)系刪除