從神農(nóng)嘗百草,到李時珍踏遍神州寫下《本草綱目》,他們無一不是在身體力行尋找治病救人的藥。如今,藥物的研發(fā)雖然不必行萬里路,卻也一樣要不斷的嘗試,持續(xù)的研發(fā)。
作為國內(nèi)藥物研發(fā)創(chuàng)新的代表,星藥科技(Galixir)從2019年成立以來始終在使用尖端人工智能技術(shù)賦能藥物研發(fā)。星藥通過使用人工智能的前沿算法,結(jié)合計算化學(xué)、藥物化學(xué)和生物學(xué)的工具及經(jīng)驗,全方位攻克小分子藥物早期研發(fā)流程中的疑難問題,快速發(fā)現(xiàn)活性高、成藥性好且結(jié)構(gòu)新穎的候選分子。在這一過程中,火山引擎為星藥科技提供了一系列的技術(shù)產(chǎn)品支持,大幅降低了藥物研發(fā)過程中的算力需求門檻。
智能時代的藥物研發(fā)
星藥科技目前已經(jīng)和國內(nèi)外藥企以及研究機構(gòu)進(jìn)行了諸多合作,推進(jìn)多個藥物研發(fā)管線,覆蓋中樞神經(jīng)系統(tǒng)疾病、自體免疫類疾病、腫瘤、呼吸系統(tǒng)疾病等不同疾病領(lǐng)域,作用機制包括抑制劑和激動劑等不同類別。
通過技術(shù)創(chuàng)新,星藥科技將單個臨床前藥物研發(fā)管線的成本和時間大幅降低和縮短,使得同時儲備多條藥物研發(fā)管線、優(yōu)化整體戰(zhàn)略布局都成為了可能。星藥科技獨立通過將蛋白結(jié)構(gòu)建模,分子設(shè)計、性質(zhì)預(yù)測、逆合成分析與智能計算平臺M1及Pyxir平臺有機結(jié)合,配合生物實驗平臺,形成了“AI-計算-實驗迭代”的藥物研發(fā)新范式。尤其在M1計算平臺中,星藥科技FEP和Docking計算精準(zhǔn)度已達(dá)到業(yè)界先進(jìn)水平,邀測情況良好,并已完成商業(yè)化落地。
技術(shù)的發(fā)展很難一帆風(fēng)順,一些難題在研發(fā)過程中逐漸浮出水面:
首先,面對業(yè)務(wù)量的波動,需要實現(xiàn)按需調(diào)度的彈性伸縮算力,最大化利用計算資源;
其次,以往計算節(jié)點較多,需要大量專人開發(fā)維護(hù)集群,才能保證應(yīng)用的高可用性;
第三,醫(yī)藥研發(fā)有海量非結(jié)構(gòu)化文件數(shù)據(jù)讀取需求,這就需要有高吞吐的數(shù)據(jù)讀取能力。
面對以上難點,也為了建立更多增益的差異化管線,尤其是未成藥、難成藥靶點的藥物管線,星藥科技需要有一個充足的、動態(tài)的、極致性價比的算力資源,一個可以提供無限計算、存儲等擴展能力的云超算平臺。如果能實現(xiàn)這樣的云超算平臺,就可以滿足其計算任務(wù)需求,為藥物研發(fā)新范式提供動態(tài)資源,從而在更短時間內(nèi)獲得期望的實驗結(jié)果。
火山引擎高性能計算平臺
星藥科技引入了火山引擎的高性能算力資源、機器學(xué)習(xí)平臺及高性能并行文件系統(tǒng)等資源?;诨鹕揭娓咝阅苡嬎闫脚_,星藥科技能夠無縫集成彈性容器,靈活調(diào)度底層計算資源,實現(xiàn)了海量實例快速秒級啟動,從而靈活應(yīng)對計算高峰。
火山引擎機器學(xué)習(xí)平臺幫助星藥科技無縫對接了已有集群資源調(diào)度引擎Slurm,支持全流程的數(shù)據(jù)管理、代碼開發(fā)、模型訓(xùn)練等全生命周期工作流;通過機器學(xué)習(xí)平臺對Gromacs的GPU性能優(yōu)化,大幅提升效率、降低成本;同時,減少了星藥科技對Slurm集群的維護(hù)負(fù)擔(dān),節(jié)省人力成本30%。
火山引擎與星藥科技的合作解決方案
星藥科技通過集成火山引擎的技術(shù)產(chǎn)品,獲得了如下能力:
? 高可用彈性算力集群。其能夠利用云上的高可用、靈活伸縮的特性,實現(xiàn)資源的按需實時調(diào)用,無需關(guān)心擴容策略。
? 高性能并行存儲-vePFS。提供亞毫秒級時延,20G/s吞吐,百萬級IOPS,同時可以在線彈性擴展,容量與性能實現(xiàn)線性靈活增長。
? 機器學(xué)習(xí)平臺。能夠支持Slurm提交任務(wù);支持NVIDIA Clara系列工具(如Gromacs)的云端應(yīng)用,實現(xiàn)醫(yī)療生信行業(yè)任務(wù)的GPU加速;支持從數(shù)據(jù)托管、代碼開發(fā)、模型訓(xùn)練、模型部署的全生命周期工作流。
? 遷移對接便利:利用Terraform,在多個可用區(qū)快速批量創(chuàng)建云上高性能計算集群,節(jié)省人力成本,實現(xiàn)資源彈性敏捷。
總體來看,星藥科技在與火山引擎合作后,通過引入IntelAVX512優(yōu)化指令集,使得整體性能提升了30%;通過火山引擎機器學(xué)習(xí)平臺提供的Slurm提交任務(wù),能夠卸下自己維護(hù)Slurm集群的重?fù)?dān),減少人力成本投入30%;同時,在火山引擎機器學(xué)習(xí)平臺中優(yōu)化Gromacs的GPU性能,將原本需要7小時處理的任務(wù)降低到不足3小時,同時算力成本降低至60%,藥物研發(fā)的先導(dǎo)化合物發(fā)現(xiàn)階段整體效率提升20%。
在聯(lián)手火山引擎后,星藥科技更高效準(zhǔn)確地找到比對標(biāo)藥物活性更好、并具有更大專利空間的全新分子,進(jìn)而大幅度節(jié)省藥物開發(fā)環(huán)節(jié)的時間和成本。雙方聯(lián)手實現(xiàn)以“AI驅(qū)動的研發(fā)管線”和“AI賦能的計算平臺”的雙循環(huán),賦能藥物研發(fā)產(chǎn)業(yè),讓新藥的研發(fā)更加高效。