當(dāng)前位置: 首頁 » 資訊 » 人才動態(tài) » 正文

溫書豪:用好AI工具,為制藥工業(yè)開源

發(fā)布日期:2020-07-27   來源:同寫意   瀏覽次數(shù):0
核心提示:導(dǎo)讀:AI工具越來越多地應(yīng)用于藥物發(fā)現(xiàn)。去年7月,澳大利亞弗林德斯大學(xué)研究團(tuán)隊(duì)宣布,利用AI技術(shù)開發(fā)的新型季節(jié)性流感疫苗已進(jìn)
 導(dǎo)讀:AI工具越來越多地應(yīng)用于藥物發(fā)現(xiàn)。

去年7月,澳大利亞弗林德斯大學(xué)研究團(tuán)隊(duì)宣布,利用AI技術(shù)開發(fā)的新型季節(jié)性流感疫苗已進(jìn)入臨床試驗(yàn)階段。該產(chǎn)品基于一套配體搜索算法(SAM),而公眾冠以“首個(gè)AI設(shè)計(jì)藥物”的稱謂,多少傳遞出業(yè)界對AI賦能藥物研發(fā)的期待。

 

同樣令公眾注意的是,兩個(gè)月后,加拿大的Deep Genomics公司也對外表示,“第一款由AI發(fā)現(xiàn)的治療候選藥物(therapeutic candidate)”成功誕生。這款名為DG12P1的化合物,得益于AI從靶點(diǎn)發(fā)現(xiàn)到先導(dǎo)化合物篩選的全程指導(dǎo),只耗費(fèi)了18個(gè)月。

 

AI工具越來越多地應(yīng)用于藥物發(fā)現(xiàn)。盡管一些主要參與者指出,這些工具能給藥物研發(fā)帶來巨大的變革機(jī)遇,但還是有不少業(yè)內(nèi)人士持懷疑態(tài)度。

 

“有爭論很正常,任何一項(xiàng)新技術(shù)在普及之前,都會面臨這種挑戰(zhàn)。”6月底,采訪了晶泰科技聯(lián)合創(chuàng)始人溫書豪,對方如是回應(yīng)這種意見分歧,“AI當(dāng)然有它擅長的地方,比如對數(shù)據(jù)的處理能力,但也還有需要提升的空間。我們擁抱的不是純粹的技術(shù),而應(yīng)該看重技術(shù)在藥物開發(fā)中帶來的結(jié)果,從這一點(diǎn)出發(fā),包括AI在內(nèi)的數(shù)字化,實(shí)際上提供了一種認(rèn)識事物的新視角。”

 

640.webp.jpg

晶泰科技聯(lián)合創(chuàng)始人、董事長溫書豪博士

 

從宏觀到微觀,藥物是什么?

 

長周期、高成本的特征,一直是新藥研發(fā)行業(yè)的顯著標(biāo)簽。通常認(rèn)為,成功開發(fā)出一款新藥需要滿足“10億美元、10年時(shí)間”的前提,但現(xiàn)實(shí)似乎正變得更為復(fù)雜。

 

按照2014年Tufts Center的統(tǒng)計(jì)報(bào)告,開發(fā)一款藥物的資金門檻已經(jīng)提升到25.88億美元。具體來說,藥企實(shí)際支出13.95億美元,加上12-14%的名義利率(資本成本),彌補(bǔ)資本時(shí)間和機(jī)會成本后,得到一個(gè)新化合物的成本便陡然上升。從時(shí)間維度看,這種變化趨勢讓藥物開發(fā)變得越發(fā)困難。

 

究其原因,這一方面與新藥研發(fā)的成功率不斷降低、臨床試驗(yàn)成本不斷增加,以及監(jiān)管條件更加嚴(yán)格等因素相關(guān);另一方面,藥企正在快速消耗著既往發(fā)現(xiàn)的新藥靶點(diǎn)。

 

640.webp (1).jpg

持續(xù)增長的資本化研發(fā)費(fèi)用

 

“工業(yè)界可能更多從生物、化學(xué)的角度去看這個(gè)事情,例如,怎樣設(shè)計(jì)出更優(yōu)的臨床試驗(yàn)方案,在最短的時(shí)間內(nèi)驗(yàn)證藥物的有效性、安全性,然后推動后面的上市申報(bào)。但基于物理背景,我們希望能以更微觀的角度理解藥物和靶點(diǎn)的相互作用。實(shí)際上,這種思維是貫穿整個(gè)藥物開發(fā)流程的,從前期的藥物設(shè)計(jì)到后面的臨床研究,更清楚地認(rèn)識藥物,都有助于提高成功率,降低試錯(cuò)成本。”溫書豪解釋說。

 

藥物都是原子、電子組成的——這也是溫書豪在藥物開發(fā)領(lǐng)域的切入點(diǎn)。2014年,溫書豪與馬健、賴力鵬還在美國麻省理工學(xué)院攻讀博士后,從事物理學(xué)研究。受當(dāng)?shù)貏?chuàng)業(yè)氛圍的影響,三人決定從所擅長的藥物晶型出發(fā),成立晶泰科技,希望能加速藥物研發(fā),提高創(chuàng)新藥物可及性。

 

上述理念得到了輝瑞的認(rèn)可,后者針對雙方的合作,還專門發(fā)表了一篇討論量子物理學(xué)和AI如何影響藥物發(fā)現(xiàn)與開發(fā)的文章:“近年來,科學(xué)家已經(jīng)開始使用被稱為晶型預(yù)測(CSP)的計(jì)算機(jī)建模技術(shù)來進(jìn)行虛擬晶體學(xué)研究。通過應(yīng)用量子物理學(xué),科學(xué)家可以預(yù)測分子中電子的行為,以確定其3-D結(jié)構(gòu)。”

 

外界通常把晶型預(yù)測作為晶泰科技的一個(gè)標(biāo)簽,實(shí)際上正如文中所述,輝瑞科學(xué)家對于晶泰科技在底層物理、人工智能以及跨云超算能力在新藥發(fā)現(xiàn)中的巨大應(yīng)用潛力做了詳細(xì)闡述。在這些跨國大藥企的驅(qū)動下,晶泰科技已經(jīng)打造起“物理+AI+云端超算”的新一代藥物發(fā)現(xiàn)平臺ID4。更重要的是,這個(gè)平臺已經(jīng)在中美的近20個(gè)新藥開發(fā)項(xiàng)目中取得多個(gè)里程碑式進(jìn)展。

 

CSP和AI新藥發(fā)現(xiàn)都涉及很多復(fù)雜的數(shù)學(xué)計(jì)算,依賴相應(yīng)的計(jì)算能力。“過去大家認(rèn)為藥物電子云和人體靶點(diǎn)蛋白電子云之間的相互作用是固定不變的,實(shí)際上它們會互相干擾。”溫書豪認(rèn)為,雖然變化能量很小,然而為了算準(zhǔn)其中的結(jié)果則需要花費(fèi)很多算力。由于既往的條件缺乏,藥企通常放棄這個(gè)環(huán)節(jié),導(dǎo)致晶型預(yù)測不準(zhǔn),以及新藥設(shè)計(jì)中假陽性分子的產(chǎn)生。隨著AI、云計(jì)算技術(shù)的發(fā)展,上述難題可以得到有效解決。

 

另一個(gè)值得注意的現(xiàn)象是,越來越多的國際大型藥企,開始推動設(shè)立首席數(shù)字官(Chief Digital Officer)。這很大程度上也透露出,藥物開發(fā)行業(yè)正在擁抱多學(xué)科交叉的融合浪潮。雖然目前復(fù)合型人才缺口仍舊很大,但在溫書豪眼中,這些變動至少扭轉(zhuǎn)了傳統(tǒng)觀點(diǎn)對于藥物的認(rèn)知,讓其下探到更加微觀的世界。

 

AI藥物開發(fā)的“三座大山”

 

“人工智能不僅給相關(guān)科學(xué)家?guī)砹诵碌奶魬?zhàn),也給生物制藥行業(yè)及其發(fā)現(xiàn)和開發(fā)新藥的既定流程帶來了新的挑戰(zhàn)。”2019年12月,《自然評論藥物發(fā)現(xiàn)》(Nature Reviews Drug Discovery)刊登的一篇文章,重新思考了AI時(shí)代的藥物設(shè)計(jì)。

 

在藥物發(fā)現(xiàn)中,將先導(dǎo)分子的特征提高到候選藥物級別的過程,被稱為“設(shè)計(jì)-制造-測試-分析”(DMTA)周期。這種基于假設(shè)的經(jīng)典方法,首先使用可用數(shù)據(jù)來進(jìn)行假設(shè)并設(shè)計(jì)分子(或從庫中選擇現(xiàn)有分子),隨后合成設(shè)計(jì)化合物,并用適當(dāng)活性測試法進(jìn)行測試和驗(yàn)證假設(shè)。然后,對這些知識進(jìn)行分析并將其轉(zhuǎn)化為下一個(gè)周期的設(shè)計(jì)假設(shè)的基礎(chǔ)。

 

AI的優(yōu)勢,在于無需依賴大型篩選化合物庫,而是可以在每次操作中合成少量化合物,并且僅以測試所需的量進(jìn)行合成。換句話說,AI為提高DMTA效率提供了一系列選擇。通過提供改進(jìn)合成路線和優(yōu)化反應(yīng)條件,AI算法模型可以使化學(xué)家遵循最有效的路線,從而縮短“制造”階段。

 

需要指出,一套標(biāo)準(zhǔn)的數(shù)據(jù)集對建立AI預(yù)測模型至關(guān)重要。如果憑借有限的數(shù)據(jù)以及局限的理解來進(jìn)行預(yù)測,那么即使是很復(fù)雜的算法,也無法產(chǎn)生有用的結(jié)果。

 

實(shí)際上,數(shù)據(jù)問題正是當(dāng)前業(yè)界對AI應(yīng)用于藥物開發(fā)的作用有無及其大小的分歧源頭之一。文首引述的兩個(gè)案例,也要面臨同樣的追問:有些內(nèi)部數(shù)據(jù)無法獲取,AI的數(shù)據(jù)集和訓(xùn)練集都有局限;此外,由于數(shù)據(jù)的規(guī)范不一致,質(zhì)量問題也影響了結(jié)果的可信度。

 

然而,溫書豪卻對此有所保留:“數(shù)據(jù)不可忽視,但對數(shù)據(jù)本身的理解同樣重要。一開始,訓(xùn)練集的大小還真不一定有那么關(guān)鍵。”以晶泰科技的經(jīng)驗(yàn)為例,由于早期并不具備從大型藥企獲得數(shù)據(jù)的條件,晶泰科技犧牲巨大的算力,通過虛擬數(shù)據(jù)自建能力,解決藥物設(shè)計(jì)中最基本的模塊——這種數(shù)字孿生(Digital Twin)技術(shù),可以在虛擬空間中完成映射,從而反映相對應(yīng)的實(shí)體裝備的全生命周期過程。

 

另一方面,晶泰科技在具體項(xiàng)目過程中,也會衍生出一系列可用數(shù)據(jù)。并且,這種數(shù)據(jù)的反饋直接作用于算法模型,幫助后者優(yōu)化調(diào)整。有趣的是,溫書豪似乎比外界更在意AI算法的可發(fā)揮空間。“每個(gè)新藥開發(fā)項(xiàng)目中,我們會對算法在每個(gè)環(huán)節(jié)起了多少作用進(jìn)行評估,甚至要建立相應(yīng)的量化標(biāo)準(zhǔn)。”溫書豪補(bǔ)充說。

 

相較于“AI新藥發(fā)現(xiàn)”的概念,溫書豪更愿意將這個(gè)過程看作“數(shù)字化和人工智能在制藥工業(yè)的一次效率升級”。而升級的內(nèi)涵,除了是數(shù)據(jù)獲取與算法利用方式的變革之外,還包括了算力的巨大提升。

 

640.webp (2).jpg

深入至原子電子級的微觀藥物分子研究

 

“在微觀上,他們(晶泰科技)正在計(jì)算藥物分子中電子效應(yīng)對藥物作用帶來的影響。但由于分子具有許多不斷移動和變化的電子,因此必須同時(shí)執(zhí)行多次計(jì)算,而得出最終答案可能需要數(shù)十億次計(jì)算。”輝瑞格羅頓研究站材料科學(xué)的全球負(fù)責(zé)人Bruno Hancock,在前述那篇關(guān)于晶泰科技合作的文章中指出,當(dāng)云服務(wù)提供商為這些項(xiàng)目計(jì)算時(shí),晶泰科技成為其最大的用戶。

 

目前,晶泰科技仍舊借助云服務(wù)提供商進(jìn)行計(jì)算工作。但從最理想的情況出發(fā),溫書豪也設(shè)想過構(gòu)建內(nèi)部云端架構(gòu)。這可以進(jìn)一步降低成本,加快項(xiàng)目周期,與此同時(shí),還能把晶泰科技的算法融入其中,實(shí)現(xiàn)協(xié)同效應(yīng)。

 

為制藥工業(yè)開源

 

以體量而論,作為最早布局國內(nèi)AI藥物開發(fā)的科技公司之一,晶泰科技的成長有目共睹。

 

2015年底,成立不到一年的晶泰科技便從騰訊獲得2400萬元A輪融資;2017年,晶泰科技的1500萬美元B輪融資中,股東還出現(xiàn)了紅杉資本中國和Google的身影;在2018年,中國人壽作為領(lǐng)投方,也參與了晶泰科技B+輪融資。

 

“AI、云計(jì)算和醫(yī)藥結(jié)合的科技公司”,這是此前溫書豪給晶泰科技打下的標(biāo)簽。按照其所規(guī)劃的發(fā)展邏輯,晶泰科技通過算法連接了AI和藥物研發(fā),這為TMT領(lǐng)域的基金入局提供了可能。更重要的是,引入這些投資方后,晶泰科技得以調(diào)動后者所擁有的巨大算力,進(jìn)而實(shí)現(xiàn)對藥物開發(fā)環(huán)節(jié)的推動。

 

這便回到晶泰科技的起點(diǎn)上。“我們最終的目的,是幫助制藥工業(yè)開源,而開源的表現(xiàn)之一就是,大家可以利用這個(gè)平臺,催生出更多的藥物資產(chǎn)。”溫書豪認(rèn)為,“對大藥企來說意味著新的產(chǎn)品管線,對中小藥企來說是孵化和壯大的機(jī)會,對CRO公司來說則增加了相應(yīng)的研發(fā)需求帶給他們更多的業(yè)務(wù)。”

 
 
 
 
?