AI可以是藥神

新葯研發是一場“馬拉松”,AI能讓它實現彎道超車嗎?

AI加速新葯研發翻過三座大山

長研發週期,高研發成本,低成功率是新葯研發的“三座大山”。

一款新葯從開始研發到獲批准上市,需要10-15年的時間,平均耗費約26億美元,臨牀成功率不到10%,這意味着有90% 以上的藥物會在臨牀階段被淘汰。

早年,強生副董事長兼首席科學官Paul Stoffels曾形容,一款新葯的研發上市要難於製造飛機。

解決傳統制藥行業普遍的難題,AI或許是一把好的鑰匙。

新葯研發要經歷藥物作用靶點確認、先導化合物確定、臨牀前候選藥物選定、臨牀前研究、臨牀等多個階段。晶泰科技首席科學家張佩宇在接受InfoQ採訪時表示,從靶點確定到臨牀候選藥物環節,利用傳統方法,大概需要4-6年時間才能獲得想要的分子,而通過AI+計算的方法可以將時間縮短到1-2年。

另據TechEmergence的一份報告顯示,AI可以將新葯研發的成功率從12%提高到14%,能夠爲生物製藥行業節省數十億美元研發費用。

晶泰科技是國內最早將AI用於輔助製藥的公司之一,2017年,國內AI藥物發現領域還幾乎是一片空白,創業公司也寥寥無幾,而成立3年的晶泰科技已在該領域有所探索和佈局。其主要涉足藥物發現和晶型研究,聚焦於利用AI、量子物理、計算化學、雲計算等技術,提升藥物研究的效率和成功率。

成立5年來,晶泰曾先後獲得來自谷歌、騰訊、紅杉中國、晨興資本等頂級投資機構的融資,是目前全球AI藥物研發領域融資額度最高的公司之一。

它的成長曆程無疑是市場和資本對於這個領域投注更多目光的見證和縮影。據匯衆研究院不完全統計,截止2019年3月,目前全球AI藥物研發創業公司有163家(其中國內僅14家)。而2年之前這個數字不足30家。截止2019年3月,國內外共140多家AI+新葯研發公司獲得融資,累計交易次數爲342起,獲得融資總額爲483億美元,超過了2017年全年的融資總額(約190億美元)。

全球藥物發現與開發領域的頂級AI公司與製藥、科技公司之間的互聯網絡。圖源:Forbes.com,作者: Yiannis Mouratidis 

去年5月,全球首款AI設計藥物 —“渦輪增壓”流感疫苗的問世,更是讓人們看到了AI在藥物發現中的潛力,或許未來,AI將創造新的藥物研發模式。

在10的60次方空間搜索有效藥物分子

張佩宇表示,與傳統的藥物研發過程相比,AI能夠極大的起到降本增效的作用。

“新葯研發其實有一定的碰運氣成分,因此,如果探索的化學空間不夠廣泛多樣,很可能就錯失了機會”。

2017年,《Nature》的一篇文章曾提到一個很有意思的數據,在整個藥物分子的化學空間裏,可存在的藥物分子的數量大概是10的60次方那麼多。這個數量超過了太陽系中所有原子的數(10的50次方)。但目前,實驗方法是不可能將這些分子全都合成出來的,現有的類藥分子數據庫能接觸到的分子數僅約有10 的11次方左右。

傳統的藥物研發更多以藥化專家爲主導,由藥化專家想出幾十個分子去做計算輔助。早期的藥物研發是一門藝術,因爲如果換了專家,分子也便不同。但通過AI可以產生大量分子,規模高達百萬、千萬量級。因此,在分子產生環節,AI可以覆蓋更全面的化學空間。

“醫藥研發失敗率很高,每5000~10000個進入研發管線的分子當中,只有一個才能真正上市。因此當第一次合成後,要不斷迭代和篩選。這個過程呈現‘漏斗’形狀,越能夠高效地找到合適的分子,就表示藥物研發效率越高。否則,很有可能就是在反反覆覆做實驗,很多年才能找到一個真正能夠往前推進的真正有潛力的候選藥物分子”。

張佩宇告訴InfoQ,晶泰科技利用最新的AI算法來助力分子設計中的篩選過程。相較於使用傳統的計算方法,可以有效地提升獲得優良性質的分子的比例——即富集率——至8-10倍,從而大大地降低實驗篩選的時間和成本。

在評估環節,因爲分子較少,傳統方式會採用一些較粗略的方法進行評估後做實驗。而晶泰科技的智能藥物研發平臺可以採用高精度的方法進行快速、全面的評估,從幾百萬個候選分子逐步聚焦到很少的數量,然後由藥化專家去做最終的合成難度評估,選擇10個左右的分子去做實驗驗證、迭代。

“效率,永遠是傳統實驗的一個瓶頸”。現階段的人工智能藥物研發過程,分子的產生、設計、評估,還很大程度上依靠科學家干預。張佩宇希望下一步可以實現全自動設計、自動合成,甚至在未來實現自動檢測和迭代。他透露,晶泰科技正在進行一些提高實驗效率的探索,從而進一步提升藥物研發的效率。

從晶型預測到新葯發現

晶型預測是晶泰科技的起家業務。2014年,溫書豪、馬健、賴力鵬三位量子物理學家在麻省理工學院的校園裏創辦了晶泰科技。他們認爲,晶型預測和晶型結構確定本質上是一個物理問題,可以通過更加精確、快速的AI+ 物理和雲計算的方法來解決。

晶體結構研究是化合物研究的一大重點,是分子從實驗室裏的藥物有效成分向貨架上的藥物產品轉變的關鍵一步。化合物具有能夠形成不同晶體結構的特點(多晶型現象)。化合物本身的關鍵理化性質,如密度、外觀形態、溶解度、溶解速率等部分地由其晶體結構決定。對於藥品,晶體結構可以顯著影響藥物的生物利用度,最終影響藥物的治療表現。

晶型的穩定性對進行藥物研究至關重要,它關係着藥物的質量與安全性。如果穩定性不好,藥物可能會在臨牀階段或者上市階段產生晶型轉變,造成關鍵性質的變化,導致召回或需要重做部分或全部的臨牀研究,這意味着巨大的時間成本和金錢損失。

晶型預測是一個很難的問題。傳統的研發中,研究人員通過設置不同的結晶條件進行結晶實驗,但很難通過實驗試錯在短時間內獲得所有晶型,或確定已獲得的就是最穩定的晶型。而高精度量子力學計算、結合AI的方法可以產生大量可能的晶型結構並迭代、優化,最終鎖定性質最穩定、最適合用於藥物研發的晶型,或鹽型、共晶、水合物,在實現全面性的搜索、維持計算的高精確度的同時,顯著節省計算成本與時間,協助科研人員利用有限的實驗結果,作出關鍵的研發決策,爲藥企解決藥物固態研發一大痛點。

晶泰科技的晶型預測等藥物固態研發服務

晶泰科技創立早期將大量的精力鋪在了晶型的搜索以及穩定性研究上。張佩宇回憶,早期團隊在攻克複雜的晶體結構體系算法上遇到了很大的難題,預測不出來,結構怎麼算都不對。“那段時間大家心情比較低落,因爲如果我們只能做簡單的體系,做不了特別複雜的,能做的項目就比較少,適用性和對藥物工業的實用意義都大打折扣”。

團隊最終決定展開技術攻關。一個最直接的變化是,持續性加班的日子變多了,“那段時間每天搞到早上四五點”,張佩宇說,“不過也挺有意思,每天早上起來去測一個更復雜的體系,然後調整計算,算到半夜兩三點覺得好像調的差不多了,然後提交,第二天早上再來看結果,如此循環往復”。

功夫不負有心人,通過持續改進,晶泰團隊的晶型預測能力終取得突破,從最開始的只能做簡單的體系,到能夠做五六十個自由度的複雜體系,最後算法成型,實現了鹽型、共晶、水合物和溶劑合物都能快速、成功預測的技術突破。

這也成爲晶泰科技後來的核心競爭力之一。現在,藥物的複雜度提升對藥物的晶型預測提出了更高的要求。張佩宇表示,晶泰科技的晶型預測的成功率達到100%,而國外的一些組織目前仍只能針對簡單體系做預測。

高準確率背後得益於較強的算力資源保障。晶泰科技的算法部署在亞馬遜、騰訊、阿里、谷歌等廠商的雲上,可調動起100萬個計算核心,因此可以做到短時間內預測,能夠在大概2周左右出預測結果。這相對於傳統實驗所需時間(幾個月-數年)顯著縮短,也保障了精確度和成功率。

晶泰科技持續研發與創新,將其技術優勢拓展到上下游的研發階段當中。據介紹,晶泰團隊最近基於一種叫FEP(自由能微擾)的高精度預測流程進行了全新的改良,這是新葯發現中最高精度的計算蛋白和藥物分子相互作用的方法。晶泰科技的XFEP方法能夠將AI和量子物理計算結合起來,更好的評估活性分子與靶點的親和力,從而將活性不好的分子提前篩選出來並淘汰。晶泰科技的雲端平臺可以調動上千個GPU,在一天內可做幾千個FEP計算,能迅速評估大量分子,縮短對分子評估的時間週期,提高實驗篩選的針對性和效率。

藥物設計中用自由能微擾計算(FEP)流程獲得不同分子設計與同一靶標的結合自由能差,評估活性

值得一提的是,FEP等高精度計算方法能夠爲製藥AI的一個關鍵問題——數據短缺提供新的出路。通過高精度算法可以產生大量的高精度數據,這些虛擬數據可以用來做AI建模,之後再去評估想要的分子。實驗數據難獲得且昂貴,虛擬數據是其有效補充。除虛擬數據,晶泰也擁有自建的實驗數據庫。

最近幾年,晶泰科技開始不斷加大對新葯的設計與研發業務的佈局,主做小分子藥物設計,同時也有抗體研發設計和多肽研發設計。該業務一方面是與美國MIT、哈佛等頂尖科研機構的生物學家合作推新葯管線,前者選定靶點,晶泰科技通過其AI平臺找合適的化合物、候選藥物以推進臨牀前研究。另一方面,晶泰科技也爲國內藥企服務,加速其研發的內部管線。

晶泰科技藥物設計服務流程

據瞭解,2017 年 7 月,晶泰科技曾免費推出面向有科研和數據處理需求的單位的人工智能模型訓練平臺 AtomPai,預搭載了幾十種常用算法模型與自動的數據可視化功能。而針對藥物工業,晶泰科技的智能藥物研發平臺–ID4平臺涵蓋了從藥物發現、藥物晶型(固態)研發等方向的衆多工具和幾十種藥物性質預測算法,可用於藥物研發多個關鍵環節的核心問題。該平臺分爲4層,算力資源、調度平臺、算法平臺,以及通用力場、XFEP等工具和解決方案。

ID4平臺主要優勢在於預見性預測,在早期更全面地評估所有潛在的藥物分子的物理、化學、藥學性質,優先推進性質更理想、更有可能成功的分子,把大批難以成功開發或者有重大性質缺陷的分子提早篩選下去。“ID4用精確的算法在早期綜合評估分析分子候選,用人工智能和算法的先見之明去解決藥物研發的一些後顧之憂”。

忍痛推倒重來98%成功率的算法

與其他AI藥物研發創業公司相比,晶泰科技的技術商業化落地進程開始的比較早。這要從2016年晶泰與全球最大的生物製藥公司輝瑞的一次結緣說起。

當時輝瑞組織了一次晶型預測盲測。用從未對外公佈過的不同難度的分子,對學界和市面上所有的解決方案進行橫向評估。張佩宇回憶,團隊用了2個月時間完成了盲測預測。忐忑的心情一直持續到12月份,結果終於出來了,晶泰團隊預測的晶型100%匹配。

晶泰科技幫助藥物研發科學家預測並優化某候選藥物分子的最優晶型。作者:JOSEPH F. KRZYZANIAK。來源:輝瑞網站breakthroughs.com ,文章《How Quantum Physics and AI is Disrupting Drug Discovery & Development》"

當時晶泰僅是一個成立2年的小團隊,從諸多晶型預測團隊中脫穎而出。現在回憶起來,整個盲測的過程,張佩宇還歷歷在目,他將這看作自己和團隊的一個高光時刻。

這次盲測成功標誌着晶泰的商業化走出的重要一步,在此之前,團隊一直全身心鋪在研發上,與藥企只有幾個有限規模的合作項目。後來,雙方達成戰略合作,晶泰科技不僅爲輝瑞提供晶型預測的技術服務,還爲其新葯發現搭建小分子藥物模擬算法平臺。輝瑞在其網站撰文爲晶泰科技做介紹時說,晶泰科技的技術已經改變了輝瑞製藥的方法,並有潛力改變藥物工業。

最近幾年,傳統大型藥企和AI公司合作成爲了一大趨勢,不止輝瑞,默沙東、葛蘭素史克等藥企也和AI公司合作緊密。AI能夠快速找到新的靶點,更快找到適合的候選分子並預測晶型等藥物開發的關鍵研究問題,從而提高研發效率,這是AI公司受到傳統藥企青睞的原因。

不過和大藥企合作並不像想象中那麼簡單,它們普遍對於AI公司的技術實力要求極高,且對於細節把控嚴格。

一個難點在於AI如何自證價值。張佩宇認爲,需要正視一個新技術走向落地是需要一個過程的,有些藥企會覺得傳統的方式可以做藥,爲什麼一定要用AI平臺?

“現在大家都在早期階段,走的最快的‘AI+ 算法’研發藥物也仍在臨牀試驗階段,如何走一條沒有人走過的路,並能夠跟客戶證明,雖然算法作用於研發早期,但你能直接看到效果驗證,且在中期甚至臨牀都能使項目收益,這就需要持續的市場培育和信心構建”。

另一個考驗在於如何在工程和技術間取得平衡。這裏面經歷了一段痛苦的磨合過程。張佩宇對一個預測算法開發的項目印象很深刻。當時這個項目做到95%-98%的準確度花了很多時間很多人力物力,再提升卻停滯不前,項目陷入了瓶頸。

往前走走不下去,止步於此又不甘心。團隊面臨着兩難選擇。最後團隊還是決定“痛下殺手”,將算法推倒重來,從底層的結構重新去改原本的算法。

“這真的是需要下很大的決心,因爲從98%到100% ,它的修改已經不是小的改進,而是需要一定魄力的,前面已經投入了衆多資源,再投入成本是否hold 住,管理層需要從投入-產出上作綜合評估。但我們還是更希望突破技術壁壘,將複雜的分子算到100%精確”。

最終,團隊想出了新方案,又加入了一些新的模型和新算法,項目取得了成功。

張佩宇覺得有一個能打的團隊和算法實力對一家年輕的公司來說格外重要,當遇到困難時,需要有敢於破局重來的勇氣。這份執着讓晶泰的商業化之路走的更順暢,“TO B 的業務一開始門檻很高,但只要你跟對方合作起來,別人對你產生了認可,會一步步將更多的產品和服務應用起來”。

結 語

現階段,AI藥物研發仍處在較早期的階段,不論是在技術創新還是應用落地上還存在着比較大的挑戰,例如體外和體內的相關性問題以及動物模型和臨牀相關性的問題等。

不過前景可期。最近幾年,AI在藥物研發領域的存在感越來越高,尤其2020年開年以來猝然爆發的新冠疫情也讓AI+新葯研發博得了衆多關注,當一場類似的大流行病襲來時,藥物研發的速度就成爲和生命賽跑的關鍵。

鑑於AI在疫情防控中所發揮的積極作用,今年4月,科技部表示將支持研究人工智能技術在傳染病防治、藥物研發等方面的應用。政策性利好之下,AI+藥物研發或將迎來一個新的風口。

可以預見的是,AI技術的應用,將在加速整個藥物研發的進程中發揮着越來越重要的作用。AI究竟能夠爲藥物研發帶來怎樣的可能性,期待時間來驗證。

採訪嘉賓介紹

張佩宇博士,晶泰科技首席科學家,主導研發晶泰科技ID4人工智能藥物創制平臺。張佩宇是中科院博士,曾任大連化物所副研究員,有十餘年計算化學算法開發經驗,在國內外重要刊物上發表研究論文30餘篇。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章