【AI技術生態論】晶泰科技賴力鵬:在10000+藥物分子中,我們用AI鎖定了38種潛在抗疫“解藥”

在這裏插入圖片描述


作者 | Just
出品 | CSDN(ID:CSDNnews)

「AI技術生態論」是CSDN發起的“百萬人學AI”倡議下的重要組成部分,與AIProCon萬人開發者大會Top30 AI技術生態行業案例徵集和評選開發者與AI大調查AI大師課一起,打造一個覆蓋百萬開發者的AI生態聯盟。


2020年,「AI技術生態論」欄目將對1000+AI生態大咖進行系列訪談,勾勒出AI生態最具影響力人物圖譜和AI產業全景圖!


本文爲 「AI技術生態論」系列訪談的第二十七期,更多AI技術和產業生態報道,敬請期待下一期精彩內容!


百萬人學 AI 你也有份!今日起點擊閱讀原文報名「2020 AI開發者萬人大會」,使用優惠碼“AIP211”,即可免費獲得價值299元的大會在線直播門票一張。限量100張,先到先得!

醫藥研發行業有一個“三個十”的說法,即一種藥物的發現需要投入十年以上的時間,花費十多億美元,最後獲得10%的成功率。也就是說,醫藥研發需要花費很長時間,投入大量資金才能成功研發出一種藥物。

不過,AI等新技術的不斷涌現,讓科學性極強的醫藥研發行業也有機會追求大幅“提速降費”。

“把原本可能需要三到五年的藥物發現過程,顯著地縮短至一到兩年,同時還幫助人們跳脫出藥物研發專家個人經驗和能力的限制,全面加速藥物研發。”致力於以計算驅動藥物研發的晶泰科技聯合創始人、AI負責人賴力鵬告訴CSDN。

抗疫,篩選出38種潛在藥物分子

目前AI在醫藥研發的應用覆蓋多個研發環節,包括靶點發現到苗頭化合物、先導化合物的發現,然後到藥物開發和臨牀實驗。

以新冠病毒的靶點發現爲例,首先需要找到病毒上與轉錄、複製、感染等關鍵機能相關的蛋白質,然後分析其與藥物結合、抑制這些機能實現的位點。通過找到能有效、穩定地與這些靶點結合的分子,就可以阻止病毒的感染和傳播,患者由此得到治療。

尋找候選藥物分子並非易事。傳統的方法是通過藥物化學家的參與,從百萬到千萬潛在化合物層層進行篩選,去做實驗驗證對抑制病毒活性有效的化合物。而通過AI生成模型、強化學習和遷移學習,可以根據對應靶點去設計出更加多樣化的分子結構,這樣擴大了找到相應分子的可能性,將搜索的最大範圍從現有的1023個化合物分子的搜索空間擴大到1060。

這樣就可以從百萬、千萬個潛在有效的類藥分子中,利用AI算法,對其生物活性、溶解性、毒性、穩定性、合成難度,以及與人體內吸收、分佈、代謝、排泄關聯的關鍵性質進行快速、準確的層層篩選與綜合打分評估。

綜合表現最理想的一百多個分子,通過高精度的量子物理計算進一步精準預測其關鍵性質,隨後結合藥物化學家的專家挑選,就可以確定幾十個最有希望能夠成功研發的藥物侯選分子,進入針對性實驗驗證。
晶泰科技AI定向生成的分子庫。其中藍色爲訓練集分子,紅色是AI隨機生成的分子,黃色爲經過強化學習後生成的性質更加理想的類藥分子。

1月20日,晶泰科技成立了一個新冠肺炎攻關小組,並基於隨後發佈的病毒基因序列進行同源建模,對獲得的關鍵蛋白質模型進行了分享。他們還通過計算的方式驗證了新冠病毒相比SARS病毒具有更強的人際傳播能力,並且做了病毒可能出現的變異的掃描,以幫助後續的疫苗、抗體等藥物的研發。

很快,基於幾個關鍵的靶點,他們在美國藥監局上市的3000種藥物以及10000多種中藥成分分子中篩選出183種潛在的活性藥物分子,後來經過更高精度的量子物理、計算化學方法,進一步將範圍縮小到38種活性比較理想的藥物分子,推進到細胞實驗階段,以驗證其對新冠病毒的抑制作用。

氯喹已在細胞實驗和臨牀治療中展現出新冠病毒有比較好的抑制效果,晶泰科技也與廣東的衆生藥業公司合作,研究氯喹抑制新冠病毒的分子作用機理,並進行實驗驗證。

值得一提的是,他們還在人工智能藥物研發平臺上面搭載了生物藥研發相關算法,目前正通過研究病毒表面的一些蛋白,幫助新冠抗體和亞單位疫苗做基礎研究。

切入晶型預測,確定醫藥行業的“釘子”

晶泰科技不是一家以AI技術在醫藥研發行業起家的AI創業公司。

6年前開始創業,三位創始人考慮的是先找到醫藥行業的“釘子”,而不是拿着AI的錘子去找釘子。“先確定問題,再尋找解決問題的最佳路徑。”賴力鵬稱。

這與晶泰科技三位創始人的技術背景不無關係。生物化學領域等待更快速、精確的研究方法應用於工業界,而他們多年從事量子物理、量子化學領域的科學研究,專注於如何更精確地理解、計算原子、分子間的作用關係,這些科學算法正是新材料、生物化學等領域科研方法創新的源頭。最終,他們確定以藥物開發環節的晶型預測問題爲切入點。

什麼是晶型?從化學結構上看,雖然石墨和金剛天差地別,但本質上是碳原子由不同的空間排列而產生的“晶型”。同樣的,一個藥物分子的各個原子在空間結構上由於旋轉角度、排列方式的細微差異,可能產生上千萬種晶型,而真正穩定的晶型也會有幾種甚至幾十種之多,它們的藥物性質也不盡相同。傳統研究方法依賴實驗試錯,一旦有遺漏就會給藥企帶來潛在的專利訴訟、臨牀失敗,甚至藥品召回的風險,蒙受巨大的經濟損失。

晶型預測技術則可以用準確的預測結果指導實驗,從而加速研發、提高成功率。

其一大難點在於,需要預測分子在結晶形成固體結構的所有可能性。賴力鵬解釋,要解決這個問題,要儘可能準確地計算原子間的相互作用,再從上千萬種可能性中鎖定最適合藥物開發的晶型。

精確度、速度與成本如何實現最優化是另一大難題。計算中會產生百億級甚至千億級的高精度結構數據,而藥企研發爭分奪秒,對計算精度和計算速度都有很高的需求,並且需要在成本可控的範圍內儘可能快地完成計算,否則就無法在藥物研發中的實現廣泛應用。

而以計算預測的方法改進,加速晶型研發,就可以提高藥物安全性,幫助有效的新藥分子成功開發爲藥物產品,更早到達患者身邊。

確定了晶型這一痛點問題後,2014年晶泰科技正式成立。彼時,他們手中的“錘子”以量子物理和量子化學技術爲主,深度學習還沒有像在2016年那樣被業內所熟知。

不久,如何思考在這一領域持續創新,將現有的技術積累與AI、機器學習、搜索技術和其他底層的計算方法結合,進一步突破精確度、效率與成本的邊界,並拓展新的工業應用,成爲他們的研究重點。

擁有業界領先的晶型研究算法的同時,晶泰科技將研發方向聚焦在藥物發現和藥物開發階段,前者指從藥物的靶點出發,找到可能與靶點產生作用的分子,後者主要在藥物固相和後續製劑方面進行研究。

AI打輔助,量子物理計算是殺手鐗

基於量子物理和量子化學的計算技術與AI相結合是晶泰科技最核心的殺手鐗。

賴力鵬介紹,計算輔助藥物研發的科學根源是分子和分子之間的相互作用,不管是藥物結晶,還是藥物製劑過程,藥物和輔料的選配,它們在量子力學層面上其實都可以理解爲處理不同原子間的相互作用。

所以在他看來,當計算物質之間的相互作用時,基於量子力學的計算方法是最準確的。但問題是,在真實的項目中用量子力學去計算的時候,一個體系中可能存在大量原子,現在的算力無法支撐這樣龐大的計算量。

工業界的處理方法是,在量子力學的方程中引入一些基於經驗的估計參數,去簡化計算的過程,核心是基於專業領域的知識和經驗,去選擇正確的參數來對量子力學計算的方程進行簡化。

幸運的是,以深度學習爲核心的AI方法可以對參數做出更好的估計,以進行藥物設計和篩選。
晶泰科技ID4平臺的AI藥物發現流程
在藥物篩選階段,由於分子是不同的原子通過化學鍵建立連接,從算法的角度來說,可以看成一個有節點和邊的圖結構,而在分子表示方法上,由於分子的結構無法直接輸入一個神經網絡進行訓練和學習,所以需要投射到一個矢量化空間,如何做適量化很大程度上會影響到模型表現。

賴力鵬進一步介紹,當處理蛋白和小分子相互作用的時候,如何選擇正確的表示方式(embedding)很重要,涉及的建模方法也是多樣的,包括NLP裏的sequential模型以及圖卷積模型,他們會把不同的網絡架構進行整合,以適應需要解決的問題。

在他看來,AI與量子計算相輔相成。目前,在生物和化學領域的應用,只使用AI技術本身的精度並不足夠,而單純用量子物理計算的方法效率也不夠,這就需要把兩個方法結合到一起,讓AI可以在一個非常大的樣本範圍內去做快速篩選,同時提高量子力學計算技術的精度。

複雜計算離不開算力支撐。他們能夠通過工程能力去調度大量的計算資源,可以同時調度不同的雲計算平臺,在很短時間內部署百萬核級的CPU計算資源。

上述三大底層技術結合構成了晶泰科技最基礎的計算,快和準是基本技術能力體現。尤其在晶型計算上,賴力鵬表示,他們在全球範圍內可能沒有競爭對手。

爲計算能力提供基礎保障的還有數據。晶泰科技會儘可能去整合來自不同數據庫的公開數據,包括具體項目中合作方的實驗數據,目前已積累千億規模的數據。同時,他們也會調用大量的計算資源去做高精度的計算,積累上百萬到上千萬的高精度計算數據來訓練AI模型,從而提高模型預測精度。不過,由於他們使用的量子物理化學等算法可以更好的描述問題,所以對數據的依賴性相對更低。

賴力鵬再一次強調應該從底層問題出發,考慮利用不同方法的優勢進行組合,以解決問題。

解決問題是根本,現在已不是概念的風口

近幾年算力、數據和各種機器學習框架和算法的出現,帶動了AI在不同行業的場景落地和發展,藥企開始重視新技術在醫藥行業中應用的可能性。

面向未來,晶泰科技會在技術層面加深方法上的研究,在量子計算、AI方法以及雲計算資源三方面技術優點做更緊密的銜接。另外,他們也計劃將分子設計技術拓展到高能材料等新領域進行探索。

賴力鵬說,AI的技術一定要和已有的基礎計算技術相結合:通過AI的學習能力和創造能力,爲藥物發現提供更多可考慮的化合物分子,其次,在藥物篩選的早期使用多種計算方法做綜合評估,優先各方面性質更理想、研發風險低的分子,就可以降低那些後期的失敗風險和時間成本,而僅憑實驗無法做到這一點。

業務層面,不同於很多企業紮根在一、兩個領域去做一些項目,他們希望做成一個賦能藥物研發的綜合平臺,注重解決一些底層共性問題,對具體醫藥項目的類型沒有限制。

晶泰的平臺架構已初步成型,他們計劃進一步擴大包括與大型跨國藥企和創新型生物科技公司在內的合作。目前,晶泰科技已與包括輝瑞在內的40多家藥企合作,尤其在晶型研究環節改變藥企的新藥研發流程。而他們的人工智能醫藥研發平臺與創新藥企合作所發現的藥物分子,已經進入臨牀前研究階段。

從行業角度,他認爲在AI的浪潮之下,初創公司和藥企會更重視數據的結構化和數據收集,所以未來在企業內部和公開領域,數據的數量和質量都會有很大提升,這將爲AI的進一步落地和應用提供更好的機會。

但無論技術如何推陳出新,賴力鵬認爲行業歸根結底都應該從問題出發,“要看重技術是不是真實解決了藥企在研發中的需求,評判標準就是付費合作,現在其實已經不是處在概念的風口,大家現在更應該積極的把技術轉化成能夠真實解決研發需求的解決方案。”

在這裏插入圖片描述

今日福利!

遇見大咖

同樣作爲“百萬人學 AI”的重要組成部分,2020 AIProCon 開發者萬人大會將於 7 月 3 日至 4 日通過線上直播形式,讓開發者們一站式學習瞭解當下 AI 的前沿技術研究、核心技術與應用以及企業案例的實踐經驗,同時還可以在線參加精彩多樣的開發者沙龍與編程項目。參與前瞻系列活動、在線直播互動,不僅可以與上萬名開發者們一起交流,還有機會贏取直播專屬好禮,與技術大咖連麥。

門票限量大放送!今日起點擊閱讀原文報名「2020 AI開發者萬人大會」,使用優惠碼AIP211,即可免費獲得價值299元的大會在線直播門票一張。限量100張,先到先得! 快來動動手指,免費獲取入會資格吧!

點擊閱讀原文,直達大會官網。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章