CellPress | 人工智能在臨牀試驗中的應用

本文介紹如何利用人工智能(AI)最新的進展重塑臨牀試驗設計的關鍵步驟,以提高臨牀試驗成功率。


名詞

AI:Artificial Intelligence,人工智能

Association rule mining:關聯規則挖掘

BMI:Brain–machine interface,腦機接口

DL:Deep learning,深度學習

DRL:Deep reinforcement learning,深度強化學習

HMI:Human–machine interface,人機界面

ML:Machine learning,機器學習

NLP:Natural language processing,自然語言處理

OCR:Optical character recognition,光學字符識別

1.人工智能可以將反摩爾定律變成摩爾定律

將一種新藥推向市場需要10至15年的時間,平均研發費用約15至20億美元,大約一半的時間和投資用於臨牀試驗。其餘約一半的研發支出用於臨牀前化合物的發現和測試以及監管流程。

儘管製藥和生物技術公司數十年來一直在不斷增加研發投資,但每9億美元獲得監管批准的新藥數量大約每9年減少一半。反摩爾定律對現有的臨牀開發業務模式構成了嚴重威脅,在重磅炸彈後的藥物時代,如此大規模的上市效率是不可持續的。藥物開發流程中的主要絆腳石之一是臨牀試驗的高失敗率。所有臨牀二期階段化合物中只有不到三分之一前進到臨牀三期階段。在臨牀三期階段的化合物中,超過三分之一未通過批准。因爲這些關鍵檢查點要等到研發週期的下半階段纔會出現,最複雜的III期試驗約佔總試驗費用的60%,所以每次失敗的臨牀試驗所造成的損失在於8至14億美元,因此構成了研發總投資的重大削減。

圖1 新藥研發週期

導致臨牀試驗失敗的兩個關鍵因素是患者隊列選擇和招募機制無法及時將最適合的患者帶到試驗中,以及缺乏技術基礎設施來應對運行試驗的複雜性,尤其是在後期沒有可靠和有效的依從控制、患者監測和臨牀終點檢測系統。AI可以幫助克服當前臨牀試驗設計的這些缺點。機器學習,尤其是深度學習能夠自動找到大型數據集(例如文本,語音或圖像)中的意思模式。自然語言處理可以理解和關聯書面或口頭語言以及人機界面的內容允許計算機與人類之間自然地交換信息。這些功能可用於關聯各種大型數據集,例如電子健康記錄(EHR)、醫學文獻和試驗數據庫,以在試驗開始前改善患者與試驗的匹配和招募,以及在試驗過程中自動連續監測患者試驗,從而可以改善依從性控制併產生更可靠和有效的終點評估。在以下各節中,重點介紹了具有直接AI潛在入口點的臨牀試驗設計方面,並解釋了特定的AI技術及其應用將如何改善臨牀試驗性能。

圖2. 人工智能在臨牀試驗設計中的應用。
圖2. 人工智能在臨牀試驗設計中的應用。

 

2.患者選擇

每個臨牀試驗都對參與的患者提出有關資格、適用性、動機和賦權的個人要求。特定患者的病史可能會使他們失去資格。合格的患者可能未處於疾病階段,或屬於要測試的藥物靶向的特定亞表型,因此使該患者不適合。合格且合適的患者可能沒有受到適當的激勵來參加,即使他們是,他們也可能不知道匹配的試驗或發現募集過程過於複雜且難以導航。緊張的招募週期內招募足夠多合適的患者是一項重大挑戰,實際上是導致試驗延誤的第一大原因:所有試驗中有86%不符合招募週期。患者招募佔用三分之一的整體測試時間。患者招募帶來了32%的失敗率, 三期臨牀試驗說明了國家的最先進的臨牀試驗設計的最嚴重的缺點之一:具有最高的病人需求的臨牀試驗遭受最低效患者招募技術。AI和ML驅動的系統可以幫助改善患者隊列組成,併爲患者招募提供幫助(圖2)。

 

隊列組成

臨牀試驗通常不是爲了證明在普通人羣的隨機樣本中證明治療的有效性而設計的,而是旨在前瞻性地選擇一部分人羣,在這種人羣中,如果有效果的話,藥物的作用可能更容易得到證明,被稱爲“臨牀試驗富集” 。如果患者是先驗的而不是合適子集的一部分,那麼他們參與試驗將自動降低所觀察藥物的療效。在試驗過程中,適宜性不能與治療成功與否的程度相混淆:它表示一種狀況,不會使參與治療的患者對測試的藥物產生完全或根本不可能的反應。招聘大量合適的患者並不能保證試驗的成功,但不適合的招募患者增加了其失敗的可能性。

 

協助招募

就數量和醫學術語而言,試驗資格標準的複雜性通常使患者難以理解和評估自己的資格。從龐大的非結構化數據源中手動提取有意義的信息是一項重大任務,給醫生和患者均帶來沉重的處理負擔。但是,此步驟在很大程度上定義了患者是否被認爲合適並有資格參加研究,以及招募地點和患者是否彼此瞭解。幾種AI技術可以在自動找到EMR(電子病歷)大海撈針中提供可行的幫助:NLP可用於理解各種結構化和非結構化數據類型的書面和口頭語言。Fogel在最近的評論中提供了適用於臨牀試驗設計的NLP技術的詳細摘要。推理技術使內容可以概括爲人類決策者可採取的行動。機器學習,尤其是深度強化學習,使系統能夠學習並將有關其分析輸出質量的反饋整合到適應的基礎算法中。使用這些AI技術或其子集的輔助系統可用於自動分析EMR和臨牀試驗資格數據庫,查找特定患者之間的匹配並招募試驗,並將這些匹配推薦給醫生和患者。此類基於AI的臨牀試驗匹配系統已被成功演示,並已證明其在現實生活中的價值。由於這些系統具有AI性質,因此將來增加的功能和改進的性能將主要取決於可用於分析模型開發和試點研究驗證工作的數據的質量和數量。

還建議使用AI和ML技術來主動挖掘可公開獲取的Web內容,例如數字試驗數據庫、試驗公告和社交媒體,以自動識別相關試驗和特定患者之間的潛在匹配。通過幫助患者進行常規的手動網絡搜索,這樣的系統可以使患者更快地瞭解感興趣的試驗,並允許他們主動與臨牀醫生接觸,以進一步評估合格性和適用性。

 

挑戰

AI方法廣泛使用的EMR數據的數字化和可訪問性並非易事。由於相反的原因,這兩項任務都是具有挑戰性的:一方面,缺乏數據收集的監管框架會導致EMR格式差異很大,彼此不兼容或根本不是數字格式,並且存在於分散的生態系統中,而無需建立數據交換或訪問網關。另一方面,嚴格監管的法律環境嚴格限制了第三方對患者數據的訪問,甚至使患者自己難以訪問自己的數據。人們普遍認爲,這種所謂的“ EMR互操作性困境”是提高醫療保健系統效率的主要障礙,並且政府和醫療機構正在進行大量投資以克服這一障礙。同時,隨着對敏感健康數據的管理和保護變得越來越複雜,諸如美國健康保險可移植性和責任法案(HIPAA)和歐盟通用數據保護法規(GDPR)之類的法律框架也在不斷髮展。此外,與EMR挖掘完全一樣,對於臨牀試驗而言,需要解決數據隱私和安全性以及法律對AI模型的充分解釋性方面的匹配問題,以確保基於AI的系統可操作並獲得監管部門的批准。

3.患者監護

招募合適的患者參加臨牀試驗是一項巨大的時間和資金投入。僅通過成功完成試用才能獲得此投資的回報。因此,必須讓患者留在試驗中,並在整個試驗過程中遵守試驗程序和規則,並且必須有效,可靠地收集所有用於監測受試藥物影響的數據點。只有15%的臨牀試驗沒有出現患者退出的情況,整個臨牀試驗中的平均退出率爲30%。由於缺乏對試驗方案的遵守而導致的退出需要額外的招募工作,這導致了試驗延誤和大量的額外費用。在試驗中,非依從率的線性增加導致維持結果的統計功效所需的其他患者呈指數增加。AI技術與可穿戴技術的結合提供了開發這種節能、移動、實時和個性化患者監護系統的新方法。

 

患者依從性控制、終點檢測和保留

爲了遵守依從性標準,要求患者保留詳細的藥物攝入記錄,以及與他們的身體功能,對藥物的反應和日常方案有關的其他各種數據點。這可能是一項繁重而繁瑣的任務,導致進入臨牀試驗150天后平均有40%的患者失去依從性。可穿戴式傳感器和視頻監控可用於自動連續地收集患者數據,從而使患者免於此項任務。然後,可以使用ML模型實時分析此類數據,以檢測和記錄相關事件。這種方法可以生成疾病日記,因爲潛在的分析DL模型會定期使用更新的測量數據進行重新訓練,因此可以針對特定患者並適應疾病表達和患者行爲的任何變化。這樣的疾病日記可以作爲依從性或缺乏依從性的證據,並且由於最少或不需要人工輸入,也將比當前患者驅動的自我監測方法更可靠,更有效地收集數據點以進行終點檢測。AI在基於圖像的端點檢測中也起着重要作用。目前,這一任務已在閱讀中心手動完成。機器學習技術已經提出並最近獲得批准,用於從醫學圖像中快速檢測疾病的篩查應用。通過量化病理狀況的算法對此進行補充。通過規避人工處理,將減少與基於圖像的研究相關的成本。

AI和ML方法也可用於動態預測特定患者退出的風險,換句話說,是檢測患者行爲的發作,表明該患者可能會堅持研究方案。

使用DL進行圖像和視頻中的對象識別以及分析可穿戴式傳感器的時間序列數據,最近已經開始或成功完成了用於測試和探索AI輔助患者監控系統的第一項研究。具有醫療級健康感測功能的市售可穿戴設備的出現,以及用於在此類移動平臺上運行高級DL模型的互補軟件生態系統,將使人們能夠針對多種疾病研究更多種傳感器組合。以前的研究中,Shah等人評估了使用低成本智能手機和其他即時醫療傳感器與先進的生命體徵檢查相比,先進技術支持的非侵入式診斷篩查(TES)產生的臨牀證據的重要性和有效性。他們報告說,儘管常規的健康檢查仍然很重要,但是TES的新興技術在對人羣進行分層以及提供個性化的檢查和護理以支持臨牀試驗設計和觀察性研究以產生創新的新治療方法方面可以發揮重要的協同作用。希望在不久的將來,以及正在進行的臨牀試驗中,有更多的試驗研究能夠對此類技術對試驗效率的影響進行基準測試。

 

4.總結和未來展望

新藥開發過程的現狀使大型製藥公司和其他臨牀開發贊助商陷入了一個困境,即重磅炸彈時代已經結束,但增加新的藥物組合的研發過程太慢且太昂貴無法彌補這種變化。要使範式轉變到增長和進步的新可持續軌道,就需要對整個行業的基礎業務和創新模型進行根本性的轉變。

過去的5年中,現代AI技術已經達發展到了成熟的水平,可以在現實條件下使用它們,以幫助人類決策者進行計算機視覺、導航以及某些情況下的醫療和保健環境。同時,製藥和醫療保健仍然是監管最嚴格,規避風險的行業。注入改變既定流程的創新是一項艱鉅的任務,需要逐步解決和實施。儘管AI可能會影響從準備到執行的臨牀試驗設計的許多步驟,但是任何旨在立即解決所有方面問題的AI都註定會失敗。相反,數據科學家和醫學科學家應該共同定義可實現的用例,在這些用例中,將易於理解的AI工具應用於臨牀試驗設計的特定子任務,有望最大程度地改善整體試驗性能。此類AI技術首先需要與旨在補充或替代的現有技術一起進行測試,並且必須以可解釋、合乎道德、可重複和可擴展的方式對增值進行證明和基準測試。遵循這種方法,可以逐步將AI應用於臨牀試驗生態系統,從而加快試驗速度,同時希望降低失敗率和研發成本。幾家製藥公司和AI公司已開始聯合探索這一途徑。監管機構已經建立並繼續擴展框架,以評估醫療保健中基於AI的技術。

此外,已完成的試驗已經積累了大量的數據,其中包含有關試驗設計功能與試驗性能之間的相關性的大量信息。這包括來自失敗的臨牀試驗的數據。這些大型且非結構化的數據集註定要由AI技術進行分析。可用於指導未來改進試驗設計,也可用於研究已經試驗的藥物與藥物再利用合併症的潛在相關性。然而,失敗的試驗數據尤其傾向於被忽略。

值得注意的是,任何此類步驟對藥物研發管線效率的可衡量的影響(即使現在已成功實施)也要等5到8年的延遲之後,才能在統計中顯示出來。此外,除了持續的費用外,還會有額外的研發費用;換句話說,從必需的投資角度來看,事情會變得更糟,然後才變得更好。

AI技術具有現實的實用性;但是,特別是在可解釋性方面,這些技術必須成熟,以使其能夠更廣泛地應用於醫療保健和生命科學應用中。儘管這些發展正在如火如荼地進行,但需要承認通過AI改變藥物開發週期的機會對所有涉及的學科以及通過嚴格的研發工作限定任何創新的價值和可靠性的責任重大。由於任何違反研究協議或過早設定不合理期望的問題,都可能無法繞開這個探索性研究試驗階段,這將不可避免地破壞信任,並最終損害AI在臨牀領域的成功。就像僅改變臨牀試驗設計並不會將藥物研發週期的效率從衰落轉變爲增長一樣,人工智能並不是神奇的靈丹妙藥,它不會使臨牀試驗的成功率在一夜之間飆升。重塑臨牀試驗設計和使用AI技術都是急需的藥物開發週期大修的重要組成部分。

參考資料

Harrer S, Shah P, Antony B, et al. Artificial Intelligence for Clinical Trial Design[J]. Trends Pharmacol Sci, 2019.

https://www.sciencedirect.com/science/article/pii/S0165614719301300?via%3Dihub#s0035

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章