IBM醫療AI死於難產:NLP搞不定醫學問題!

無論是大企業還是小企業,專業醫療公司還是沒有醫療背景的公司,醫療AI這個巨大的市場都在吸引着它們的目光,醫療AI賽道早已擁擠不堪。藍色巨頭IBM在主要業務增長乏力,逐漸落後於谷歌、蘋果等公司的困境下,想要抓住醫療AI這根救命稻草活命。但在投入巨大人力、財力之後,仍然逃脫不了走進死衚衕的一天,究其原因,還是在於落地困難。

電子和電子工程師協會雜誌IEEE Spectrum的高級副主編Eliza Strickland上週發表了一篇文章《IBM沃森醫療AI的低產和被高估的程度》(https://hub.packtpub.com/ieee-spectrum-ibm-watson-has-a-long-way-to-go-before-it-becomes-an-efficient-ai-doctor/) 。本文討論了IBM 沃森爲什麼在醫療保健行業創建高效的AI醫生之前還有很長的路要走。

一戰成名

IBM 沃森是一個能夠用自然語言回答問題的問答計算機系統,它在2011年2月在智力競賽電視遊戲Jeopardy(危險邊緣)中擊敗兩個人類冠軍取得成功!當時,IBM的研究人員在探索將沃森的能力擴展到“革命化”醫療保健的可能性,決定將沃森出色的NLP功能應用於醫藥,甚至承諾提供商業產品。

2014年,IBM第一次展示沃森使用人工智能改變醫學的潛力。在Demo中,沃森收集了一組奇怪的患者症狀,並利用它們生成一個診斷清單。當時,沃森給人留下深刻的印象:沃森的記憶庫包含最罕見的疾病信息,其處理器完沒有偏見,使其優於其他幫助醫生的AI。它可以在幾秒鐘內處理一個棘手的病例。

如果沃森能夠將這種即時專業知識帶到世界各地的醫院和診所,人工智能似乎可以減少診斷錯誤,優化治療,甚至緩解醫生短缺的情況——不是替代醫生,而是通過幫助他們更快、更好地完成工作。
——Strickland

然而,儘管有關人工智能產品商業化的新項目很有希望,但它無法實現這一承諾。在公司總部之外,IBM發現其強大的技術無法與當今醫療保健系統的混亂現實相匹配。將沃森應用於癌症治療這個醫學界面臨的最大挑戰之一時,IBM遇到了機器學習方式和醫生工作方式之間的根本性不匹配。

“自那以來的八年裏,IBM大肆宣揚開發人工智能醫療技術,其中許多已經失敗了。此外,IBM 沃森醫療健康部門生產的產品更像是隻能執行日常任務的基本AI助手,甚至連AI醫生都算不上。
——Strickland

沃森在醫療保健行業面臨的挑戰

非結構化數據

雖然IBM想要努力探索沃森在醫療保健行業的可能性,但當時,他們面臨的最具挑戰性的問題是醫學中的大量患者數據,即非結構化數據。這包括醫生的筆記和出院摘要,這些充滿行業術語、縮寫和主觀聲明的摘要佔典型患者記錄的約80%。

癌症診斷不準確

IBM 沃森面臨的另一個挑戰是癌症的診斷。紐約市凱特琳癌症中心的肺癌專家Mark Kris與其他優秀的醫生一起,在2015年訓練了一個名爲沃森腫瘤的AI系統,它可以通過讀取關於癌症的大量醫學文獻和真實癌症患者的健康記錄,揭示人類不爲人知的疾病模式。

德州大學MD安德森癌症中心的其他優秀醫生與IBM合作創建了一個名爲腫瘤專家顧問的工具。然而,這兩種產品都遭到了嚴重的批判,稱沃森的腫瘤學顧問有時會提供“無用的”和“危險的建議”。

Strickland寫道:“對這兩個項目的深入研究揭示了機器學習的設想與醫療保健現實之間的鴻鴻溝——”真正的人工智能“與當今醫生對功能性產品的要求”。

儘管沃森很快就學習了關於臨牀研究的文章,但人們很難教會沃森以醫生的方式閱讀這些文章。 “醫生從文章中學到的用來改變他們護理的信息,可能不是論文裏的重點。沃森的思維基於統計數據,所以它能做的就是收集有關主要結果的統計數據,“Mark Kris補充道。

無法從患者的電子健康記錄中挖掘信息

研究人員進一步發現,沃森也無法從患者的電子健康記錄中挖掘信息。此外,他們意識到,在將新患者與其他大量癌症患者進行比較以發現隱藏疾病模式時,沃森無能爲力。此外,他們希望沃森能夠模仿專家腫瘤學家的技能,但結果讓他們感到很失望。

沃森爲什麼“發射失敗”?

率先進入,第一個出局

2014年,IBM創建了一個嶄新的總部,起名IBM沃森,在位於曼哈頓類似於微型天文館的玻璃實驗室中,IBM會邀請潛在的客戶和來訪的記者進入沃森的電子“大腦”中,。在黑暗的空間裏,遊客坐在旋轉的凳子上,花哨的圖形圍繞着牆壁的弧形屏幕閃爍。

之後,沃森在電視節目《危險邊緣》中戰勝人類冠軍脫穎而出,IBM便爲其規劃了今後的職業生涯:成爲一名AI醫生。IBM將沃森的自然語言理解能力應用於醫學,並承諾首批沃森醫療產品將在18-24個月內上市。

實際上,IBM宣佈的那一天並沒有到來。在此後的八年中,IBM高調宣佈進行醫療AI研究,但其中一些已經失敗了。該公司花費數十億美元用於收購以加強實力,但內部人士表示,被收購公司尚未做出太多貢獻。從IBM的沃森健康部門生產的產品與曾經設想的優秀AI醫生根本不能相提並論:它們更像是可以執行某些日常任務的AI助手。

加州大學舊金山分校醫學系主任,同時是2015年出版的《數字醫療》(The Digital Doctor: Hope, Hype, and Harm at the Dawn of Medicine’s Computer Age )一書的作者Robert Wachter說道:“說好聽點,我認爲他們遇到了一些麻煩。”他說,在某種程度上,IBM正被其雄心壯志折磨:它是第一家大力推動人工智能進入診所的公司。但它也因誇大沃森的能力而蒙受惡意和懷疑。“他們先進行營銷,第二步纔是產品,讓每個人都興奮不已,”他說。“然後是真正見分曉的時候,遇到棘手的問題,IBM首先出局,向所有人證明了這很難。”

迄今爲止很少有成功產品

自2011年以來,IBM 沃森宣佈了許多醫療保健項目。他們的表現如何?

image

IBM於2011年開始致力於將沃森引入醫療保健行業。從那時起,該公司已經發布了近50份關於合作伙伴關係的公告,旨在開發新的醫療保健工具。一些合作致力於爲醫生和機構提供工具;一些人致力於消費者應用。雖然許多聯盟還沒有產生商業產品,但IBM表示這些研究工作很有價值,並且在維持很多關係。這是一個有代表性的項目樣本。

image

圖像之外,NLP等AI技術很難有實際產品落地

然而,除了圖像,即使是今天最好的AI也難以理解複雜的醫療信息。實驗結果證明,編碼人類醫生在軟件方面的專業知識是一個非常棘手任務。正如全世界所看到的,IBM已經在市場上學到了這些痛苦的教訓。雖然該公司並沒有放棄它的“登月計劃”,但它的“發射失敗”已經向技術專家和醫生們表明,訓練一名AI醫生是多麼困難。

在2011年的《危險邊緣》中,沃森的勝利表明了其在自然語言處理(NLP)方面的卓越技巧。爲了玩這個遊戲,它必須解析複雜的文字遊戲線索,搜索大量的文本數據庫以找到可能的答案,並確定最好的答案。沃森不是一個優化的搜索引擎;它不只是根據關鍵字返回文檔。相反地,它使用了數百種算法來映射句子中的“實體”並理解它們之間的關係。使用這種技能,它能理解遊戲中的線索和它挖掘的數百萬文字來源包含的信息。

“看起來沃森好像可以理解語言的含義,而不僅僅是識別單詞的模式,”在《危險邊緣》比賽期間擔任IBM主要醫學科學家的Martin Kohn說道。“它比現有的AI強大了一個數量級。更重要的是,沃森通過機器學習自行開發了這種能力,發現了模式,併爲如何從輸入(線索)到輸出(正確的響應)建立了模型。”

Kohn從哈佛大學獲得醫學學位並獲得了麻省理工學院的工程學位,他很高興能幫助沃森解決醫學語言問題。“沃森似乎有可能克服這些複雜性,”他說。通過將其強大的NLP能力轉變爲醫學理論,沃森可以閱讀患者的健康記錄以及醫學文獻的全部內容:教科書、同行評審期刊文章,批准藥物清單等。通過訪問所有這些數據,沃森可能會成爲一名超級醫生,能夠辨別出人類無法看到的模式。

Chase與IBM研究人員一起研究了一種診斷工具的原型,但IBM選擇不將其商業化,因此Chase在2014年與IBM分道揚鑣,作爲衆多早期沃森的狂熱者中的一員,他對沃森從那時起在醫學商店進展緩慢感到失望。

關於醫療AI的一些現實

由於各種原因,醫生是一個保守派,採用新技術的速度很慢。但在醫療保健的某些領域,醫療專業人員開始認爲人工智能系統是可靠和有用的。以下是AI醫學的一些早期發展。

image

在計算機業務中落後於谷歌和蘋果,IBM急需開拓新領域回血,因此選擇了前景巨大的醫療AI領域。2014年,IBM向沃森部門投資10億美元,該部門正在爲多個業務部門開發技術。2015年,IBM宣佈成立一個特殊的沃森健康部門,到2016年中期,沃森健康已經收購了四家健康數據公司,總成本約爲40億美元。IBM似乎擁有使AI在醫療保健領域幹一番事業所需的技術、資源和承諾。

今天,沃森領導人將創建沃森健康的過程形容爲艱難崎嶇的道路,將AI帶進醫療領域是個非常大的挑戰。

例如,IBM醫療保健和生命科學研究副總裁Ajay Royyuru說道,診斷工具沒有上市是因爲此前不存在此類商業案例。“診斷不是我們的目標,”他說。“這是醫學專家們做得很好的事情。這是一項艱鉅的任務,無論你用AI做得多好,它都不會取代專家。“

Bengio:迄今爲止沒有一種AI可以匹配人類醫生的理解和洞察力

爲了找到醫療人工智能的商業案例,IBM開展了一系列令人眼花繚亂的項目,針對醫療保健系統中的所有不同參與者:醫生、行政人員、保險公司和患者,以獲得“使用AI分析大量數據集的決策支持。”IBM宣傳力度最大的項目專注於腫瘤學,希望將沃森的“認知”能力轉化爲大數據爲患者提供個性化癌症治療。

在許多應用實驗中,沃森的NLP與許多其他AI系統一樣,努力理解醫學文本。“我們在NLP方面的表現要比五年前好得多,但仍然比人類差得多,”蒙特利爾大學計算機科學教授,人工智能研究員Yoshua Bengio說。Bengio表示,在醫學文本文件中,人工智能系統無法理解模糊性,也無法瞭解人類醫生會注意到的微妙線索,目前的NLP技術可以幫助醫療保健系統:“它不需要完全理解,就可以做一些非常有用的事情。”但到目前爲止,沒有一種AI可以匹配人類醫生的理解和洞察力。“不,我們還打不到,”他說。

暫時克服不了癌症

IBM對癌症的研究是這家公司遇到的主要挑戰之一。一位肺癌專家Mark Kris表示:“我認爲沒有人會知道這(實現癌症診斷)會花多長時間。”他所在的研究機構早在2012年就和IBM Watson展開了合作。

Kris和其他醫生在2015年訓練了一個人工智能系統,該系統成爲了Watson腫瘤產品。德克薩斯大學MD安德森癌症中心的醫生與IBM合作創建了一個名爲Watson腫瘤顧問。白血病部門測試了該工具,但它從未商業化。

Watson腫瘤顧問遭受了多方批評。有文章指出Watson腫瘤是無用甚至會提供危險的建議。Kris說他經常聽到批評說該產品不是“真正的人工智能”。在投入6200萬美元之後,IBM與MD安德森癌症中心的合作項目最後以失敗告終而被取消。

該項目表明,機器學習的承諾與醫療保健的現實根本不匹配,在“真正的AI”與當今醫生對功能性產品的要求之間存在着巨大鴻溝。

image

一些研究將Watson的癌症治療建議與醫院腫瘤學家的建議進行了比較。一致性百分比表示Watson的建議與專家的治療計劃相匹配的頻率。

Watson腫瘤通過獲取大量癌症患者健康記錄和醫學文獻來學習。IBM希望Watson憑藉其強大的計算能力來檢查這些記錄中的數百個變量,發現人類無法看到的模式。功夫不負有心人,Watson很快就學會了如何瀏覽臨牀研究的文章並確定基本結果,但遺憾的是它不會像醫生那樣閱讀文章。醫生是從文章中提取信息,用來改變他們的治療方法,而Watson的思維是基於統計數據,所以它能做的就是收集有關主要結果的統計數據。“但醫生不這樣做。”

例如,在2018年,FDA批准了一種新癌症藥物,它對所有表現出特定基因突變的腫瘤都有效。人類醫生會建議每個肺癌患者都接受這種基因檢測,但Watson不會根據有55名患者中4名肺癌患者改變結論。

無法從健康記錄中挖掘信息

此外,研究人員還意識到,沃森無法從醫學文獻的突發新聞中獨立提取見解只是第一個打擊,另外,它還無法像他們預期的那樣從患者的電子健康記錄中挖掘信息。

還沒完,AI超級醫生夢想的最後一擊,是研究人員意識到,Watson無法將此前在癌症患者身上發現的隱藏模式與新的癌症患者進行比較。Sloan Kettering和MD安德森都希望AI能夠模仿他們的專家腫瘤學家的能力,他們在爲新患者制定醫療方案時利用他們對患者、治療和結果的經驗。可以進行類似分析的機器功能將非常強大。

與現有醫療體系黃金標準不符

但是,醫療保健系統目前的標準並不鼓勵這種現實世界的學習。MD安德森的腫瘤學專家顧問僅發佈了與官方醫學指南相關的“基於證據”的建議以及醫學文獻中發表的研究結果。如果人工智能系統的建議基於它在醫療記錄中發現的模式——例如,某種類型的患者在某種藥物上表現更好——其建議不會被視爲基於證據的,即醫學中的黃金標準。如果沒有科學研究的嚴格控制,這種發現只會被認爲是相關性,而不是因果關係。

Kohn和其他很多人認爲,爲了AI能夠發揮其全部潛力並變革醫學,醫療保健的標準必須改變。“黃金標準並不是真正的黃金,”Kohn表示,人工智能系統可以考慮的因素比臨牀試驗中表現的要多得多,並且可以將患者進行更多分類,以提供“真正的個性化護理”。基礎設施也必須改變:醫療保健機構必須同意共享其專有和隱私控制的數據,以便AI系統可以從數百萬患者數據中學習。

美國市場遇冷

根據報告顯示,IBM在美國市場遇冷。一些腫瘤學家說他們更相信自己的判斷,不需要沃森告訴他們該做什麼。其他人則表示,它只是會提供一些他們瞭然於胸的建議。但Kris表示,一些醫生髮現它可以作爲一種即時的補充性意見,以安慰緊張的病人。“儘管它不完美,且作用有限,但它非常有用。” IBM的銷售代表在美國以外的地區運氣好點,印度、韓國、泰國和其他醫院都採用了這項技術。許多醫院在營銷時以使用IBM Watson品牌爲傲,告訴患者他們將享受人工智能癌症治療。

儘管面臨一些挑戰,IBM沃森也的確有一些成績,比如IBM與北卡羅來納大學、耶魯大學和其他知名機構合作開發的沃森基因組。該工具可幫助遺傳學實驗室爲腫瘤科醫生提供報告。沃森讀取患者基因突變列表,並在幾秒鐘內生成一份描述所有相關藥物和臨牀試驗的報告。此外,2017年IBM在北卡羅來納大學的合作伙伴發表了一篇論文,介紹了沃森基因組工具的有效性。

無論有效與否,IBM沃森仍然需要跨越重重障礙,才能實現IBM將沃森變成無可挑剔的“AI醫生”的夢想,其他在醫療AI賽道上遭遇類似困境的企業,也應以此爲鑑,及時做出應對策略和調整,纔是最要緊的。

正如翼展科技CTO邊海鋒所說:“對於那些沒有醫療背景,但卻有資金和各種資源支持的大公司,他們做醫療AI的挑戰主要是在產品上缺乏領域知識,找不到能夠解決客戶痛點的應用場景,其次是如何打造一個熟悉醫療客戶羣體的團隊。”

參考鏈接:

https://spectrum.ieee.org/biomedical/diagnostics/how-ibm-watson-overpromised-and-underdelivered-on-ai-health-care#LinkToAIHealthTable

https://hub.packtpub.com/ieee-spectrum-ibm-watson-has-a-long-way-to-go-before-it-becomes-an-efficient-ai-doctor/

image

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章