獨家 | 谷歌醫學AI在生活中的精確度（附鏈接）

作者：Will Douglas Heaven

翻譯：王曉穎

校對：wwl

本文長度爲2000字，建議閱讀5分鐘

如果需要靠AI來扭轉病人的處境，那我們需要了解當人類真正地使用AI時，它在現實情況下到底是怎麼工作的。

標籤：AI 人工智能醫學

在實驗室裏超級精確的谷歌醫學AI用到現實生活中略有不同。

新型冠狀病毒（covid-19）使得世界上很多國家的醫療資源到達了使用的臨界點。毫不意外地，很多人都希望人工智能（AI）可以加速病人篩查並且緩解臨牀人員的壓力。但是從谷歌醫學（Google Health：如果你想了解關於深度學習工具在實際臨牀醫學設置中的影響，會最先查閱的平臺）的一個研究表明哪怕是最精確的人工智能若未能根據醫療臨牀場景定製，那麼當其實際使用到醫學中時依然會讓情況變得更糟。

鏈接：

https://www.blog.google/technology/health/healthcare-ai-systems-put-people-center/

現有的部署臨牀環境AI的規則主要關注精確度，例如美國食品和藥物管理局（FDA）的審覈標準以及歐洲的CE 認證標準，對於AI 必須使病人的治療結果提升到什麼程度並沒有明確的要求，其主要原因是很多實驗目前還未運行。但是一位在Google Health 的UX 研究員 Emma Beede 提出：“這些需要改變。在AI工具被大量部署之前，我們必須理解AI 工具將如何在實際場景中爲人類工作——特別是醫療服務。”

Google 第一個可以在實際環境下測試工具的機會是在泰國。這個國家的衛生部建立了一個目標，每年要篩查60%的糖尿病病人的糖尿病性視網膜病變，這種病變如果早期不被發現可能會導致病人失明。但是在病人接近450萬，而視網膜專家只有200名——每名專家面對的病人近乎美國的兩倍的實際情況下，臨牀上實現這個目標很艱難。Google通過的CE認證涵蓋泰國，但還需要FDA的認證。所以爲了驗證AI是否能夠幫助，Beede 和她的同事在泰國的11家診所中配備了深度學習系統來探查糖尿病病人的眼部病變。

在泰國使用的系統中，護士在檢查中爲病人的眼部拍攝影像並且發送這些照片給其他地方的專家——這個過程至多需要10周。由Google Health研發的AI識別糖尿病視網膜病變的系統可以達到超過90%的精準度——該團隊將其稱爲可以與人類專家水平相近似——並且，原則上，在十分鐘內給出結果。這個系統可以分析出圖片中的指示症狀，比如阻滯或滲漏的血管。

聽起來令人驚歎。但是實驗室能提供的精確度評估只有這些。它沒有說明任何AI在複雜的現實生活環境中是如何表現的，而這正是Google Health團隊想要發現的。幾個月來，它們觀察護士進行眼部掃描，並且採訪他們使用新系統的體驗。反饋並不是完全正面的。

當系統正常工作時，AI 確實能夠加速進度。但是有時甚至無法給出結果。就像大部分的圖片識別系統，深度學習模型是在高質量的影像基礎上訓練的；爲了保證精確度，低於質量闕值的圖片不會用於訓練。當護士們一小時掃描幾十個病人時，經常會拍攝到光線不太好的圖片，超過五分之一的照片都被拒絕識別了。

那些圖片被系統拒絕的病人被告知他們需要在另一個時間訪問其他診所的專家。如果他們發現因爲工作沒有時間或者他們沒有車，情況會變得非常不方便。另外，護士有時也會覺得很疲憊，特別是當他們確信被拒絕識別的圖片中沒有顯示任何疾病徵兆且後續預約不必要的時候。他們有時會花費時間重新拍攝或者編輯被AI拒絕識別的圖片。

一個護士正在使用視網膜掃描儀拍攝病人眼球后照片（Google）

因爲這個系統需要上傳照片到雲端進行處理，幾個網絡連接差的診所也會造成延遲。一個護士說道： “病人希望實時反饋結果，網速比較慢時病人就會抱怨。。“他們從早上6點開始等待，然而前面兩個小時我們只能篩查10個病人。”

Google Health 團隊現在正和當地的醫療人員合作一起設計新的工作流程。比如，護士需要收到培訓，以自主判斷臨界情況的病例。這個系統自身也需要調整以便更好地處理不完美的圖像。

冒着牴觸風險

“這是一個對於任何有興趣在現實環境裏上手來實際實施AI 解決方案的人來說，都很重要的研究。”在加拿大滑鐵盧大學爲醫學影像學研究AI的 Hamid Tizhoosh說到。Tizhoosh對於急於公佈新AI工具的行爲持批判態度，他認爲過於倉促。他說有的時候，一些工具是由沒有醫療知識的團隊開發和發佈的。他將Google研究視爲一個及時的提醒，實驗室中得到的精確度只是第一步。

Michael Abramoff，一位在愛荷華醫院臨牀大學的眼科醫生兼計算機科學家，花費數年時間仍在研發一個可以用來診斷視網膜疾病的AI，他也是與IBM Watson 合作的初創公司IDx Technologies的CEO。Abramoff是一名醫療服務AI的支持者，但是他也很謹慎並且不希望操之過急，擔心若操之過急人們對AI產生了不好的體驗而產生相應的牴觸心理。他表示，“我也很慶幸Google 展現出了他們願意調查診所的實際工作流程”道。“醫療服務的意義遠不止算法。”

Abramoff也質疑了在精確度上拿AI工具和人類專家比較的意義。他表示，當然，我們不想AI做出壞決定。但是人類醫生們一直持反對態度。一個AI系統需要融入流程，讓其不確定性的來源被充分討論，而不是被簡單地拒絕。

合理使用則收益頗豐。當其正常運作時，Beede和她的同事們看到了AI是如何幫助擅於其本職工作的人們工作得更好。“有一個護士完成了1000個病人的篩查，有了這個工具她無人可擋。”Beede說道“病人們不會在意是AI還是人類讀取他們的圖片。他們只關心自己當時的體驗。”

原文標題：

Google’s medical AI was super accurate in a lab. Real life was a different story

原文鏈接：

https://www.technologyreview.com/2020/04/27/1000658/google-medical-ai-accurate-lab-real-life-clinic-covid-diabetes-retina-disease/

編輯：王菁

校對：林亦霖

譯者簡介

王曉穎（ Shirley），UIUC畢業，目前在Coursera上自學Python課程，對AI，Python，數據分析以及Matplotlib等等都很感興趣，希望能夠認識更多厲害的人，保持學習的能力，接觸新鮮的事物並從中學習，成爲更好的自己。

翻譯組招募信息

工作內容：需要一顆細緻的心，將選取好的外文文章翻譯成流暢的中文。如果你是數據科學/統計學/計算機類的留學生，或在海外從事相關工作，或對自己外語水平有信心的朋友歡迎加入翻譯小組。

你能得到：定期的翻譯培訓提高志願者的翻譯水平，提高對於數據科學前沿的認知，海外的朋友可以和國內技術應用發展保持聯繫，THU數據派產學研的背景爲志願者帶來好的發展機遇。

其他福利：來自於名企的數據科學工作者，北大清華以及海外等名校學生他們都將成爲你在翻譯小組的夥伴。

點擊文末“閱讀原文”加入數據派團隊~

轉載須知

如需轉載，請在開篇顯著位置註明作者和出處（轉自：數據派ID：DatapiTHU），並在文章結尾放置數據派醒目二維碼。有原創標識文章，請發送【文章名稱-待授權公衆號名稱及ID】至聯繫郵箱，申請白名單授權並按要求編輯。

發佈後請將鏈接反饋至聯繫郵箱（見下方）。未經許可的轉載以及改編者，我們將依法追究其法律責任。

點擊“閱讀原文”擁抱組織

獨家 | 谷歌醫學AI在生活中的精確度（附鏈接）

如何基於surging跨網關跨語言進行緩存降級

2024合集

程序員天天 CURD，怎麼才能成長，職業發展的思考(2)

移位操作搞定兩數之商

教你用Perl實現Smgp協議

如何通過前端表格控件在10分鐘內完成一張分組報表？

win11關閉自動檢測病毒刪文件

通用代碼生成器簡介

lightdb 單機模式下數據庫平移

千兆寬帶實際網速能到達多少？

獨家 | 無人駕駛項目實戰：使用OpenCV進行實時車道檢測

AI技術重現的老北京原聲影像又火了，網友：這口音太過真實

資源推薦 | 知識圖譜頂會文獻集錦（附鏈接）

收藏 | 計算機網絡基礎知識總結

起底滴滴數據科學團隊：面對超複雜線下場景，要數據驅動，但拒絕“唯數據論”...

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結