臨牀醫生需要了解的機器學習

Alexander Scarlat博士在他的系列文章“臨牀醫生機器學習入門”中解釋了機器學習的核心內容。這些文章中的前七篇介紹了機器學習的各個方面,然後是度量機器學習模型性能的示例。這一系列文章使用動畫圖表代替數學,幫助讀者更好地理解機器學習概念。

這一系列文章首先提出了傳統基於規則的算法的不足,同時解釋了機器學習可以克服這方面的挑戰,包括多維問題和人類對統計計劃規則的限制。

Scarlat爲讀者構思了一個機器學習概念分類。從高層面看,系列文章解釋了有監督、無監督和其他形式的機器學習。有監督訓練包括迴歸和分類。無監督訓練包括聚類和異常檢測。其他形式的機器學習包括集合方法和生成模型。整個系列遵循類似的方法,逐步闡述定義機器學習概念的分類。

在第四篇文章中,Scarlat解釋了機器學習對數據預處理的要求,以及存在的侷限性。預處理包括展平關係數據、添加缺失值、將文本轉換爲稀疏數組或向量、使用矢量維度中的二元值進行分類。此外,Scarlat還提到了對數值進行標準化的必要性,以防止在量級上產生錯誤的意義感和維度詛咒。

第五篇文章描述了機器學習算法的原理,包括權重的使用、性能指標、損失(或成本)函數、使用優化器、前向傳播和反向傳播。除此之外,在第七篇文章中,還可以找到有關創建機器學習模型工作流的信息,包括欠擬合、過度擬合、訓練、驗證、測試、學習速率、數據增強、使用正則化器和使用丟棄。

Scarlat給出了四個不同的現實問題和示例解決方案,以此來解釋如何評估機器學習模型的性能。

這些示例涉及性能指標,包括精度、準確度、召回率、曲線下面積和F1得分。此外,最後一個模型顯示了現有機器學習模型如何用於轉移學習和最小化額外的模型培訓。

其他在醫療保健領域採用機器學習的主題包括:如何將機器學習與現有電子健康記錄(EHR)系統集成以及捕獲護理結果。谷歌AI將機器學習應用於EHR患者記錄,着重關注伸縮性、準確率和可解釋性。

查看英文原文https://www.infoq.com/news/2019/02/machine-learning-clinicians

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章