基於對肺部感染檢測的技術研究,可通過人工智能技術對醫學影像-X光片進行患病情況檢測,有效提升確診準確率和效率;本賽題主要是對肺部X光片患病結果進行分類,共4個患病類別,數據集劃分比例爲6:2:2;
問題分析
首先查看原始圖片的視覺特點,這裏要注意人的直覺和CNN本質上還是有區別的,所以直覺上的對數據增強並不一定有效。
- 圖片不會出現垂直翻轉
- 嚴格上來說不會有水平翻轉
- 圖片被縮放到224,224,可能已經損失了一些信息
- 屬於單通道灰度圖片
分析數據標籤和數量:
- 數據分爲四類
- 訓練數據總量約18000左右
- 數據存在不平衡現象
數據增強
通過觀察數據,採用以下數據增強手段
- 水平翻轉,嚴格上不允許,但考慮到左右肺部的不完全對稱性
- 小幅度的旋轉
- 小幅度的平移
- 小幅度的縮放
模型設計
最初模型採用深度較少的Resnet34,訓練速度快,在後續的實驗中也一直採用,爲了抑制過擬合,在最後的分類前加了Dropout=0.2,性能略有提升。
本問題模型準確度提升比較明顯的技巧
- 預測過程中使用TTA,也就是測試時間增強,對增強後的結果直接取平均加權
- 模型融合,一開始不以爲模型融合漲點明顯,但是使用後發現漲點關鍵。
經驗分享
去年九月開始,平臺的模板可以幫助快速上手機器學習,參加比賽的目的主要是想提升自己,這個過程比較鍛鍊自己的代碼能力和查文獻能力。
看到之前的分享,從尋找相關領域的論文開始,然後一步一步提升準確率..
本文爲作者在FlyAI平臺發佈的原創內容,採用知識共享署名-非商業性使用-禁止演繹 4.0 國際許可協議進行許可,轉載請附上原文出處鏈接和本聲明。
本文鏈接地址(視頻講解直達):https://www.flyai.com/n/116619