基于对肺部感染检测的技术研究,可通过人工智能技术对医学影像-X光片进行患病情况检测,有效提升确诊准确率和效率;本赛题主要是对肺部X光片患病结果进行分类,共4个患病类别,数据集划分比例为6:2:2;
问题分析
首先查看原始图片的视觉特点,这里要注意人的直觉和CNN本质上还是有区别的,所以直觉上的对数据增强并不一定有效。
- 图片不会出现垂直翻转
- 严格上来说不会有水平翻转
- 图片被缩放到224,224,可能已经损失了一些信息
- 属於单通道灰度图片
分析数据标签和数量:
- 数据分为四类
- 训练数据总量约18000左右
- 数据存在不平衡现象
数据增强
通过观察数据,采用以下数据增强手段
- 水平翻转,严格上不允许,但考虑到左右肺部的不完全对称性
- 小幅度的旋转
- 小幅度的平移
- 小幅度的缩放
模型设计
最初模型采用深度较少的Resnet34,训练速度快,在后续的实验中也一直采用,为了抑制过拟合,在最后的分类前加了Dropout=0.2,性能略有提升。
本问题模型准确度提升比较明显的技巧
- 预测过程中使用TTA,也就是测试时间增强,对增强后的结果直接取平均加权
- 模型融合,一开始不以为模型融合涨点明显,但是使用后发现涨点关键。
经验分享
去年九月开始,平台的模板可以帮助快速上手机器学习,参加比赛的目的主要是想提升自己,这个过程比较锻炼自己的代码能力和查文献能力。
看到之前的分享,从寻找相关领域的论文开始,然后一步一步提升准确率..
本文为作者在FlyAI平台发布的原创内容,采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,转载请附上原文出处链接和本声明。
本文链接地址(视频讲解直达):https://www.flyai.com/n/116619