图像识别中卷积神经网络“卷积”的作用

原創

2020-06-22 09:25

1、单一的像素点包含的信息是无意义的
2、人在看一个画面时，不会是一眼就能获取所有信息的，而是通过聚焦中心，确定感受野，通过不断调整聚焦中心位置，放大、缩小感受野，从而获得源源不断的图片信息（聚焦中心点和感受野的确定，是要有算法优化的，否则会增加耗时）
3、2中优化的方式是通过对某一聚焦中心点、感受野“卷积”来确定的，是否需要优化，以何种方式优化，在判断之前就需要确定一个卷积的方式——即卷积核（像素长宽、核数字）
4、人在看东西的时候，是有记忆的，我们瞬间的视野比例大约为16：9，但是如果有东西超出了这个比例时，我们会进行“追踪”，比如通过连续的轮廓、色彩等，追踪后，在我们的记忆中产生了一个完整的物体，我们再对这个物体使用特定的卷积核去进行判断属于什么物体
4、一个画面一旦进入人类视野时，人类马上就会调用一种卷积核去判断，我把它称为“初判卷积核”，它的作用就是初步确定，这个物体可能是什么，然后接下来去调用可能的物体的卷积核去进一步判断，通过局部扫描的方式，去逐步确认，其间，也是可以根据实时扫描得到的结果更换卷积核的
5、像素点只有组合起来，它才是有信息量的
6、不论是整体特征还是局部特征，都是需要用卷积核去提取的（整体还是局部，只是一个泛的概念，正确的描述应为卷积核的大小）
7、cnn的缺陷？
8、人眼是基于三维成像的，像素的纵深在某一程度上也辅助了识别，是否能将带有深度功能的摄像头采集的深度图（包含每个像素点距离观察点的纵深），与RGB图共同加入训练？

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

图像识别中卷积神经网络“卷积”的作用

【简写Mybatis-02】注册机的实现以及SqlSession处理

手绘二维码

.NET借助虚拟网卡实现一个简单异地组网工具

【今日頭條】頭條官方的推薦機制解碼

python numpy 向下取整，向上取整 np.floor()、np.ceil()

圖像處理中“灰度級數”是什麼？（灰度值）（位深度）（1bit=1位）

圖像變清晰圖像放大提高分辨率提高清晰度

【放置奇兵】tips（神聖傷害）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結