图像识别中卷积神经网络“卷积”的作用

1、单一的像素点包含的信息是无意义的
2、人在看一个画面时,不会是一眼就能获取所有信息的,而是通过聚焦中心,确定感受野,通过不断调整聚焦中心位置,放大、缩小感受野,从而获得源源不断的图片信息(聚焦中心点和感受野的确定,是要有算法优化的,否则会增加耗时)
3、2中优化的方式是通过对某一聚焦中心点、感受野“卷积”来确定的,是否需要优化,以何种方式优化,在判断之前就需要确定一个卷积的方式——即卷积核(像素长宽、核数字)
4、人在看东西的时候,是有记忆的,我们瞬间的视野比例大约为16:9,但是如果有东西超出了这个比例时,我们会进行“追踪”,比如通过连续的轮廓、色彩等,追踪后,在我们的记忆中产生了一个完整的物体,我们再对这个物体使用特定的卷积核去进行判断属于什么物体
4、一个画面一旦进入人类视野时,人类马上就会调用一种卷积核去判断,我把它称为“初判卷积核”,它的作用就是初步确定,这个物体可能是什么,然后接下来去调用可能的物体的卷积核去进一步判断,通过局部扫描的方式,去逐步确认,其间,也是可以根据实时扫描得到的结果更换卷积核的
5、像素点只有组合起来,它才是有信息量的
6、不论是整体特征还是局部特征,都是需要用卷积核去提取的(整体还是局部,只是一个泛的概念,正确的描述应为卷积核的大小)
7、cnn的缺陷?
8、人眼是基于三维成像的,像素的纵深在某一程度上也辅助了识别,是否能将带有深度功能的摄像头采集的深度图(包含每个像素点距离观察点的纵深),与RGB图共同加入训练?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章