在CNN應用於圖像視頻的識別, 分類等領域的論文中常常會出現 “patch” , 如何將其理解非常重要.
“patch”, 指一個二維圖片中的其中一個小塊, 即一張二維圖像中有很多個patch. 正如在神經網絡的卷積計算中, 圖像並不是一整塊圖像直接同卷積核進行運算, 而是被分成了很多很多個patch分別同卷積核進行卷積運算, 這些patch的大小取決於卷積核的size. 卷積核每次只查看一個patch, 然後移動到另一個patch, 直到圖像分成的所有patch都參與完運算.
例如, 下圖中, 左邊各個移動的藍色框就是一個個的patch.