先上圖,下圖通過輸入輸出來區分不同學科。
計算機視覺(Computer Vision, CV),輸入爲圖像或圖像序列,輸出爲某種信息或描述,目的在於理解圖像,獲得語義信息。比如目標識別任務,輸入一張圖片,輸出圖中有哪些物體、都在什麼位置,典型任務包括檢測、識別、分割、定位、追蹤、動作識別、OCR等,詳見wiki-Computer vision。
數字圖像處理(Digital Image Processing, DIP),輸入爲圖像,輸出也是圖像,目的在於轉換圖像。智能手機照相APP中的各種濾鏡以及Photoshop中的各種圖像操作使用的就是數字圖像處理技術,包括增強、去噪、對比度拉伸、縮放、幾何變換、灰度化、二值化等,詳見wiki-Digital image processing。需要注意的是,DIP一般是通過逐像素操作對輸入圖像進行變換,“以圖搜圖”表面上看輸入輸出均爲圖像,其意圖是找到和圖片內容相似的其他圖片,在技術實現上其實是預先對圖像庫提取好特徵(描述),然後對輸入圖像提取特徵,將其與庫中的特徵計算相似度並排序,將相似度高的排在前面,所以“以圖搜圖”實際上是計算機視覺的應用。
計算機圖形學(Computer Graphics, CG),輸入爲某種描述(語義信息),比如點集、顏色等,輸出爲生成的圖像(虛擬場景),目的在於生成圖像,涵蓋建模、渲染、動畫、人機交互等內容,在遊戲、動畫、3D電影中應用廣泛,詳見什麼是計算機圖形學?。
隨着研究的深入,三個學科在很多地方不斷交叉融合。圖像處理常作爲計算機視覺pipeline中的預處理環節,最新版Photoshop中也加入了很多基於圖片內容識別技術的黑科技用於圖像處理,圖形學渲染成像時也常會使用圖像處理技術來獲得更好的成像效果。
此外,虛擬現實(Virtual Reality, VR)和增強現實(Augmented Reality, AR)需要同時用到DIP、CV和CG技術,需要識別現實影像同時生成虛擬影像。
還有一個新興學科叫計算攝影(Computational Photography),
計算攝影學(Computational Photography)是一門將計算機視覺、數字信號處理、圖形學等深度交叉的新興學科,旨在結合計算、數字傳感器、光學系統和智能光照等技術,從成像機理上來改進傳統相機,並將硬件設計與軟件計算能力有機結合,突破經典成像模型和數字相機的侷限性,增強或者擴展傳統數字相機的數據採集能力,全方位地捕捉真實世界的場景信息。
—— from https://www.innovation4.cn/toutiao/100917-9701010937/
與前面學科不同的地方在於,計算攝影希望通過軟硬件相結合的方法來改善成像效果,最近各大智能手機比拼的攝像效果,背後比的就是計算攝影技術,像超清夜景、AI降噪、全景拼接、防抖等等,還有大家熟悉的HDR模式也是一種早期的計算攝影技術,其獲取不同曝光時長的圖像禎,綜合各自的最佳細節來合成最終圖像。