圖像零交叉點,視頻生成,視頻識別,視頻摘要,視頻濃縮
一.視頻生成,視頻識別,視頻摘要,視頻濃縮
視頻生成與視頻識別
視頻分析的兩大任務,前者側重於對下一幀的預測,而前者則側重於視頻內容的理解。由於視頻是由一系列的視頻幀組成的,那麼如果有大量的視頻數據,通過分析視頻中動態場景的變化情況,就可以合成出一些小的動態場景視頻。
(1)從海量的未標記視頻數據獲取動態場景的先驗信息;
(2)提出一種視頻的生成模型。
視頻生成的原理框架如下圖所示:
由於視頻通常由靜態的背景和動態的前景構成。論文根據這一常識設計了雙路的生成模型分別用來生成靜態背景 Background 和前景動態Foreground。其合成方式見foregroud, mask 和background的公式。其合成過程的可視化如下圖所示:
由於視頻通常由靜態的背景和動態的前景構成。論文根據這一常識設計了雙路的生成模型分別用來生成靜態背景 Background 和前景動態Foreground。其合成方式見foregroud, mask 和background的公式。其合成過程的可視化如下圖所示:
視頻摘要和視頻濃縮
發現很多人連視頻摘要和濃縮的區別都不知道,就開始誤導羣衆。這裏只想從技術實現角度簡單談談什麼叫做視頻摘要和視頻濃縮。
視頻摘要,其實是靜態視頻摘要的簡稱,也就是我們常聽到的摘要技術。它僅僅是對視頻關鍵幀的提取,然後再組合成新視頻。好比一部電影的預告片一樣!
視頻濃縮,其實是動態的視頻摘要。其技術實現涉及到相當複雜的算法。
一般包括四個步驟:
1.運動目標檢測,這裏涉及到背景建模,場景分割,運動目標提取等算法;
2.目標軌跡提取,軌跡提取算法涉及到目標跟蹤算法,如camshift、TLD等;
3.軌跡組合優化,主要是通過組合算法得到軌跡時間序列;
4.生成濃縮視頻,將目標軌跡集合與背景圖像拼接成幀,再將幀組合成視頻。
二.圖像處理的零交叉點原理和示例
二階導數在灰度斜坡和灰度臺階過渡處會產生雙邊緣響應。
二階導數的符號可以用於確定邊緣的過渡是從亮到暗還是暗到亮。
斜坡開始處,二階導數爲負,斜坡結束二階導數爲正,斜坡上,二階導數爲0.(亮到暗邊緣)
零交叉點的定義:零灰度軸和二階導數極值的連線的交點稱爲該二階導數的零交叉點。
一條邊緣的兩個附加性質:
(1)對圖像中的每條邊緣,二階導數生成兩個值
(2)二階導數的零交叉點可用於定位粗邊緣的中心
總結:
二階導數提取邊緣往往產生雙邊緣。通過求零交叉點可以確定邊緣的中心,從而避免了產生雙邊緣的不方便。