廣義上來說,摘要可以分爲2種,第一種是直接提取視頻中的關鍵幀合成新的視頻,該方法雖然也可以縮短視頻的時長,但是合成後視頻給人一種快進看電影的感覺,而且實際使用較少,所用的方法包括SEDIM,SEDIM-IN,CEA,TEA等方法。
這裏分享一個修改後的SEDIM程序,效果很好,http://download.csdn.net/detail/qq_14845119/9840872
算法流程如下圖所示,
第二種摘要又稱視頻濃縮,是對視頻內容的一個簡單概括,以自動或半自動的方式,先通過運動目標分析,提取運動目標,然後對各個目標的運動軌跡進行分析,將不同的目標拼接到一個共同的背景場景中,並將它們以某種方式進行組合。視頻摘要在視頻分析和基於內容的視頻檢索中扮演着重要角色。基於濃縮的摘要是實際使用最廣的一種。當然包含技術也更多。
video synopsis實現了將多幀視頻融合到了1幀,是一種將時間疊加到空間上的轉換。將不同時間出現的人物在同一時間顯示出來。
主要技術包括:
(1)背景幀建模,生成一張背景圖片,包括抽取靜止幀,歸一化等方法
(2)運動目標檢測,包括幀間差,背景建模,混合高斯,等方法
(3)目標軌跡跟蹤提取,包括光流,meanshift,camshift,KCF,TLD,STC,staple,multi-cut等方法
(4)軌跡優化算法,保證摘要後同一幀中的目標物儘量不重合或者最小化的減少重合覆蓋問題
(5)目標背景融合拼接,包括阿爾法融合,泊松融合等方法
適用範圍:本地視頻文件,視頻中目標物少,但整體視頻長,可以收到良好的濃縮效果。
————————————————
視頻摘要簡介
視頻摘要分爲靜態視頻摘要和動態視頻摘要。靜態視頻摘要其實不算是視頻,是關鍵幀融合而成。動態視頻摘要,是對視頻片段進行拼接,本身還是視頻。
靜態視頻摘要主要分爲:標題,海報和故事板。標題是視頻中的文本檢測與分析,構成的文本摘要。海報是關鍵幀組合。故事板是將結合了標題和海報。
動態視頻摘要主要分爲:精彩集錦和全局縮略。精彩集錦是指精彩片段,比如整場球賽中識別出進球片段。全局縮略是整個時間軸上的視頻片段結合,比如電影的全局縮略,就是爲了讓用戶快速看完,但是儘量不漏掉關鍵信息。
視頻摘要的主要步驟
不管是靜態視頻摘要還是動態視頻摘要,主要步驟都是:內容分析和摘要生成。
(1)內容分析主要分爲:內部資源分析和外部資源分析。
(2)摘要生成:數據聚類、曲線規劃(去冗餘再聚類串聯)、機器學習-模式識別
數據聚類和曲線規劃可以實現視頻片段的去冗餘和聚類,模式識別等可以實現對視頻片段的內容理解。
3、視頻摘要評價標準:大小、連續性、冗餘性、運動強度
QBB應用場景規劃
1、通過運動目標檢測出視頻中的精彩片段,通過音頻分析檢測出視頻中匹配的音頻部分,兩部分融合切割出好的片段;
2、通過模式識別方法對切割後的視頻片段進行場景理解。
這裏可以結合用戶上傳的視頻描述,模式識別分類出的視頻場景理解結果,音頻分析結果綜合判定,給出內容描述。
相關paper:
Cycle-SUM:用於無監督視頻摘要的週期一致的對抗LSTM網絡
Video summarization produces a short summary of a full-length video and ideally encapsulates its most informative parts, alleviates the problem of video browsing, editing and indexing.
Video Summarization with Long Short-term Memory
DeepVideo: Video Summarization using Temporal Sequence Modelling
- intro: CS231n student project report
- paper: http://cs231n.stanford.edu/reports2016/216_Report.pdf
Semantic Video Trailers
Video Summarization using Deep Semantic Features
- inro: ACCV 2016
- arxiv: http://arxiv.org/abs/1609.08758
CNN-Based Prediction of Frame-Level Shot Importance for Video Summarization
- intro: International Conference on new Trends in Computer Sciences (ICTCS), Amman-Jordan, 2017
- arxiv: https://arxiv.org/abs/1708.07023
Video Summarization with Attention-Based Encoder-Decoder Networks
https://arxiv.org/abs/1708.09545
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward
- intro: AAAI 2018. Chinese Academy of Sciences & Queen Mary University of London
- project page: https://kaiyangzhou.github.io/project_vsumm_reinforce/index.html
- arxiv: https://arxiv.org/abs/1801.00054
- github: https://github.com//KaiyangZhou/vsumm-reinforce
Viewpoint-aware Video Summarization
- intro: CVPR 2018
- arxiv: https://arxiv.org/abs/1804.02843
DTR-GAN: Dilated Temporal Relational Adversarial Network for Video Summarization
https://arxiv.org/abs/1804.11228
Learning Video Summarization Using Unpaired Data
https://arxiv.org/abs/1805.12174
Video Summarization Using Fully Convolutional Sequence Networks
https://arxiv.org/abs/1805.10538
Video Summarisation by Classification with Deep Reinforcement Learning
- intro: BMVC 2018
- arxiv: https://arxiv.org/abs/1807.03089
Query-Conditioned Three-Player Adversarial Network for Video Summarization
- intro: BMVC 2018
- arxiv: https://arxiv.org/abs/1807.06677
視頻濃縮
視頻濃縮技術通過對原始監控視頻進行一定的分析處理,進而提取出原視頻中的關鍵信息,並且將這些關鍵信息進行一定規律的組合,生成一段濃縮視頻,且該濃縮視頻能體現出原始視頻中的內容。視頻濃縮技術是一種將原視頻進行時空壓縮的方法,它首先提取原視頻中的運動目標,然後對運動目標進行軌跡跟蹤和分析,按照一定的軌跡組合方式將不同時刻的運動目標通過一定的圖像合成技術拼接到相同的背景圖像中,進而形成濃縮視頻。該技術可以將幾十個小時的監控視頻濃縮成十幾分鐘的視頻,而且不丟失原始運動信息,供用戶進行瀏覽和分析。這樣的濃縮視頻除了減少視頻長度,方便瀏覽,還可以實現對原視頻目標的快速檢索,幫助用戶迅速地鎖定感興趣的目標。
視頻摘要概述
參考文獻:
1.CVPR2018:HSA-RNN(分層結構自適應的視頻摘要方法)
2.AAAI 2017|新加坡信息通信研究院:主動視頻摘要生成-通過與用戶的在線交互定製摘要
6.有哪些video summarization/highlights方面的數據集?
8.視頻摘要技術綜述