一、視頻監控技術概述

前言

校招結束後,實驗室要求一直在搞論文,11月底提交完成。開始按照沈工列的讀書清單看看書。海康威視從安防起家,雖然自己搞的是計算機視覺算法,出於對領域業務的熟悉,也需要讀讀相關的書。

說來也很有意思。14年大四進入實驗室,接觸到的第一個項目就是“警情識別顯示系統”。項目PC版當時已經完善,自己工作主要是後續的嵌入式版本移植。因爲項目驗收,親自研究過整個監控系統的硬件搭建,向當時佈線工程師學會了如何接模擬BNC同軸電纜的接線,自己研究了RS485、232的簡單電氣原理,嘗試着自己接線。男生總是對工程感興趣。項目結束後,走在商場看到牆上的攝像頭,能知道設備上的三條線(電源、視頻傳輸、串口控制)各自的作用。因此看書時看到一些術語,頗有一些親切感。這個項目在研一時結束。不曾想到,校招時簽了海康,又回到老本行啦。

薦書:《安防天下-智能網絡視頻監控技術詳解與實踐》
作者:西剎子,安防領域工程師

閱讀本書前言和第一章後,就自己認識到的一些概念和以前存在混淆的概念,加上以前的實踐和理解,記載以下幾個問題。

1、什麼是安防?

提起安防,大部分人第一反應就是監控,無處不在的攝像頭。實際上,安防是一個完整的系統,不僅包含視頻監控,還包括門禁打卡,指紋識別,面部識別,警情處理等全過程,其共同構建了安全防護。

視頻監控是安防領域一個重要分支,和其他技術比起來,這個領域涉及的計算機技術更加多樣,難度較大,可研究點較多。海康威視目前定位就是:以視頻爲核心的物聯網解決方案提供商,致力於不斷提升視頻處理技術和視頻分析技術,面向全球提供領先的監控產品和技術解決方案。

這裏面的兩個關鍵詞:視頻處理和視頻分析技術。智能化的感覺。屬於計算機應用範疇。特別是視頻分析技術,基於學術界不斷研究提升,如今AI的興起,對視頻分析技術將是一次提升。因此看到有概念講:安防+AI。

2、視頻監控中涉及的技術

視頻監控技術,屬於計算機應用領域,就是說其依賴構建在計算機技術的發展之上。從系統模塊來看,其涉及到起碼包括:

  • 光電成像技術(攝像機)
  • 計算機網絡(信號傳輸)
  • 處理器芯片(信號數模轉換、編碼壓縮、解碼顯示等)
  • 計算機存儲(視頻抓拍、錄製存儲)
  • 計算機視覺(圖像分類、物體檢測)

這麼一看突然覺得很有意思:海康威視的技術部門來西電校招真是非常合適。因爲物理與光電工程學院(5系)就是搞光電成像的,通信工程學院(1系)圖像所李雲鬆老師團隊的圖像編碼壓縮技術是給天宮飛船上用的,電子工程學院(2系)雷達所是搞信號處理的,人工智能學院和計算機學院(3系)搞計算機視覺(Computer Vision, CV)很強,計算機院外部設備所是搞存儲的,網絡所是搞網絡技術的。哈哈。

這五項技術中的任何一項有發展,都可以推動視頻監控技術的前進。譬如現在的CV領域,隨着深度學習興起,工業界和學術界不斷出現新高度。記得去年海康威視研究院團隊在圖像分類競賽上上拿過第一。而大規模海量視頻監控中,如果可以應用成熟的CV技術,那帶來的效率提升不是一點點。

3、視頻監控技術發展過程

根據本書的觀點,隨着安防主流設備的發展過程,可分3個大的階段:

  • 20世紀70年代開始的模擬視頻監控
  • 20世紀90年代的數字視頻階段
  • 近年來的網絡視頻監控階段

作者同時指出,這三代劃分不是非常嚴格的,現實中因爲成本等因素,多種架構並存。

4、模擬信號和數字信號

以前在計算機通信課中學習過模擬信號和數字信號的概念。

上述3中的發展過程同樣涉及到此。簡單來說,模擬信號指的是連續信號,數字信號指的是離散信號,譬如二進制編碼流。模擬信號直觀,但是容易受噪聲影響,失真,而且容易被竊聽,收到模擬信號,容易獲取信息。數字信號抗干擾能力強,門限值可以過濾掉一些噪聲。可較長距離傳輸。

5、模擬視頻監控一代

模擬視頻監控系統,也叫作閉路電視監控系統。

所謂閉路電視,指的是從視頻源,傳輸系統,到接收顯示環節,都是通過線纜一對一的“closed”連接。小時候常見的閉路電視後面都有一根運營商拉過來的線。普通的電視插上天線就可接收“open”的信號,是“free”的。閉路電視收看的內容更加豐富,一對一,所以是付費的。

所謂模擬監控,指的是相機的圖像信息,經過同軸電纜(端口是BNC口)傳輸,由磁帶錄像機(VCR)錄像並存儲。磁帶介質的檢索效率低下,但是便宜。

注意:整個系統中不涉及任何數字信號。

閉路電視監控系統的組成包括:

  • 視頻信號採集(攝像機,鏡頭)
  • 信號傳輸(電纜)
  • 切換控制(矩陣控制器)
  • 顯示和錄像(監視器和錄像機)

其中,矩陣控制器解決的問題是“一屏多看”。即用少量監視器看到多臺攝像機,來回切換。一臺攝像機就架設一臺顯示器不僅浪費,而且沒必要。

模擬視頻監控系統,本質上講是將人的視力範圍,延伸到了電纜的長度。技術難度較低。

6、數字視頻監控二代

一代中的磁帶錄像機存儲效率不高,而且檢索效率低下,不久即被一種新的設備——硬盤錄像機(DVR)所取代。

計算機體系結構課中曾提到過,磁盤存儲的本質是根據磁通量的高低指示表示信號(0或1),因此可以存儲二進制數字信號。那麼硬盤錄像機存儲的肯定就是數字信號。那數字信號怎麼來的?DVR設備前端有一個視頻採集卡,其上有一個A2D(模擬to數字)芯片,可將接收到的模擬信號轉換爲數字信號。這樣就實現了視頻的數字化錄像。

注意:此處就開始有了數字化的概念。

那這裏就有一個問題:磁盤上世紀50年代就已出現,磁帶錄像機諸多不便,爲何硬盤錄像機直到90年代纔開始應用?原因是:成本。今天1T的硬盤售價大概是500元人民幣,而在上世紀90年代前,磁盤造價昂貴,在工業中難以推廣。正是因爲存儲技術不斷前進,造價大幅度減低,DVR才得以大規模應用。

DVR功能越做越強大。其組成包括:

  • 視頻採集卡(A2D芯片)
  • 音視頻編碼壓縮模塊(專用芯片,算法已固化在芯片上)
  • 存儲模塊(將文件寫入磁盤)
  • 網絡傳輸模塊(可通過網絡接口與其他設備連接)
  • 軟件控制模塊(用戶可遠程控制)

可以看到,DVR就有了一定的技術含量了。特別是編碼壓縮算法模塊。這是學術界一直在努力的課題。當時我在警情項目中,相機採集到的原始數據是YUV格式,一幀大小是1.24MB,這要是存下來,硬盤多大也不夠用啊。於是就需要通過視頻編碼壓縮算法進行處理,儘可能用較小存儲量來保存更多信息。這是一個難度很大的問題,可以說是DVR的核心。

西電圖像所的吳成柯老師一生都在做這個事,到李雲鬆老師時代積累豐厚。2009年嫦娥二號衛星在月球表面拍攝畫面要傳回地球,通信鏈路非常珍貴,就需要儘可能壓縮圖片信息,同時還要保證傳回地球后能解碼還原,不能失真,難度可想而知。最後中國航天科技委就委託西電圖像所負責這個問題。聽宋老師講,實驗室已將圖像壓縮編碼算法固化到芯片上了,別人直接買這個芯片就可以應用了。

當然業界有一些比較成熟的應用於商業上的算法,比如MPEG-4算法。我們警情項目中用的是H.264算法。現在已經出了H.265算法。不過這些算法只是提供了一個框架標準。各個廠商製造細節上爲了搞商業壁壘,會對算法進行細節處理,即使大家都是H.264算法,但也不能互相通用,這樣做純粹是爲了商業上的利益。

截止到二代,此時監控系統部署的格局就是:前端架設很多攝像頭,每個攝像機引出來模擬視頻信號,通過電纜傳輸到DVR中。DVR可以做編碼、存儲、查看視頻等功能。DVR是核心設備。

海康於2001年創立,剛起家時就是做DVR打開了市場。其上級單位中電52所的全稱就是:計算機外部設備研究所。這屬於計算機應用領域,因此投資搞這個技術優勢很好。西電計算機系(3系,現計算機學院)原系主任王厚生教授,就是搞磁盤存儲的專家,1986年至1990年曾擔任過52所所長。

7、智能網絡視頻監控三代

現在來看,實驗室警情項目仍屬於視頻監控2代。前端攝像機通過電纜傳送信號,信號接入到實驗室自行研製的警情識別器中,對每幀圖像做防區入侵檢測。這就引入了智能化。這套設備優勢在於不需要民警一直盯着防區,而由計算機輔助判斷是否存在防區入侵,有警情才上報,民警再去判斷即可,大大減輕了民警負擔。

該項目於2015年結題。2016年暑假的另一個項目中,看到了北京某廠家生產的一種球機叫 IPC。確實開了眼界:球機本身集成了A2D模塊,智能分析模塊,網絡服務器模塊。從球機僅出來一根網線。通過交換機和PC相連後,在PC瀏覽器中輸入球機IP地址,可直接訪問球機服務器。瀏覽器界面中可以實時查看高清視頻,可控制球機雲臺,可設置防區和規則,可收到報警提示。相當於把我們的警情識別器和警情客戶端都集成到球機中。

我想這就是書中作者提到的智能網絡視頻監控三代。查了下本書出版時是在2010年,距今已有7年。安防領域的書偏少,還是要不斷更新,把新事物、新技術寫進去纔好。

三代中包含2個關鍵詞:智能網絡

  • 所謂智能,即監控系統解放了人,不再是對人的視力空間上的延伸,計算機可以幫助人完成簡單判斷任務,減輕負擔。警情出現的概率畢竟較小,可能24小時防區一直安全,人一直盯效率太低。

  • 所謂網絡,即監控系統的傳輸都實現數字化,最常見的就是基於網絡系統來部署安防系統。以前球機引出模擬視頻線和串口控制線。現在只引出一根網線,所有信號編碼成數字信號,在其上傳輸,網線兩端只需要根據網絡協議解碼即可。這樣佈線方便。而且網絡傳輸效率越來越高,千兆網卡也比較便宜。

上面這個智能,隨着2012年深度學習的興起,被賦予了更多內涵。

實驗室警情識別器和北京這臺IPC球機上的智能算法,攤開來講,就是“防區檢測”,即判斷圖像中某塊區域的背景是否發生了改變。我雖然沒有研究過該算法,但大體瞭解這種算法是基於圖像的運動特性來做。簡單來說,某防區出現警情,可看做圖像該區域背景出現了變化。但到底是壞人闖入防區,還是小動物闖入,這是不能判斷的。

2012年,深度學習興起,其在計算機視覺(CV)領域大放異彩。在圖像分類、物體(目標)檢測、圖像分割等領域邁出一大步。如果說前面“防區檢測”屬於三代智能化,那和這個比起來就是低級智能。可想而知,隨着深度學習技術不斷成熟,其應用於安防領域(即安防+AI)後,必將大大提升視頻監控系統的智能化程度。目前海康研究院正是聚合了計算機視覺方面的很多技術人才,如海康威視首席科學家、海康威視研究院常務副院長蒲世亮就是搞CV的大牛。

8、視頻監控的核心技術總結

作者在這個題目下列出了以下:

  • 光學成像器件
  • 視頻編碼壓縮算法
  • 視頻編碼壓縮芯片
  • 視頻管理平臺

誠然,這幾項有硬有軟,構成了視頻監控系統的框架。我想,還應該加上計算機視覺技術。其類似於作者提到的一個概念:視頻內容分析(VCA),即自動分析和提取視頻中的關鍵信息。因爲監控智能化是非常吸引人的,猶如科幻大片中的神奇場景。

9、視頻監控的發展方向

作者從事安防行業多年,根據自己的思考列出了以下發展方向:

  • 開放性(行業統一標準)
  • 智能化(VCA技術)
  • 高清化
  • 民用化(家庭式)
  • 無線化

我是搞計算機視覺技術的,不太懂這些。但覺得這幾點還是很有道理的,因爲根據IT行業的歷史經驗來看,第一條的開放性是一個趨勢。智能化不用說。高清化現在越來越普及。民用化趨勢也是關鍵,之前北京紅藍黃幼兒園爆出的虐童事件,就有專家提出園區要架設全方位監控系統,而且國外似乎民用化進展較快。

發佈了141 篇原創文章 · 獲贊 131 · 訪問量 34萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章