下一站擠不擠?智能系統告訴你!

下一站擠不擠?智能系統告訴你!

剛剛看到新聞,上海公交站已經開始了一個新的智能系統的試運行。這個智能系統可以提示乘客下一輛車的擁擠程度,這個可是比只能提示下一輛車還有多久到的系統智能多了。

剛看到這個新聞我就在想,這個是基於什麼原理做的呢?什麼樣的方案才能成本最小? 腦海裏第一個出來的就是圖像,只有基於圖像做,每輛車的成本就只需要控制在幾個攝像頭的價格內,妥妥的可以大力推廣的方案。

經過查看進一步的信息,這個系統是上海理工大學光電信息與計算機工程學院陳慶奎教授團隊做的,在舊的公交車上沒有新增攝像頭,只需要將原有的攝像頭畫面採集進行分析就可以了,裏面的原理就我們CV黨常說的人羣密度估計


下面我們聊聊人羣密度估計

前言

人羣密度估計在安防領域應用最多,例如我之前工作過的一家公司,就有一個項目需求是通過攝像頭對廣場上的行人監控,如果有聚集,打架等行爲就要通知保安。這樣的需求例子還有很多,例如很多大型的活動中經常會發生踩踏事故,在2015年元旦上海外灘踩踏事故就是一個慘痛的教訓。所以安防行業對這種類型的研究也越來越重視。

外灘跨年

人羣計數方法

常見的人羣計數方法分爲兩類:

  • 基於行人檢測
  • 基於密度迴歸

早期的人羣研究算法都是基於檢測做的,基於檢測的方法也有兩種,第一種是基於整體檢測,另一種是基於部分檢測。檢測算法就是在全圖中使用檢測的方法來得到圖中人羣的數量和位置,基於整體的檢測在稀疏人羣中的效果比較好,但是隨着遮擋嚴重之後,其檢出率大大降低;基於部分身體檢測的算法,其天生的缺陷就是容易誤檢。

所以現在研究人羣密度估計大都是基於迴歸的方法。

其主要思想是通過學習一種圖像特徵到人羣數量的映射,將人羣圖像和人羣數量建立一種聯繫。一般是先提取特徵,然後利用迴歸模型進行迴歸,得到特徵到任務數量的映射,在深度學習裏面,直接進行end2end的訓練,從圖片直接生成人羣數量。

1、MCNN

mcnn方法是cvpr2016提出來的,如圖所示,mcnn利用3個具有不同卷積核大小的網絡來分別提取人羣圖像的特徵,最後將3個尺度的特徵通過1×1卷積來融合。最後輸出Desnsity map.

2、CP-CNN

CP-CNN設計了兩個網絡分別用於提取全局上下文信息和局部上下文信息,設計了一個類似mcnn的多列cnn用於將輸入數據映射到一個高維度的特徵圖,將之前提取到的上下文信息和高維特徵圖融合在一起,輸入最後的融合網絡,由最後的融合網絡生成最終的密度圖.
CP-CNN

3、Switch-CNNCSRNet

這是cvpr2018提出的一種新方法,CSRNet由兩個主要組件組成:CNN作爲2D特徵提取的前端,而擴張的CNN則作爲後端,後者使用擴張的內核提供更大的感受野並代替合併操作。 CSRNet具有純卷積結構,因此是易於訓練的模型。在四個數據集(ShanghaiTech,UCF CC 50,WorldEXPO’10UCSD)上進行了測試,達到SOAT的效果

4、Scale-Aware Attention Network for Crowd Counting

這篇文章來自亞馬遜,其提出了一種新的多分支尺度感知注意網絡,利用卷積神經網絡的層次結構,並在單個前向傳播中生成來自架構不同層的多尺度密度預測。爲了將這些 maps 聚合到最終預測中,提出了一種新的 soft 注意力機制,其可以學習一組 gating masks。此外,我們引入了規模感知損失函數來規範不同分支的訓練並指導它們專門研究特定的尺度。由於這種新訓練需要對每個頭部的大小進行 ground-truth 標註,我們還提出了一種簡單而有效的技術來自動估計它。最後,我們對每個部分進行ablation study ,並將我們的方法與4個人羣計數數據集的文獻進行比較:UCF-QNRF,ShanghaiTech A&B和UCF_CC_50。實驗結果表明,我們的方法在這些數據集上取得最先進技術的水平(state-of-the-art,SOTA)。我們觀察到UCF-QNRF顯著提高(25%),其他顯著提高(約10%)。

以上只是幾篇比較引用比較多的文章彙總,有興趣的可以去仔細讀一下原文。

上海公交站的擁擠程度預測,最後輸出的是三個圖標,分別代表,舒適,一般,擁擠,三個狀態。理論上如果最後只要三個狀態,後面使用分類,應該問題不大。

微信公衆號: 卡本特
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章