原创 python+OpenCV+cuda計算光流

利用OpenCV計算TVL1光流,具體實現可參考 這裏,需要注意的是要用 opencv-contrib-python,opencv-python 是不包含光流計算模塊的;這是純 CPU 的計算方式,計算速度爲大約爲 3FPS,很難

原创 Face++人臉關鍵點檢測SDK開發流程

1. SDK下載 當前最新版SDK地址 其實整個SDK裏面只用到三個核心文件、三個util腳本,當然如果不想自己創建工程,它裏面有一個demo是可以直接跑的。 2. 核心文件導入 SDK包含三個核心文件: MGFaceppSDK

原创 動作識別

1.推薦閱讀 [動作識別綜述](本文主要翻譯自該綜述) [動作識別開源集錦] [競賽] 2.Action Recognition 的難點 Action Recognition 需要對視頻幀中的每一個動作進行識別,這些動作可能是貫穿

原创 語義分割之FCN、Deeplab V3+

1、相關參考鏈接 基本概念: 語義分割 三維語義分割 空洞卷積 兩篇綜述 最新論文: LEDNet 這裏將語義分割網絡分爲兩類:一類是以FCN爲代表的“encode-decode”,另一類是以Deeplab爲代表的“dilate

原创 準確率、召回率和mAP

1、準確率和召回率 真實值與預測值之間的關係爲: 準確率(precision)和召回率(recall)作爲統計值,各自的計算方式: P=TPTP+FPP=\frac{TP}{TP+FP}P=TP+FPTP​R=TPTP+FNR=\fr

原创 三、Image Processing in OpenCV(Ⅰ)

1、空間轉換 OpenCV的圖像顏色空間很多,常見的有BGR、HSV等。 cv.cvtColor(input_image, flag) # 空間轉換函數,flag參數多達150多種,常用的cv.COLOR_BGR2GRAY、cv.C

原创 一、Gui Features in OpenCV

1、圖像部分 (1)圖像讀取 cv.imread(filepath, model) filepath:圖片路徑 model:cv.IMREAD_COLOR # 讀取3通道BGR圖像,默認參數 cv.IMREAD_GRAY

原创 二、Core Operations

1、像素值操作 OpenCV讀取圖像後,將其作爲numpy存儲,所以大部分的圖像計算都是numpy的工作 px = img[100,100] # 獲取像素點(100,100)的三通道顏色值 blue = img[100,100,

原创 人體姿態估計:OpenPose、CPN

1、OpenPose OpenPose(OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields)首次提出一種自下而上描述關聯分數的方法

原创 經典模型

1、LeNet-5 手寫體數字識別模型,是一個廣爲人知的商用的卷積神經網絡, 當年美國大多數銀行用它來識別支票上面的手寫數字。 Lenet-5 原始結構如下圖所示,包括:卷積層,降採樣,卷積層,降採樣,卷積層(實現全連接),全連接層,

原创 2、需求分析

原创 協方差與相關係數

1、聯合分佈 均值和方差是我們再熟悉不過的兩個概念,但它們都是基於單一隨機變量,如果考慮多個隨機變量呢?例如,在體檢中身高和體重;這就屬於聯合分佈的範疇了。 定義:關於隨機向量(多個隨機變量)的分佈稱爲聯合分佈。聯合分佈函數作爲描述