數字圖像和視頻處理基礎學習第一部分筆記

原創

2018-09-03 16:23

1.The Pinhole Camera

在針孔相機模型中，x,y代表着投影在某個平面的位置，而z表示光軸即圖像距離相機/小孔的距離。

因此，我們的目標就是根據實際物體的x,y,z計算出相機投影平面上物體的x,y；用公式表示就是x=-fX/Z, y=-fY/Z.

2.Parallel lines converge to a vanishing point

在3-D模型中原本平行的線條在2-D平面上會交匯到一個點上.

證明：

我們先設置一個A點和三維向量D,因此我們可以將任意一點用A點和一個三維變量表示出來。

,

同時根據Pinhole中的計算公式我們可以得到：

若我們考慮 Lambda ->無窮就可以得到：

This expression do not depend on A.

因此我們根據相似可以得出y的計算公式。

我們在迴歸到之前的圖片中，圖片中實際物體的Y=-h, y=-f*h/Z;

suppose Z->INF so y-> 0

nearer point y will be more negative

3. Nearer objects look bigger

set the pole bottom at(X,-h,Z) and top at(X,L-h,Z)

the height of the object will be L.

While bottom project to (f*X/Z,-f*h/Z) and top project to(f*X/Z,-f*(L-h)/Z) .

the different is f*L/Z so the large Z means the smaller object we looks.

4. A projection model that avoids inversion

5. Orthographic projection

當物體的大小相對於Z是很小的時候，對於物體f/Z都可以看做爲alpha.

當Z1-Z2的數值相對於Z來說是很小的時候，就可以用到上述的辦法。

這就是我們老師給的computer vision學習資源前兩集的學習筆記。還有好幾章的視頻課好好學吧。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

深度學習_目標檢測_FPN論文詳解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

Ubuntu + Python + Opencv3.x開發環境

by hirah border="0" width="330" height="86" src="//music.163.com/outchain/player?type=3&id=2057832642&auto=1&heigh

2020-07-08 11:05:23

cv2.VideoWriter()

cv2.VideoWriter前幾個參數最後一個參數，視頻的幀寬和幀高前幾個參數博客：cv2.VideoWriter() 最後一個參數，視頻的幀寬和幀高這個可能經常容易寫錯或者忘記 outVideo = cv2.VideoW

2020-07-08 10:45:04

yolov4訓練自己的數據集實現安全帽佩戴檢測

昨兒立下來的flag，今天還是要含淚完成的，抓緊時間趕呀！！！本次用yolov4來實現人佩戴安全帽檢測，若未佩戴安全帽則將人臉框出來，若佩戴安全帽，則將安全帽以及人臉框出來，多說無益，直接看效果吧！！！效果還是不錯的，那

mind_programmonkey

2020-07-08 09:29:00

使用PaddleDetection訓練自己的數據集

使用PaddleDetection訓練自己的數據集 https://aistudio.baidu.com/aistudio/projectdetail/441868?shared=1

2020-07-08 08:24:13

零基礎實戰行人重識別ReID項目-基於Milvus的以圖搜圖

目錄第一階段，ReID的基本概念 1.1 ReID定義 1.2 技術難點 1.3 常用數據集 1.4 評價指標 1.5 實現思路 1.6 具體方案第二階段：復現算法 2.1 PCB的骨幹網絡 2.2 PCB的流程 2.3 PCB的細節

2020-07-08 08:24:13

AAAI 2020 收錄的百度騰訊優圖螞蟻金服的論文

會議官網：https://aaai.org/Conferences/AAAI-20/ 關注公衆號code4fun，回覆 “百度28” ，打包下載會議收錄的百度研究院的論文。注：暫缺3篇，已標註，後續更新。百度28篇論文清單，來自

2020-07-08 08:24:13

MTCNN/LPRNet車牌識別細節

文章目錄1.獲取車牌圖片2.MTCNN數據處理2.1 PNet網絡數據預處理2.2 PNet網絡訓練2.3 ONet網絡數據預處理2.4 ONet網絡訓練3. LPRNet數據處理和訓練4. 預測4.1 PNet過程4.2 ONe

不会写作文的李华

2020-07-08 06:19:36

華爲雲杯-粵港澳大灣區強降水臨近預測比賽小結

比賽背景根據近年的雷達回波格點數據共同建立的標準雷達數據集爲基礎劃分了訓練集和測試集，希望參賽者綜合運用計算機視覺、機器學習、深度學習等技術，實現根據過去2個小時內的雷達回波圖像數據預測未來2小時的雷達回波圖像變化，並提交未來

你知道网上冲浪吗

2020-07-08 04:33:29

機器學習中SVM+HOG實現對飲料瓶的識別

#include<opencv.hpp> #include<iostream> #include<highgui/highgui.hpp> #include<ml/ml.hpp> #include<string> #include

计算机爱好者001

2020-07-08 02:49:33

CycleGAN-and-pix2pix 環境搭建|簡記

CycleGAN and pix2pix in PyTorch CycleGAN-and-pix2pix GitHub Linux系統下conda的安裝與使用 pip 源配置 Linux下cuda9.1安裝Pytorch和Torc

2020-07-08 00:28:09

Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation論文解讀

（CVPR 2020｜中科院VIPL實驗室） 1.要解決的問題：基於類別標籤的弱監督語義分割是一個具有挑戰性的問題，類別響應圖（class activation map，簡稱CAM）始終是這一領域的基礎方法。但是由於強監督與弱監督信號之

2020-07-08 00:02:52

曠世x北大公開課 | 深度學習實戰筆記（1）

最近關注到一門28課時的《深度學習實戰》的公開課（B站上有全集資源），覺着1-2天可以對深度學習有一個具體的瞭解，所以就開看了，這一篇是記錄聽課的學習筆記。人工智能主要有以下四部分：語音（speech）視覺（vision

2020-07-07 22:24:06

【MaixPY 教程】用mixly玩轉k210——條形碼、二維碼、AprilTag識別

【MaixPY 教程】用mixly玩轉k210——條形碼、二維碼、AprilTag識別【MaixPy系列教程：】【MaixPy教程】用maixHub訓練模型進行開源硬件識別【MaixPy 教程】用mixly玩轉K210—

2020-07-07 22:04:16

動作識別——action recognition新手入門

定義行爲識別似乎是圖像分類任務到多個幀的擴展，然後聚合來自每幀的預測背景傳統方法，視頻輸入=》特徵提取=》特徵融合=》特徵分類=》分類結果深度學習方法，單流法，雙流法，基於骨架特徵提取，ROI提取表示傳統方法 DT（D

2020-07-07 20:22:22

24小時熱門文章

最新文章

最新評論文章