數字圖像和視頻處理基礎學習第一部分筆記

1.The Pinhole Camera

在針孔相機模型中,x,y代表着投影在某個平面的位置,而z表示光軸即圖像距離相機/小孔的距離。

因此,我們的目標就是根據實際物體的x,y,z計算出相機投影平面上物體的x,y;用公式表示就是x=-fX/Z, y=-fY/Z.


2.Parallel lines converge to a vanishing point

在3-D模型中原本平行的線條在2-D平面上會交匯到一個點上.

證明:

我們先設置一個A點和三維向量D,因此我們可以將任意一點用A點和一個三維變量表示出來。

,

同時根據Pinhole中的計算公式我們可以得到:


若我們考慮 Lambda ->無窮就可以得到:


This expression do not depend on A.

因此我們根據相似可以得出y的計算公式。

我們在迴歸到之前的圖片中,圖片中實際物體的Y=-h, y=-f*h/Z;

suppose Z->INF so y-> 0

nearer point y will be more negative



3. Nearer objects look bigger

set the pole bottom at(X,-h,Z) and top at(X,L-h,Z)

the height of the object will be L.

While bottom project to (f*X/Z,-f*h/Z) and top project to(f*X/Z,-f*(L-h)/Z) .

the different is f*L/Z so the large Z means the smaller object we looks.


4. A projection model that avoids inversion


5. Orthographic projection


當物體的大小相對於Z是很小的時候,對於物體f/Z都可以看做爲alpha.

當Z1-Z2的數值相對於Z來說是很小的時候,就可以用到上述的辦法。


這就是我們老師給的computer vision學習資源前兩集的學習筆記。還有好幾章的視頻課好好學吧。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章