1.The Pinhole Camera
在針孔相機模型中,x,y代表着投影在某個平面的位置,而z表示光軸即圖像距離相機/小孔的距離。
因此,我們的目標就是根據實際物體的x,y,z計算出相機投影平面上物體的x,y;用公式表示就是x=-fX/Z, y=-fY/Z.
2.Parallel lines converge to a vanishing point
在3-D模型中原本平行的線條在2-D平面上會交匯到一個點上.
證明:
我們先設置一個A點和三維向量D,因此我們可以將任意一點用A點和一個三維變量表示出來。
,
同時根據Pinhole中的計算公式我們可以得到:
若我們考慮 Lambda ->無窮就可以得到:
This expression do not depend on A.
因此我們根據相似可以得出y的計算公式。
我們在迴歸到之前的圖片中,圖片中實際物體的Y=-h, y=-f*h/Z;
suppose Z->INF so y-> 0
nearer point y will be more negative
3. Nearer objects look bigger
set the pole bottom at(X,-h,Z) and top at(X,L-h,Z)
the height of the object will be L.
While bottom project to (f*X/Z,-f*h/Z) and top project to(f*X/Z,-f*(L-h)/Z) .
the different is f*L/Z so the large Z means the smaller object we looks.
4. A projection model that avoids inversion
5. Orthographic projection
當物體的大小相對於Z是很小的時候,對於物體f/Z都可以看做爲alpha.
當Z1-Z2的數值相對於Z來說是很小的時候,就可以用到上述的辦法。
這就是我們老師給的computer vision學習資源前兩集的學習筆記。還有好幾章的視頻課好好學吧。