数字图像和视频处理基础学习第一部分笔记

1.The Pinhole Camera

在针孔相机模型中,x,y代表着投影在某个平面的位置,而z表示光轴即图像距离相机/小孔的距离。

因此,我们的目标就是根据实际物体的x,y,z计算出相机投影平面上物体的x,y;用公式表示就是x=-fX/Z, y=-fY/Z.


2.Parallel lines converge to a vanishing point

在3-D模型中原本平行的线条在2-D平面上会交汇到一个点上.

证明:

我们先设置一个A点和三维向量D,因此我们可以将任意一点用A点和一个三维变量表示出来。

,

同时根据Pinhole中的计算公式我们可以得到:


若我们考虑 Lambda ->无穷就可以得到:


This expression do not depend on A.

因此我们根据相似可以得出y的计算公式。

我们在回归到之前的图片中,图片中实际物体的Y=-h, y=-f*h/Z;

suppose Z->INF so y-> 0

nearer point y will be more negative



3. Nearer objects look bigger

set the pole bottom at(X,-h,Z) and top at(X,L-h,Z)

the height of the object will be L.

While bottom project to (f*X/Z,-f*h/Z) and top project to(f*X/Z,-f*(L-h)/Z) .

the different is f*L/Z so the large Z means the smaller object we looks.


4. A projection model that avoids inversion


5. Orthographic projection


当物体的大小相对于Z是很小的时候,对于物体f/Z都可以看做为alpha.

当Z1-Z2的数值相对于Z来说是很小的时候,就可以用到上述的办法。


这就是我们老师给的computer vision学习资源前两集的学习笔记。还有好几章的视频课好好学吧。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章