單目視覺里程計的尺度問題的疑問？

SLAM是個坑…

經過一段時間對SLAM的瞭解，原來是我理解有錯誤，得到的尺度已經是統一的，只是不知道它的真實尺度是多少。

貼一個不錯的視覺里程計簡介的鏈接：
https://blog.csdn.net/gzj2013/article/details/100878053

關於下面代碼中單目視覺里程計中尺度的理解：
https://github.com/yueying/LearningVO/blob/master/src/visual_odometry.cpp
截取片段：

double VisualOdometry::getAbsoluteScale(int frame_id)
{
	std::string line;
	int i = 0;
	std::ifstream ground_truth("C:/dataset/00/00.txt");
	double x = 0, y = 0, z = 0;
	double x_prev, y_prev, z_prev;
	// 獲取當前幀真實位置與前一幀的真實位置的距離作爲尺度值
	if (ground_truth.is_open())
	{
		while ((std::getline(ground_truth, line)) && (i <= frame_id))
		{
			z_prev = z;
			x_prev = x;
			y_prev = y;
			std::istringstream in(line);
			for (int j = 0; j < 12; j++)  {
				in >> z;
				if (j == 7) y = z;
				if (j == 3)  x = z;
			}
			i++;
		}
		ground_truth.close();
	}

	else {
		std::cerr<< "Unable to open file";
		return 0;
	}

	return sqrt((x - x_prev)*(x - x_prev) + (y - y_prev)*(y - y_prev) + (z - z_prev)*(z - z_prev));
}

從以上代碼來看，數據集KITTI-00的真實值pose.txt，裏面每行是12列數據，12列數據很容易想到是3個平移量和一個3x3的旋轉矩陣，這樣想沒錯，但是其排列方式卻不是這樣的，而是一個3*4的矩陣,其排列方式爲一個增廣矩陣：[R|t]
也就是說，每一行的最後一列數據爲平移的t的數據。
那麼是如何得到尺度因子的呢？衆所周知，單目無法得到真實尺度的信息，不具有單位的概念，因此上面的基於單目的視覺里程計其尺度信息是來自於groundtruth的，也就是事先知道的真實尺度，如何計算：獲取當前幀真實位置與前一幀的真實位置的距離作爲尺度值。
也就是最後return的值，其實就是當前幀的（x,y,z）減去上一幀的（x,y,z）這個真實距離作爲真實尺度。
只是我不明白爲什麼更新尺度的時候是這樣計算的呢？

bool VisualOdometry::processFrame(int frame_id)
{
	double scale = 1.00;//初始尺度爲1
	featureTracking(last_frame_, new_frame_, px_ref_, px_cur_, disparities_); //通過光流跟蹤確定第二幀中的相關特徵
	cv::Mat E, R, t, mask;
	E = cv::findEssentialMat(px_cur_, px_ref_, focal_, pp_, cv::RANSAC, 0.999, 1.0, mask);
	cv::recoverPose(E, px_cur_, px_ref_, R, t, focal_, pp_, mask);
	scale = getAbsoluteScale(frame_id);//得到當前幀的實際尺度
	if (scale > 0.1) //如果尺度小於0.1可能計算出的Rt存在一定的問題,則不做處理，保留上一幀的值
	{
		cur_t_ = cur_t_ + scale*(cur_R_*t);
		cur_R_ = R*cur_R_;
	}
	// 如果跟蹤特徵點數小於給定閾值，進行重新特徵檢測
	if (px_ref_.size() < kMinNumFeature)
	{
		featureDetection(new_frame_, px_ref_);
		featureTracking(last_frame_, new_frame_, px_ref_, px_cur_, disparities_);
	}
	px_ref_ = px_cur_;
	return true;
}

其中第11行和第12行的代碼我不是很懂，得到了實際尺度，爲什麼要那樣更新呢？我本以爲使用如下這樣的更新方式就行了：

// 錯誤示範
if (scale > 0.1) 
{
		cur_t_ = cur_t_ + scale*t;
		cur_R_ = R*cur_R_;
}
/*之所以錯誤的原因是，忽略了平移的方向性，因此左乘旋轉矩陣，就規定了它朝哪個方向旋轉，這也符合真實的平移情況*/

我的理解是：先旋轉後平移再加上原來的平移量纔是真實的平移，如上註釋。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

單目視覺里程計的尺度問題的疑問？

SLAM是個坑…

ROS☞rosbag/rostopic消息記錄、回放、轉.txt

三次樣條插值-軌跡規劃

迭代近鄰算法Iterative Closest Point, ICP

提問-MultiCol-SLAM魚眼相機的相機模型

單目視覺里程計的尺度問題的疑問？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結