本篇是《SLAM拾萃》第一篇,介紹一個建圖工具:octomap。和往常一樣,我會介紹它的原理、安裝與使用方式,並提供例程供讀者學習。必要時也會請小蘿蔔過來吐槽。(小蘿蔔真是太好用了,它可以代替讀者提很多問題。)
什麼是octomap?
RGBD SLAM的目的有兩個:估計機器人的軌跡,並建立正確的地圖。地圖有很多種表達方式,比如特徵點地圖、網格地圖、拓撲地圖等等。在《一起做》系列中,我們使用的地圖形式主要是點雲地圖。在程序中,我們根據優化後的位姿,拼接點雲,最後構成地圖。這種做法很簡單,但有一些明顯的缺陷:
- 地圖形式不緊湊。
點雲地圖通常規模很大,所以一個pcd文件也會很大。一張640××480的圖像,會產生30萬個空間點,需要大量的存儲空間。即使經過一些濾波之後,pcd文件也是很大的。而且討厭之處在於,它的“大”並不是必需的。點雲地圖提供了很多不必要的細節。對於地毯上的褶皺、陰暗處的影子,我們並不特別關心這些東西。把它們放在地圖裏是浪費空間。 - 處理重疊的方式不夠好。
在構建點雲時,我們直接按照估計位姿拼在了一起。在位姿存在誤差時,會導致地圖出現明顯的重疊。例如一個電腦屏變成了兩個,原本方的邊界變成了多邊形。對重疊地區的處理方式應該更好一些。 - 難以用於導航
說起地圖的用處,第一就是導航啦!有了地圖,就可以指揮機器人從A點到B點運動,豈不是很方便的事?但是,給你一張點雲地圖,是否有些傻眼了呢?我至少得知道哪些地方可通過,哪些地方不可通過,才能完成導航呀!光有點是不夠的!
octomap就是爲此而設計的!親,你沒有看錯,它可以優雅地壓縮、更新地圖,並且分辨率可調!它以八叉樹(octotree,後面會講)的形式存儲地圖,相比點雲,能夠省下大把的空間。octomap建立的地圖大概是這樣子的:(從左到右是不同的分辨率)
由於八叉樹的原因,它的地圖像是很多個小方塊組成的(很像minecraft)。當分辨率較高時,方塊很小;分辨率較低時,方塊很大。每個方塊表示該格被佔據的概率。因此你可以查詢某個方塊或點“是否可以通過”,從而實現不同層次的導航。簡而言之,環境較大時採用較低分辨率,而較精細的導航可採用較高分辨率。
小蘿蔔:師兄你這是介紹嗎?真像廣告啊……
octomap原理
本段會講一些數學知識。如果你想“跑跑程序看效果”,可以跳過本段。
- 八叉樹的表達
八叉樹,也就是傳說中有八個子節點的樹!是不是很厲害呢?至於爲什麼要分成八個子節點,想象一下一個正方形的方塊的三個面各切一刀,不就變成八塊了嘛!如果你想象不出來,請看下圖:
實際的數據結構呢,就是一個樹根不斷地往下擴,每次分成八個枝,直到葉子爲止。葉子節點代表了分辨率最高的情況。例如分辨率設成0.01m,那麼每個葉子就是一個1cm見方的小方塊了呢!
每個小方塊都有一個數描述它是否被佔據。在最簡單的情況下,可以用0-1兩個數表示(太簡單了所以沒什麼用)。通常還是用0~1之間的浮點數表示它被佔據的概率。0.5表示未確定,越大則表示被佔據的可能性越高,反之亦然。由於它是八叉樹,那麼一個節點的八個孩子都有一定的概率被佔據或不被佔據啦!(下圖是一棵八叉樹)
用樹結構的好處時:當某個節點的子結點都“佔據”或“不佔據”或“未確定”時,就可以把它給剪掉!換句話說,如果沒必要進一步描述更精細的結構(孩子節點)時,我們只要一個粗方塊(父節點)的信息就夠了。這可以省去很多的存儲空間。因爲我們不用存一個“全八叉樹”呀!
2. 八叉樹的更新
小蘿蔔:哦!這個我就懂了!每新來一個就直接加到原來的上面,是吧?
師兄:對,此外還要加一個最大最小值的限制。最後轉換回原來的概率即可。
八叉樹中的父親節點佔據概率,可以根據孩子節點的數值進行計算。比較簡單的是取平均值或最大值。如果把八叉樹按照佔據概率進行渲染,不確定的方塊渲染成透明的,確定佔據的渲染成不透明的,就能看到我們平時見到的那種東西啦!
octomap本身的數學原理還是簡單的。不過它的可視化做的比較好。下面我們來講講如何下載、安裝八叉樹程序,並給出幾個小的例程。
安裝octomap
octomap的網頁見:https://octomap.github.io
它的github源碼在:https://github.com/OctoMap/octomap
它還有ROS下的安裝方式:http://wiki.ros.org/octomap
在開發過程中,可能需要不斷地查看它的API文檔。你可以自己用doxygen生成一個,或者查看在線文檔:http://octomap.github.io/octomap/doc/
爲了保持簡潔,我們不要求讀者安裝ROS,僅介紹單獨的octomap。我的編譯環境是ubuntu 14.04。ubuntu系列的應該都不會有太大問題。
1. 編譯octomap
新建一個目錄,拷貝octomap代碼。如果沒有git請安裝git:sudo apt-get install git
-
git clone https://github.com/OctoMap/octomap
git會把代碼拷貝到當前目錄/octomap下。進入該目錄,參照README.md進行安裝。編譯方式和普通的cmake程序一樣,如果你學過《一起做》就應該很熟悉了:
1 mkdir build 2 cd build 3 cmake .. 4 make
事實上,octomap的代碼主要含兩個模塊:本身的octomap和可視化工具octovis。octovis依賴於qt4和qglviewer,所以如果你沒有裝這兩個依賴,請安裝它們:sudo apt-get install libqt4-dev qt4-qmake libqglviewer-dev
如果編譯沒有給出任何警告,恭喜你編譯成功!
- 使用octovis查看示例地圖
在bin/文件夾中,存放着編譯出來可執行文件。爲了直觀起見,我們直接看一個示例地圖:bin/octovis octomap/share/data/geb079.bt
octovis會打開這個地圖並顯示。它的UI是長這樣的。你可以玩玩菜單裏各種東西(雖然也不多,我就不一一介紹UI怎麼玩了),能看出這是一層樓的掃描圖。octovis是一個比較實用的工具,你生成的各種octomap地圖都可以用它來看。(所以你可以把octovis放到/usr/local/bin/下,省得以後還要找。)
例程1:轉換pcd到octomap
GUI玩夠了吧?僅僅會用UI是不夠滴,現在讓我們開始編代碼使用octomap這個庫吧!
我爲你準備了三個小例程。在前兩個中,我會教你如何將一個pcd格式的點雲地圖轉換爲octomap地圖。後一箇中,我會講講如何根據g2o優化的軌跡,以類似slam的方式,把幾個RGBD圖像拼接出一個octomap。這對你研究SLAM會有一些幫助。所有的代碼與數據都可以在我的github上找到。有關編譯的信息,我寫在這個代碼的Readme中了,請在編譯前看一眼如何編譯這些代碼。
源代碼如下:src/pcd2octomap.cpp 這份代碼將命令行參數1作爲輸入文件,參數2作爲輸出文件,把輸入的pcd格式點雲轉換成octomap格式的點雲。通過這個例子,你可以學會如何創建一個簡單的OcTree對象並往裏面添加新的點。
#include <iostream>
#include <assert.h>
//pcl
#include <pcl/io/pcd_io.h>
#include <pcl/point_types.h>
//octomap
#include <octomap/octomap.h>
using namespace std;
int main( int argc, char** argv )
{
if (argc != 3)
{
cout<<"Usage: pcd2octomap <input_file> <output_file>"<<endl;
return -1;
}
string input_file = argv[1], output_file = argv[2];
pcl::PointCloud<pcl::PointXYZRGBA> cloud;
pcl::io::loadPCDFile<pcl::PointXYZRGBA> ( input_file, cloud );
cout<<"point cloud loaded, piont size = "<<cloud.points.size()<<endl;
//聲明octomap變量
cout<<"copy data into octomap..."<<endl;
// 創建八叉樹對象,參數爲分辨率,這裏設成了0.05
octomap::OcTree tree( 0.05 );
for (auto p:cloud.points)
{
// 將點雲裏的點插入到octomap中
tree.updateNode( octomap::point3d(p.x, p.y, p.z), true );
}
// 更新octomap
tree.updateInnerOccupancy();
// 存儲octomap
tree.writeBinary( output_file );
cout<<"done."<<endl;
return 0;
}
這個代碼是相當直觀的。在編譯之後,它會產生一個可執行文件,叫做pcd2octomap,放在代碼根目錄的bin/文件夾下。你可以在代碼根目錄下這樣調:
1 bin/pcd2octomap data/sample.pcd data/sample.bt
它會把data文件夾下的sample.pcd(一個示例pcd點雲),轉換成一個data/sample.bt的octomap文件。你可以比較下pcd點雲與octomap的區別。下圖是分別調用這些顯示命令的結果。
1 pcl_viewer data/sample.pcd 2 octovis data/sample.ot
這個octomap裏只存儲了點的空間信息,而沒有顏色信息。我按照高度給它染色了,否則它應該就是灰色的。通過octomap,我們能查看每個小方塊是否可以通行,從而實現導航的工作。
以下是對代碼的一些註解:
注1:有關如何讀取pcd文件,你可以參見pcl官網的tutorial。不過這件事情十分簡單,所以我相信你也能直接看懂。
注2:31行採用了C++11標準的for循環,它會讓代碼看起來稍微簡潔一些。如果你的編譯器比較老而不支持c++11,你可以自己將它改成傳統的for循環的樣式。
注3:octomap存儲的文件後綴名是.bt(二進制文件)和.ot(普通文件),前者相對更小一些。不過octomap文件普遍都很小,所以也不差這麼些容量。如果你存成了其他後綴名,octovis可能認不出來。
例程2:加入色彩信息
第一個示例中,我們將pcd點雲轉換爲octomap。但是pcd點雲是有顏色信息的,能否在octomap中也保存顏色信息呢?答案是可以的。octomap提供了ColorOcTree類,能夠幫你存儲顏色信息。下面我們就來做一個保存顏色信息的示例。代碼見:src/pcd2colorOctomap.cpp
#include <iostream>
#include <assert.h>
//pcl
#include <pcl/io/pcd_io.h>
#include <pcl/point_types.h>
//octomap
#include <octomap/octomap.h>
#include <octomap/ColorOcTree.h>
using namespace std;
int main( int argc, char** argv )
{
if (argc != 3)
{
cout<<"Usage: pcd2colorOctomap <input_file> <output_file>"<<endl;
return -1;
}
string input_file = argv[1], output_file = argv[2];
pcl::PointCloud<pcl::PointXYZRGBA> cloud;
pcl::io::loadPCDFile<pcl::PointXYZRGBA> ( input_file, cloud );
cout<<"point cloud loaded, piont size = "<<cloud.points.size()<<endl;
//聲明octomap變量
cout<<"copy data into octomap..."<<endl;
// 創建帶顏色的八叉樹對象,參數爲分辨率,這裏設成了0.05
octomap::ColorOcTree tree( 0.05 );
for (auto p:cloud.points)
{
// 將點雲裏的點插入到octomap中
tree.updateNode( octomap::point3d(p.x, p.y, p.z), true );
}
// 設置顏色
for (auto p:cloud.points)
{
tree.integrateNodeColor( p.x, p.y, p.z, p.r, p.g, p.b );
}
// 更新octomap
tree.updateInnerOccupancy();
// 存儲octomap, 注意要存成.ot文件而非.bt文件
tree.write( output_file );
cout<<"done."<<endl;
return 0;
}
大部分代碼和剛纔是一樣的,除了把OcTree改成ColorOcTree,以及調用integrateNodeColor來混合顏色之外。這段代碼會編譯出pcd2colorOctomap這個程序,完成帶顏色的轉換。不過,後綴名改成了.ot文件。
1 bin/pcd2colorOctomap data/sample.pcd data/sample.ot
顏色信息能夠更好地幫助我們辨認結果是否正確,給予一個直觀的印象。是不是好看了一些呢?
例程3:更好的拼接與轉換
前兩個例程中,我們都是對單個pcd文件進行了處理。實際做slam時,我們需要拼接很多幀的octomap。爲了做這樣一個示例,我從自己的實驗數據中取出了一小段。這一小段總共含有五張圖像(因爲github並不適合傳大量數據),它們存放在data/rgb_index和data/dep_index下。我的slam程序估計了這五個關鍵幀的位置,放在data/trajectory.txt中。它的格式是:幀編號 x y z qx qy qz qw (位置+姿態四元數)。事實上它是從一個g2o文件中拷出來的。你可以用g2o_viewer data/result_after.g2o來看整個軌跡。
54 -0.228993 0.00645704 0.0287837 -0.0004327 -0.113131 -0.0326832 0.993042
144 -0.50237 -0.0661803 0.322012 -0.00152174 -0.32441 -0.0783827 0.942662
230 -0.970912 -0.185889 0.872353 -0.00662576 -0.278681 -0.0736078 0.957536
313 -1.41952 -0.279885 1.43657 -0.00926933 -0.222761 -0.0567118 0.973178
346 -1.55819 -0.301094 1.6215 -0.02707 -0.250946 -0.0412848 0.966741
現在我們要做的事,就是根據trajectory.txt裏記錄的信息,把幾個RGBD圖拼成一個octomap。這也是所謂的用octomap來建圖。我寫了一個示例,不知道你能否讀懂呢?src/joinMap.cpp
#include <iostream>
#include <vector>
// octomap
#include <octomap/octomap.h>
#include <octomap/ColorOcTree.h>
#include <octomap/math/Pose6D.h>
// opencv 用於圖像數據讀取與處理
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui/highgui.hpp>
// 使用Eigen的Geometry模塊處理3d運動
#include <Eigen/Core>
#include <Eigen/Geometry>
// pcl
#include <pcl/common/transforms.h>
#include <pcl/point_types.h>
// boost.format 字符串處理
#include <boost/format.hpp>
using namespace std;
// 全局變量:相機矩陣
// 更好的寫法是存到參數文件中,但爲方便起見我就直接這樣做了
float camera_scale = 1000;
float camera_cx = 325.5;
float camera_cy = 253.5;
float camera_fx = 518.0;
float camera_fy = 519.0;
int main( int argc, char** argv )
{
// 讀關鍵幀編號
ifstream fin( "./data/keyframe.txt" );
vector<int> keyframes;
vector< Eigen::Isometry3d > poses;
// 把文件 ./data/keyframe.txt 裏的數據讀取到vector中
while( fin.peek() != EOF )
{
int index_keyframe;
fin>>index_keyframe;
if (fin.fail()) break;
keyframes.push_back( index_keyframe );
}
fin.close();
cout<<"load total "<<keyframes.size()<<" keyframes. "<<endl;
// 讀關鍵幀姿態
// 我的代碼中使用了Eigen來存儲姿態,類似的,也可以用octomath::Pose6D來做這件事
fin.open( "./data/trajectory.txt" );
while( fin.peek() != EOF )
{
int index_keyframe;
float data[7]; // 三個位置加一個姿態四元數x,y,z, w,ux,uy,uz
fin>>index_keyframe;
for ( int i=0; i<7; i++ )
{
fin>>data[i];
cout<<data[i]<<" ";
}
cout<<endl;
if (fin.fail()) break;
// 注意這裏的順序。g2o文件四元數按 qx, qy, qz, qw來存
// 但Eigen初始化按照qw, qx, qy, qz來做
Eigen::Quaterniond q( data[6], data[3], data[4], data[5] );
Eigen::Isometry3d t(q);
t(0,3) = data[0]; t(1,3) = data[1]; t(2,3) = data[2];
poses.push_back( t );
}
fin.close();
// 拼合全局地圖
octomap::ColorOcTree tree( 0.05 ); //全局map
// 注意我們的做法是先把圖像轉換至pcl的點雲,進行姿態變換,最後存儲成octomap
// 因爲octomap的顏色信息不是特別方便處理,所以採用了這種迂迴的方式
// 所以,如果不考慮顏色,那不必轉成pcl點雲,而可以直接使用octomap::Pointcloud結構
for ( size_t i=0; i<keyframes.size(); i++ )
{
pcl::PointCloud<pcl::PointXYZRGBA> cloud;
cout<<"converting "<<i<<"th keyframe ..." <<endl;
int k = keyframes[i];
Eigen::Isometry3d& pose = poses[i];
// 生成第k幀的點雲,拼接至全局octomap上
boost::format fmt ("./data/rgb_index/%d.ppm" );
cv::Mat rgb = cv::imread( (fmt % k).str().c_str() );
fmt = boost::format("./data/dep_index/%d.pgm" );
cv::Mat depth = cv::imread( (fmt % k).str().c_str(), -1 );
// 從rgb, depth生成點雲,運算方法見《一起做》第二講
// 第一次遍歷用於生成空間點雲
for ( int m=0; m<depth.rows; m++ )
for ( int n=0; n<depth.cols; n++ )
{
ushort d = depth.ptr<ushort> (m) [n];
if (d == 0)
continue;
float z = float(d) / camera_scale;
float x = (n - camera_cx) * z / camera_fx;
float y = (m - camera_cy) * z / camera_fy;
pcl::PointXYZRGBA p;
p.x = x; p.y = y; p.z = z;
uchar* rgbdata = &rgb.ptr<uchar>(m)[n*3];
uchar b = rgbdata[0];
uchar g = rgbdata[1];
uchar r = rgbdata[2];
p.r = r; p.g = g; p.b = b;
cloud.points.push_back( p );
}
// 將cloud旋轉之後插入全局地圖
pcl::PointCloud<pcl::PointXYZRGBA>::Ptr temp( new pcl::PointCloud<pcl::PointXYZRGBA>() );
pcl::transformPointCloud( cloud, *temp, pose.matrix() );
octomap::Pointcloud cloud_octo;
for (auto p:temp->points)
cloud_octo.push_back( p.x, p.y, p.z );
tree.insertPointCloud( cloud_octo,
octomap::point3d( pose(0,3), pose(1,3), pose(2,3) ) );
for (auto p:temp->points)
tree.integrateNodeColor( p.x, p.y, p.z, p.r, p.g, p.b );
}
tree.updateInnerOccupancy();
tree.write( "./data/map.ot" );
cout<<"done."<<endl;
return 0;
}
大部分需要解釋的地方,我都在程序裏寫了註解。我用了一種稍微有些迂迴的方式:先把圖像轉成pcl的點雲,變換後再放到octotree中。這種做法的原因是比較便於處理顏色,因爲我希望做出帶有顏色的地圖。如果你不關心顏色,完全可以不用pcl,直接用octomap自帶的octomap::pointcloud來完成這件事。
insertPointCloud會比單純的插入點更好一些。octomap裏的pointcloud是一種射線的形式,只有末端才存在被佔據的點,中途的點則是沒被佔據的。這會使一些重疊地方處理的更好。
最後,五幀數據拼接出來的點雲大概長這樣:
可能並不是特別完整,畢竟我們只用了五張圖。這些數據來自於nyud數據集的dining_room序列,一個比較完整的圖應該是這樣的:
至少是比純粹點雲好些了吧?好了,關於例程就介紹到這裏。如果你準備使用octomap,這僅僅是個入門。你需要去查看它的文檔,瞭解它的類結構,以及一些重要類的使用、實現方式。
《SLAM拾萃》第一講,octomap,就爲大家介紹到這裏啦。最近我發現自己寫東西,講東西都越來越長,所以請原諒我越來越囉嗦的寫作和說話風格。希望它能幫助你!我們下講再見!