在上一章节中,我们知道,对于每个稳定检测的关键点,我们赋予其三个信息:座标位置、尺度(哪一组哪一层)以及主方向(统计邻域像素点的梯度方向和大小计算直方图而来)。接下来,我们需要为每个关键点建立一个128维度的描述符。
6.1采样区域
关键点的描述符是通过统计其邻域采样点的梯度方向和大小而来的,所以首先需要确定采样区域的范围。
首先邻域采样点的梯度计算是在关键点对应的高斯图像上进行的(根据关键点的尺度信息确定高斯过滤参数),然后,将关键点邻域划分为
每个子区域的为边长同样是
6.2采样点子区域标号计算
每个采样点
确定好采样区域之后,每个采样点
接下来,我们需要确定采样点在新座标系下应当被分配到哪个子区域中(
6.3采样点插值生成种子点向量
Lowe建议,每个采样点梯度采用大小为
其中,
另外,每个采样点的梯度方向相对于关键点主方向进行旋转,即采样点的梯度方向减掉关键点主方向的值作为采样点的梯度方向进行后续计算。
经过上面的步骤,我们知道了每个采样点的梯度大小和方向,以及在新座标下所分配的子区域标号,但注意的是,每个采样点的子区域标号往往不是整数的,也就说是采样点对周围邻近的几个子区域都有一定的贡献。所以,接下来,我们采用插值的方法计算每个采样点对邻近子区域,邻近bin方向的贡献程度。
插值思想如下,红色点表示的是采样点,
如果关键点周围统计子区域大小
6.4归一化、设置阈值
经过上面的介绍,我们已经为每个关键点分配了一个128维度的描述符向量,为了增强鲁棒性,去除光照等的影响,需要归一化处理。另外,可能由于相机饱和度变化造成某些方向梯度值过大,可以通过设置阈值,截断较大的梯度值(Lowe中取阈值为0.2)。
至此,我们已经了解了如何针对一幅图像,生成旋转、尺度等不变性的特征描述符。
6.5C++源代码
/*
* 生成关键点描述符。
* img:高斯图像(按照keypoint的scale高斯滤波的图像)
* ptf:keypoints座标
* ori:keypoint的主方向
* d/n:keypoints邻域子区域边长为4,每个区域内取8个直方图bins
*/
static void calcSIFTDescriptor( const Mat& img, Point2f ptf, float ori, float scl,
int d, int n, float* dst )
{
Point pt(cvRound(ptf.x), cvRound(ptf.y));
//转换为弧度值
float cos_t = cosf(ori*(float)(CV_PI/180));
float sin_t = sinf(ori*(float)(CV_PI/180));
float bins_per_rad = n / 360.f;
float exp_scale = -1.f/(d * d * 0.5f);
float hist_width = SIFT_DESCR_SCL_FCTR * scl;//3*\sgima_oct
//采样半径为:3*\sigma_oct*\sqrt(2)*(d+1)
int radius = cvRound(hist_width * 1.4142135623730951f * (d + 1) * 0.5f);
cos_t /= hist_width;
sin_t /= hist_width;
int i, j, k, len = (radius*2+1)*(radius*2+1), histlen = (d+2)*(d+2)*(n+2);
int rows = img.rows, cols = img.cols;
AutoBuffer<float> buf(len*6 + histlen);
float *X = buf, *Y = X + len, *Mag = Y, *Ori = Mag + len, *W = Ori + len;
float *RBin = W + len, *CBin = RBin + len, *hist = CBin + len;
for( i = 0; i < d+2; i++ )
{
for( j = 0; j < d+2; j++ )
for( k = 0; k < n+2; k++ )
hist[(i*(d+2) + j)*(n+2) + k] = 0.;
}
//依次遍历每个采样点
for( i = -radius, k = 0; i <= radius; i++ )
for( j = -radius; j <= radius; j++ )
{
// Calculate sample's histogram array coords rotated relative to ori.
// Subtract 0.5 so samples that fall e.g. in the center of row 1 (i.e.
// r_rot = 1.5) have full weight placed in row 1 after interpolation.
// 旋转采样点与keypoint的主方向对齐后的位置
float c_rot = j * cos_t - i * sin_t;
float r_rot = j * sin_t + i * cos_t;
float rbin = r_rot + d/2 - 0.5f;
float cbin = c_rot + d/2 - 0.5f;
//采样点在高斯图像中的座标
int r = pt.y + i, c = pt.x + j;
if( rbin > -1 && rbin < d && cbin > -1 && cbin < d &&
r > 0 && r < rows - 1 && c > 0 && c < cols - 1 )
{
//计算采样点梯度
float dx = (float)(img.at<sift_wt>(r, c+1) - img.at<sift_wt>(r, c-1));
float dy = (float)(img.at<sift_wt>(r-1, c) - img.at<sift_wt>(r+1, c));
X[k] = dx; Y[k] = dy; RBin[k] = rbin; CBin[k] = cbin;
W[k] = (c_rot * c_rot + r_rot * r_rot)*exp_scale;//权重
k++;
}
}
//计算每个像素点的梯度方向、大小和权重
len = k;
fastAtan2(Y, X, Ori, len, true);
magnitude(X, Y, Mag, len);
exp(W, W, len);
for( k = 0; k < len; k++ )
{
float rbin = RBin[k], cbin = CBin[k];
float obin = (Ori[k] - ori)*bins_per_rad;//梯度方向为像素点的方向-关键点主方向(保持旋转不变性)
float mag = Mag[k]*W[k];
//计算采样点距离周围子区域及相邻bin的距离
int r0 = cvFloor( rbin );
int c0 = cvFloor( cbin );
int o0 = cvFloor( obin );
rbin -= r0;
cbin -= c0;
obin -= o0;
if( o0 < 0 )
o0 += n;
if( o0 >= n )
o0 -= n;
// histogram update using tri-linear interpolation(x/y/orientation)
float v_r1 = mag*rbin, v_r0 = mag - v_r1;
float v_rc11 = v_r1*cbin, v_rc10 = v_r1 - v_rc11;
float v_rc01 = v_r0*cbin, v_rc00 = v_r0 - v_rc01;
float v_rco111 = v_rc11*obin, v_rco110 = v_rc11 - v_rco111;
float v_rco101 = v_rc10*obin, v_rco100 = v_rc10 - v_rco101;
float v_rco011 = v_rc01*obin, v_rco010 = v_rc01 - v_rco011;
float v_rco001 = v_rc00*obin, v_rco000 = v_rc00 - v_rco001;
int idx = ((r0+1)*(d+2) + c0+1)*(n+2) + o0;
hist[idx] += v_rco000;
hist[idx+1] += v_rco001;
hist[idx+(n+2)] += v_rco010;
hist[idx+(n+3)] += v_rco011;
hist[idx+(d+2)*(n+2)] += v_rco100;
hist[idx+(d+2)*(n+2)+1] += v_rco101;
hist[idx+(d+3)*(n+2)] += v_rco110;
hist[idx+(d+3)*(n+2)+1] += v_rco111;
}
......