.. _back_projection: 反向投影 **************** 目标 ==== 本文档尝试解答如下问题: .. container:: enumeratevisibleitemswithsquare * 什么是反向投影,它可以实现什么功能? * 如何使用OpenCV函数 :calc_back_project:`calcBackProject <>` 计算反向投影? * 如何使用OpenCV函数 :mix_channels:`mixChannels <>` 组合图像的不同通道? 原理 ====== 什么是反向投影? --------------------------- .. container:: enumeratevisibleitemswithsquare * 反向投影是一种记录给定图像中的像素点如何适应直方图模型像素分布的方式。 * 简单的讲, 所谓反向投影就是首先计算某一特征的直方图模型,然后使用模型去寻找图像中存在的该特征。 * 例如, 你有一个肤色直方图 ( Hue-Saturation 直方图 ),你可以用它来寻找图像中的肤色区域: 反向投影的工作原理? ---------------------- .. container:: enumeratevisibleitemswithsquare * 我们使用肤色直方图为例来解释反向投影的工作原理: * 假设你已经通过下图得到一个肤色直方图(Hue-Saturation), 旁边的直方图就是 *模型直方图* ( 代表手掌的皮肤色调).你可以通过掩码操作来抓取手掌所在区域的直方图: ====== ====== |T0| |T1| ====== ====== .. |T0| image:: images/Back_Projection_Theory0.jpg :align: middle .. |T1| image:: images/Back_Projection_Theory1.jpg :align: middle * 下图是另一张手掌图(测试图像) 以及对应的整张图像的直方图: ====== ====== |T2| |T3| ====== ====== .. |T2| image:: images/Back_Projection_Theory2.jpg :align: middle .. |T3| image:: images/Back_Projection_Theory3.jpg :align: middle * 我们要做的就是使用 *模型直方图* (代表手掌的皮肤色调) 来检测测试图像中的皮肤区域。以下是检测的步骤 a. 对测试图像中的每个像素 ( :math:`p(i,j)` ),获取色调数据并找到该色调( :math:`( h_{i,j}, s_{i,j} )` )在直方图中的bin的位置。 b. 查询 *模型直方图* 中对应的bin - :math:`( h_{i,j}, s_{i,j} )` - 并读取该bin的数值。 c. 将此数值储存在新的图像中(*BackProjection*)。 你也可以先归一化 *模型直方图* ,这样测试图像的输出就可以在屏幕显示了。 d. 通过对测试图像中的每个像素采用以上步骤, 我们得到了下面的 BackProjection 结果图: .. image:: images/Back_Projection_Theory4.jpg :align: center e. 使用统计学的语言, *BackProjection* 中储存的数值代表了测试图像中该像素属于皮肤区域的 *概率* 。比如以上图为例, 亮起的区域是皮肤区域的概率更大(事实确实如此),而更暗的区域则表示更低的概率(注意手掌内部和边缘的阴影影响了检测的精度)。 源码 ==== .. container:: enumeratevisibleitemswithsquare * **本程序做什么?** .. container:: enumeratevisibleitemswithsquare * 装载图像 * 转换原图像到 HSV 格式,再分离出 *Hue* 通道来建立直方图 (使用 OpenCV 函数 :mix_channels:`mixChannels <>`) * 让用户输入建立直方图所需的bin的数目。 * 计算同一图像的直方图 (如果bin的数目改变则更新直方图) 和反向投影图。 * 显示反向投影图和直方图。 * **下载源码**: a. 点击 `这里 `_ 获取简单版的源码 (本教程使用简单版)。 b. 要尝试更炫的代码 (使用 H-S 直方图和 floodFill 来定义皮肤区域的掩码)你可以点击 `增强版演示 `_ c. 当然你也可以从实例库里下载经典的 `camshiftdemo `_ 示例。 * **代码一瞥:** .. code-block:: cpp #include "opencv2/imgproc/imgproc.hpp" #include "opencv2/highgui/highgui.hpp" #include using namespace cv; using namespace std; /// 全局变量 Mat src; Mat hsv; Mat hue; int bins = 25; /// 函数申明 void Hist_and_Backproj(int, void* ); /** @函数 main */ int main( int argc, char** argv ) { /// 读取图像 src = imread( argv[1], 1 ); /// 转换到 HSV 空间 cvtColor( src, hsv, CV_BGR2HSV ); /// 分离 Hue 通道 hue.create( hsv.size(), hsv.depth() ); int ch[] = { 0, 0 }; mixChannels( &hsv, 1, &hue, 1, ch, 1 ); /// 创建 Trackbar 来输入bin的数目 char* window_image = "Source image"; namedWindow( window_image, CV_WINDOW_AUTOSIZE ); createTrackbar("* Hue bins: ", window_image, &bins, 180, Hist_and_Backproj ); Hist_and_Backproj(0, 0); /// 现实图像 imshow( window_image, src ); /// 等待用户反应 waitKey(0); return 0; } /** * @函数 Hist_and_Backproj * @简介:Trackbar事件的回调函数 */ void Hist_and_Backproj(int, void* ) { MatND hist; int histSize = MAX( bins, 2 ); float hue_range[] = { 0, 180 }; const float* ranges = { hue_range }; /// 计算直方图并归一化 calcHist( &hue, 1, 0, Mat(), hist, 1, &histSize, &ranges, true, false ); normalize( hist, hist, 0, 255, NORM_MINMAX, -1, Mat() ); /// 计算反向投影 MatND backproj; calcBackProject( &hue, 1, 0, hist, backproj, &ranges, 1, true ); /// 显示反向投影 imshow( "BackProj", backproj ); /// 显示直方图 int w = 400; int h = 400; int bin_w = cvRound( (double) w / histSize ); Mat histImg = Mat::zeros( w, h, CV_8UC3 ); for( int i = 0; i < bins; i ++ ) { rectangle( histImg, Point( i*bin_w, h ), Point( (i+1)*bin_w, h - cvRound( hist.at(i)*h/255.0 ) ), Scalar( 0, 0, 255 ), -1 ); } imshow( "Histogram", histImg ); } 解释 =========== #. 申明图像矩阵,初始化bin数目: .. code-block:: cpp Mat src; Mat hsv; Mat hue; int bins = 25; #. 读取输入图像并转换到HSV 格式: .. code-block:: cpp src = imread( argv[1], 1 ); cvtColor( src, hsv, CV_BGR2HSV ); #. 本教程仅仅使用Hue通道来创建1维直方图 (你可以从上面的链接下载增强版本,增强版本使用了更常见的H-S直方图,以获取更好的结果): .. code-block:: cpp hue.create( hsv.size(), hsv.depth() ); int ch[] = { 0, 0 }; mixChannels( &hsv, 1, &hue, 1, ch, 1 ); 你可以看到这里我们使用 :mix_channels:`mixChannels<>` 来抽取 HSV图像的0通道(Hue)。 该函数接受了以下的实参: .. container:: enumeratevisibleitemswithsquare + **&hsv:** 一系列输入图像的数组, 被拷贝的通道的来源 + **1:** 输入数组中图像的数目 + **&hue:** 一系列目的图像的数组, 储存拷贝的通道 + **1:** 目的数组中图像的数目 + **ch[] = {0,0}:** 通道索引对的数组,指示如何将输入图像的某一通道拷贝到目的图像的某一通道。在这里,&hsv图像的Hue(0) 通道被拷贝到&hue图像(单通道)的0 通道。 + **1:** 通道索引对德数目 #. 创建Trackbar方便用户输入bin数目。 Trackbar的任何变动将会调用函数 **Hist_and_Backproj** 。 .. code-block:: cpp char* window_image = "Source image"; namedWindow( window_image, CV_WINDOW_AUTOSIZE ); createTrackbar("* Hue bins: ", window_image, &bins, 180, Hist_and_Backproj ); Hist_and_Backproj(0, 0); #. 显示并等待用户突出程序: .. code-block:: cpp imshow( window_image, src ); waitKey(0); return 0; #. **Hist_and_Backproj 函数:** 初始化函数 :calc_hist:`calcHist <>` 需要的实参, bin数目来自于 Trackbar: .. code-block:: cpp void Hist_and_Backproj(int, void* ) { MatND hist; int histSize = MAX( bins, 2 ); float hue_range[] = { 0, 180 }; const float* ranges = { hue_range }; #. 计算直方图并归一化到范围 :math:`[0,255]` .. code-block:: cpp calcHist( &hue, 1, 0, Mat(), hist, 1, &histSize, &ranges, true, false ); normalize( hist, hist, 0, 255, NORM_MINMAX, -1, Mat() ); #. 调用函数 :calc_back_project:`calcBackProject <>` 计算同一张图像的反向投影 .. code-block:: cpp MatND backproj; calcBackProject( &hue, 1, 0, hist, backproj, &ranges, 1, true ); 所有的实参都已经知道了(与计算直方图的实参一样), 仅仅增加了 backproj 矩阵,用来储存原图像(&hue)的反向投影。 #. 显示 backproj: .. code-block:: cpp imshow( "BackProj", backproj ); #. 显示1维 Hue 直方图: .. code-block:: cpp int w = 400; int h = 400; int bin_w = cvRound( (double) w / histSize ); Mat histImg = Mat::zeros( w, h, CV_8UC3 ); for( int i = 0; i < bins; i ++ ) { rectangle( histImg, Point( i*bin_w, h ), Point( (i+1)*bin_w, h - cvRound( hist.at(i)*h/255.0 ) ), Scalar( 0, 0, 255 ), -1 ); } imshow( "Histogram", histImg ); 结果 ======= #. 下面是对一张样本图像(猜猜是什么?又是一掌)进行的测试结果。 你可以改变bin的数目来观察它是如何影响结果图像的: ====== ====== ====== |R0| |R1| |R2| ====== ====== ====== .. |R0| image:: images/Back_Projection1_Source_Image.jpg :align: middle .. |R1| image:: images/Back_Projection1_Histogram.jpg :align: middle .. |R2| image:: images/Back_Projection1_BackProj.jpg :align: middle 翻译者 ================= niesu@ `OpenCV中文网站 `_