.. _Basic_Threshold: 基本的阈值操作 ******************************* 目标: ========== 本节简介: .. container:: enumeratevisibleitemswithsquare * OpenCV中的阈值(threshold)函数: :threshold:`threshold <>` 的运用。 基本理论: ============ 注意: 本节的解释出自Bradski与Kaehler的书籍 **Learning OpenCV** 。 什么是阈值? ----------------------- * 最简单的图像分割的方法。 * 应用举例:从一副图像中利用阈值分割出我们需要的物体部分(当然这里的物体可以是一部分或者整体)。这样的图像分割方法是基于图像中物体与背景之间的灰度差异,而且此分割属于像素级的分割。 * 为了从一副图像中提取出我们需要的部分,应该用图像中的每一个像素点的灰度值与选取的阈值进行比较,并作出相应的判断。(注意:阈值的选取依赖于具体的问题。即:物体在不同的图像中有可能会有不同的灰度值。 * 一旦找到了需要分割的物体的像素点,我们可以对这些像素点设定一些特定的值来表示。(例如:可以将该物体的像素点的灰度值设定为:‘0’(黑色),其他的像素点的灰度值为:'255'(白色);当然像素点的灰度值可以任意,但最好设定的两种颜色对比度较强,方便观察结果)。 .. image:: images/Threshold_Tutorial_Theory_Example.jpg :alt: Threshold simple example :align: center 阈值化的类型: ----------------------- * OpenCV中提供了阈值(threshold)函数: :threshold:`threshold <>` 。 * 这个函数有5种阈值化类型,在接下来的章节中将会具体介绍。 * 为了解释阈值分割的过程,我们来看一个简单有关像素灰度的图片,该图如下。该图中的蓝色水平线代表着具体的一个阈值。 .. image:: images/Threshold_Tutorial_Theory_Base_Figure.png :alt: Threshold Binary :align: center 阈值类型1:二进制阈值化 ^^^^^^^^^^^^^^^^^^^^^^^^^^^ * 该阈值化类型如下式所示: .. math:: \texttt{dst} (x,y) = \fork{\texttt{maxVal}}{if $\texttt{src}(x,y) > \texttt{thresh}$}{0}{otherwise} * 解释:在运用该阈值类型的时候,先要选定一个特定的阈值量,比如:125,这样,新的阈值产生规则可以解释为大于125的像素点的灰度值设定为最大值(如8位灰度值最大为255),灰度值小于125的像素点的灰度值设定为0。 .. image:: images/Threshold_Tutorial_Theory_Binary.png :alt: Threshold Binary :align: center 阈值类型2:反二进制阈值化 ^^^^^^^^^^^^^^^^^^^^^^^^^^^ * 该阈值类型如下式所示: .. math:: \texttt{dst} (x,y) = \fork{0}{if $\texttt{src}(x,y) > \texttt{thresh}$}{\texttt{maxVal}}{otherwise} * 解释:该阈值化与二进制阈值化相似,先选定一个特定的灰度值作为阈值,不过最后的设定值相反。(在8位灰度图中,例如大于阈值的设定为0,而小于该阈值的设定为255)。 .. image:: images/Threshold_Tutorial_Theory_Binary_Inverted.png :alt: Threshold Binary Inverted :align: center 阈值类型3:截断阈值化 ^^^^^^^^^^^^^^^^^^^^^^^^^^^ * 该阈值化类型如下式所示: .. math:: \texttt{dst} (x,y) = \fork{\texttt{threshold}}{if $\texttt{src}(x,y) > \texttt{thresh}$}{\texttt{src}(x,y)}{otherwise} * 解释:同样首先需要选定一个阈值,图像中大于该阈值的像素点被设定为该阈值,小于该阈值的保持不变。(例如:阈值选取为125,那小于125的阈值不改变,大于125的灰度值(230)的像素点就设定为该阈值)。 .. image:: images/Threshold_Tutorial_Theory_Truncate.png :alt: Threshold Truncate :align: center 阈值类型4:阈值化为0 ^^^^^^^^^^^^^^^^^^^^^^^^ * 该阈值类型如下式所示: .. math:: \texttt{dst} (x,y) = \fork{\texttt{src}(x,y)}{if $\texttt{src}(x,y) > \texttt{thresh}$}{0}{otherwise} * 解释:先选定一个阈值,然后对图像做如下处理:1 像素点的灰度值大于该阈值的不进行任何改变;2 像素点的灰度值小于该阈值的,其灰度值全部变为0。 .. image:: images/Threshold_Tutorial_Theory_Zero.png :alt: Threshold Zero :align: center 阈值类型5:反阈值化为0 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^ * 该阈值类型如下式所示: .. math:: \texttt{dst} (x,y) = \fork{0}{if $\texttt{src}(x,y) > \texttt{thresh}$}{\texttt{src}(x,y)}{otherwise} * 解释:原理类似于0阈值,但是在对图像做处理的时候相反,即:像素点的灰度值小于该阈值的不进行任何改变,而大于该阈值的部分,其灰度值全部变为0。 .. image:: images/Threshold_Tutorial_Theory_Zero_Inverted.png :alt: Threshold Zero Inverted :align: center 代码示范: ============ 简单的代码如下。同样也可以在网站中 `下载 `_ 以下代码。 .. code-block:: cpp #include "opencv2/imgproc/imgproc.hpp" #include "opencv2/highgui/highgui.hpp" #include #include using namespace cv; /// 全局变量定义及赋值 int threshold_value = 0; int threshold_type = 3;; int const max_value = 255; int const max_type = 4; int const max_BINARY_value = 255; Mat src, src_gray, dst; char* window_name = "Threshold Demo"; char* trackbar_type = "Type: \n 0: Binary \n 1: Binary Inverted \n 2: Truncate \n 3: To Zero \n 4: To Zero Inverted"; char* trackbar_value = "Value"; /// 自定义函数声明 void Threshold_Demo( int, void* ); /** * @主函数 */ int main( int argc, char** argv ) { /// 读取一副图片,不改变图片本身的颜色类型(该读取方式为DOS运行模式) src = imread( argv[1], 1 ); /// 将图片转换成灰度图片 cvtColor( src, src_gray, CV_RGB2GRAY ); /// 创建一个窗口显示图片 namedWindow( window_name, CV_WINDOW_AUTOSIZE ); /// 创建滑动条来控制阈值 createTrackbar( trackbar_type, window_name, &threshold_type, max_type, Threshold_Demo ); createTrackbar( trackbar_value, window_name, &threshold_value, max_value, Threshold_Demo ); /// 初始化自定义的阈值函数 Threshold_Demo( 0, 0 ); /// 等待用户按键。如果是ESC健则退出等待过程。 while(true) { int c; c = waitKey( 20 ); if( (char)c == 27 ) { break; } } } /** * @自定义的阈值函数 */ void Threshold_Demo( int, void* ) { /* 0: 二进制阈值 1: 反二进制阈值 2: 截断阈值 3: 0阈值 4: 反0阈值 */ threshold( src_gray, dst, threshold_value, max_BINARY_value,threshold_type ); imshow( window_name, dst ); } 解释: ============= #. 先看一下整个程序的结构: * 先读取一副图片,如果是图片颜色类型是RGB3色类型,则转换成灰度类型的图像。转换颜色类型可以运用OpenCV中的 cvtColor<> 函数。 .. code-block:: cpp src = imread( argv[1], 1 ); /// 颜色类型从RGB 转换成灰度 cvtColor( src, src_gray, CV_RGB2GRAY ); * 然后创建一个窗口来显示该图片可以检验转换结果 .. code-block:: cpp namedWindow( window_name, CV_WINDOW_AUTOSIZE ); * 接着该程序创建两个滚动条来等待用户的输入: * 第一个滚动条作用:选择阈值类型:二进制,反二进制,截断,0,反0。 * 第二个滚动条作用:选择阈值的大小。 .. code-block:: cpp createTrackbar( trackbar_type, window_name, &threshold_type, max_type, Threshold_Demo ); createTrackbar( trackbar_value, window_name, &threshold_value, max_value, Threshold_Demo ); * 在这里等到用户拖动滚动条来输入阈值类型以及阈值的大小,或者是用户键入ESC健退出程序。 * 无论何时拖动滚动条,用户自定义的阈值函数都将会被调用。 .. code-block:: cpp /** * @自定义的阈值函数 */ void Threshold_Demo( int, void* ) { /* 0: 二进制阈值 1: 反二进制阈值 2: 截断阈值 3: 0阈值 4: 反0阈值 */ threshold( src_gray, dst, threshold_value, max_BINARY_value,threshold_type ); imshow( window_name, dst ); } 就像你看到的那样,在这样的过程中,函数 threshold<> 会接受到5个参数: * *src_gray*: 输入的灰度图像的地址。 * *dst*: 输出图像的地址。 * *threshold_value*: 进行阈值操作时阈值的大小。 * *max_BINARY_value*: 设定的最大灰度值(该参数运用在二进制与反二进制阈值操作中)。 * *threshold_type*: 阈值的类型。从上面提到的5种中选择出的结果。 结果: ======== #. 程序编译过后,从正确的路径中读取一张图片。例如,该输入图片如下所示: .. image:: images/Threshold_Tutorial_Original_Image.jpg :alt: Threshold Original Image :align: center #. 首先,阈值类型选择为反二进制阈值类型。我们希望灰度值大于阈值的变暗,即这一部分像素的灰度值设定为0。从下图中可以很清楚的看到这样的变化。(在原图中,狗的嘴和眼睛部分比图像中的其他部分要亮,在结果图中可以看到由于反二进制阈值分割,这两部分变的比其他图像的都要暗。原理具体参见本节中反二进制阈值部分解释) .. image:: images/Threshold_Tutorial_Result_Binary_Inverted.jpg :alt: Threshold Result Binary Inverted :align: center #. 现在,阈值的类型选择为0阈值。在这种情况下,我们希望那些在图像中最黑的像素点彻底的变成黑色,而其他大于阈值的像素保持原来的面貌。其结果如下图所示: .. image:: images/Threshold_Tutorial_Result_Zero.jpg :alt: Threshold Result Zero :align: center 翻译者 ================= zjjconan@ `OpenCV中文网站 `_