OpenCV中文翻译教程.docx
- 文档编号:27920975
- 上传时间:2023-07-06
- 格式:DOCX
- 页数:79
- 大小:127.26KB
OpenCV中文翻译教程.docx
《OpenCV中文翻译教程.docx》由会员分享,可在线阅读,更多相关《OpenCV中文翻译教程.docx(79页珍藏版)》请在冰豆网上搜索。
OpenCV中文翻译教程
OpenCV2基础(补充材料)
OpenCV_tutorials翻译资料整理而来
翻译材料出处:
.cn/opencvdoc/
[2014/10]
一、
Mat-基本图像容器
目的
从真实世界中获取数字图像有很多方法,比如数码相机、扫描仪、CT或者磁共振成像。
无论哪种方法,我们(人类)看到的是图像,而让数字设备来“看“的时候,则是在记录图像中的每一个点的数值。
比如上面的图像,在标出的镜子区域中你见到的只是一个矩阵,该矩阵包含了所有像素点的强度值。
如何获取并存储这些像素值由我们的需求而定,最终在计算机世界里所有图像都可以简化为数值矩以及矩阵信息。
作为一个计算机视觉库,OpenCV其主要目的就是通过处理和操作这些信息,来获取更高级的信息。
因此,OpenCV如何存储并操作图像是你首先要学习的。
Mat
在2001年刚刚出现的时候,OpenCV基于C语言接口而建。
为了在内存(memory)中存放图像,当时采用名为IplImage的C语言结构体,时至今日这仍出现在大多数的旧版教程和教学材料。
但这种方法必须接受C语言所有的不足,这其中最大的不足要数手动内存管理,其依据是用户要为开辟和销毁内存负责。
虽然对于小型的程序来说手动管理内存不是问题,但一旦代码开始变得越来越庞大,你需要越来越多地纠缠于这个问题,而不是着力解决你的开发目标。
幸运的是,C++出现了,并且带来类的概念,这给用户带来另外一个选择:
自动的内存管理(不严谨地说)。
这是一个好消息,如果C++完全兼容C的话,这个变化不会带来兼容性问题。
为此,OpenCV在2.0版本中引入了一个新的C++接口,利用自动内存管理给出了解决问题的新方法。
使用这个方法,你不需要纠结在管理内存上,而且你的代码会变得简洁(少写多得)。
但C++接口唯一的不足是当前许多嵌入式开发系统只支持C语言。
所以,当目标不是这种开发平台时,没有必要使用旧方法(除非你是自找麻烦的受虐狂码农)。
关于Mat,首先要知道的是你不必再手动地
(1)为其开辟空间
(2)在不需要时立即将空间释放。
但手动地做还是可以的:
大多数OpenCV函数仍会手动地为输出数据开辟空间。
当传递一个已经存在的Mat对象时,开辟好的矩阵空间会被重用。
也就是说,我们每次都使用大小正好的内存来完成任务。
基本上讲Mat是一个类,由两个数据部分组成:
矩阵头(包含矩阵尺寸,存储方法,存储地址等信息)和一个指向存储所有像素值的矩阵(根据所选存储方法的不同矩阵可以是不同的维数)的指针。
矩阵头的尺寸是常数值,但矩阵本身的尺寸会依图像的不同而不同,通常比矩阵头的尺寸大数个数量级。
因此,当在程序中传递图像并创建拷贝时,大的开销是由矩阵造成的,而不是信息头。
OpenCV是一个图像处理库,囊括了大量的图像处理函数,为了解决问题通常要使用库中的多个函数,因此在函数中传递图像是家常便饭。
同时不要忘了我们正在讨论的是计算量很大的图像处理算法,因此,除非万不得已,我们不应该拷贝大的图像,因为这会降低程序速度。
MatA,C;//只创建信息头部分
A=imread(argv[1],CV_LOAD_IMAGE_COLOR);//这里为矩阵开辟内存
MatB(A);//使用拷贝构造函数
C=A;//赋值运算符
为了搞定这个问题,OpenCV使用引用计数机制。
其思路是让每个Mat对象有自己的信息头,但共享同一个矩阵。
这通过让矩阵指针指向同一地址而实现。
而拷贝构造函数则只拷贝信息头和矩阵指针,而不拷贝矩阵。
以上代码中的所有Mat对象最终都指向同一个也是唯一一个数据矩阵。
虽然它们的信息头不同,但通过任何一个对象所做的改变也会影响其它对象。
实际上,不同的对象只是访问相同数据的不同途径而已。
这里还要提及一个比较棒的功能:
你可以创建只引用部分数据的信息头。
比如想要创建一个感兴趣区域(ROI),你只需要创建包含边界信息的信息头:
MatD(A,Rect(10,10,100,100));//usingarectangle
MatE=A(Range:
all(),Range(1,3));//usingrowandcolumnboundaries
现在你也许会问,如果矩阵属于多个Mat对象,那么当不再需要它时谁来负责清理?
简单的回答是:
最后一个使用它的对象。
通过引用计数机制来实现。
无论什么时候有人拷贝了一个Mat对象的信息头,都会增加矩阵的引用次数;反之当一个头被释放之后,这个计数被减一;当计数值为零,矩阵会被清理。
但某些时候你仍会想拷贝矩阵本身(不只是信息头和矩阵指针),这时可以使用函数clone()或者copyTo()。
MatF=A.clone();MatG;A.copyTo(G);
在改变F或者G就不会影响Mat信息头所指向的矩阵。
总结一下,你需要记住的是
∙OpenCV函数中输出图像的内存分配是自动完成的(如果不特别指定的话)。
∙使用OpenCV的C++接口时不需要考虑内存释放问题。
∙赋值运算符和拷贝构造函数(ctor)只拷贝信息头。
∙使用函数clone()或者copyTo()来拷贝一副图像的矩阵。
存储方法
这里讲述如何存储像素值。
需要指定颜色空间和数据类型。
颜色空间是指对一个给定的颜色,如何组合颜色元素以对其编码。
最简单的颜色空间要属灰度级空间,只处理黑色和白色,对它们进行组合可以产生不同程度的灰色。
对于彩色方式则有更多种类的颜色空间,但不论哪种方式都是把颜色分成三个或者四个基元素,通过组合基元素可以产生所有的颜色。
RGB颜色空间是最常用的一种颜色空间,这归功于它也是人眼内部构成颜色的方式。
它的基色是红色、绿色和蓝色,有时为了表示透明颜色也会加入第四个元素alpha(A)。
有很多的颜色系统,各有自身优势:
∙RGB是最常见的,这是因为人眼采用相似的工作机制,它也被显示设备所采用。
∙HSV和HLS把颜色分解成色调、饱和度和亮度/明度。
这是描述颜色更自然的方式,比如可以通过抛弃最后一个元素,使算法对输入图像的光照条件不敏感。
∙YCrCb在JPEG图像格式中广泛使用。
∙CIEL*a*b*是一种在感知上均匀的颜色空间,它适合用来度量两个颜色之间的距离。
每个组成元素都有其自己的定义域,取决于其数据类型。
如何存储一个元素决定了我们在其定义域上能够控制的精度。
最小的数据类型是char,占一个字节或者8位,可以是有符号型(0到255之间)或无符号型(-127到+127之间)。
尽管使用三个char型元素已经可以表示1600万种可能的颜色(使用RGB颜色空间),但若使用float(4字节,32位)或double(8字节,64位)则能给出更加精细的颜色分辨能力。
但同时也要切记增加元素的尺寸也会增加了图像所占的内存空间。
显式地创建一个Mat对象
教程读取、修改、保存图像已经讲解了如何使用函数imwrite()将一个矩阵写入图像文件中。
但是为了debug,更加方便的方式是看实际值。
为此,你可以通过Mat的运算符<<来实现,但要记住这只对二维矩阵有效。
Mat不但是一个很赞的图像容器类,它同时也是一个通用的矩阵类,所以可以用来创建和操作多维矩阵。
创建一个Mat对象有多种方法:
Mat()构造函数
MatM(2,2,CV_8UC3,Scalar(0,0,255));
out<<"M="< 对于二维多通道图像,首先要定义其尺寸,即行数和列数。 然后,需要指定存储元素的数据类型以及每个矩阵点的通道数。 为此,依据下面的规则有多种定义 CV_[Thenumberofbitsperitem][SignedorUnsigned][TypePrefix]C[Thechannelnumber] 比如CV_8UC3表示使用8位的unsignedchar型,每个像素由三个元素组成三通道。 预先定义的通道数可以多达四个。 Scalar是个short型vector。 指定这个能够使用指定的定制化值来初始化矩阵。 当然,如果你需要更多通道数,你可以使用大写的宏并把通道数放在小括号中,如下所示 ·在C\C++中通过构造函数进行初始化 intsz[3]={2,2,2}; MatL(3,sz,CV_8UC (1),Scalar: : all(0)); 上面的例子演示了如何创建一个超过两维的矩阵: 指定维数,然后传递一个指向一个数组的指针,这个数组包含每个维度的尺寸;其余的相同 为已存在IplImage指针创建信息头: IplImage*img=cvLoadImage("greatwave.png",1);Matmtx(img);//convertIplImage*->Mat Create()function: 函数 M.create(4,4,CV_8UC (2)); cout<<"M="< 这个创建方法不能为矩阵设初值,它只是在改变尺寸时重新为矩阵数据开辟内存。 ·MATLAB形式的初始化方式: zeros(),ones(),: eyes()。 使用以下方式指定尺寸和数据类型: MatE=Mat: : eye(4,4,CV_64F); cout<<"E="< MatO=Mat: : ones(2,2,CV_32F); cout<<"O="< MatZ=Mat: : zeros(3,3,CV_8UC1); cout<<"Z="< 对于小矩阵你可以用逗号分隔的初始化函数: MatC=(Mat_ cout<<"C="< ·使用clone()或者copyTo()为一个存在的Mat对象创建一个新的信息头。 MatRowClone=C.row (1).clone(); cout<<"RowClone="< 格式化打印 Note: 调用函数randu()来对一个矩阵使用随机数填充,需要指定随机数的上界和下界: MatR=Mat(3,2,CV_8UC3); randu(R,Scalar: : all(0),Scalar: : all(255)); 从上面的例子中可以看到默认格式,除此之外,OpenCV还支持以下的输出习惯 ·默认方式 cout<<"R(default)="< ·Python cout<<"R(python)="< ·以逗号分隔的数值(CSV) cout<<"R(csv)="< ·Numpy cout<<"R(numpy)="< ·C语言 cout<<"R(c)="< 打印其它常用项目 OpenCV支持使用运算符<<来打印其它常用OpenCV数据结构。 ·2维点 Point2fP(5,1); cout<<"Point(2D)="< ·3维点 Point3fP3f(2,6,7); cout<<"Point(3D)="< ·基于cv: : Mat的std: : vector vector v.push_back((float)CV_PI);v.push_back (2);v.push_back(3.01f); cout<<"VectoroffloatsviaMat="< ·std: : vector点 vector for(size_tE=0;E vPoints[E]=Point2f((float)(E*5),(float)(E%7)); cout<<"Avectorof2DPoints="< 这里的例子大多数出现在一个短小的控制台应用程序中,你可以在here下载到,或者在c++示例部分中找到。 二、 OpenCV如何扫描图像、利用查找表和计时 目的 我们将探索以下问题的答案: ∙如何遍历图像中的每一个像素? ∙OpenCV的矩阵值是如何存储的? ∙如何测试我们所实现算法的性能? ∙查找表是什么? 为什么要用它? 测试用例 这里我们测试的,是一种简单的颜色缩减方法。 如果矩阵元素存储的是单通道像素,使用C或C++的无符号字符类型,那么像素可有256个不同值。 但若是三通道图像,这种存储格式的颜色数就太多了(确切地说,有一千六百多万种)。 用如此之多的颜色可能会对我们的算法性能造成严重影响。 其实有时候,仅用这些颜色的一小部分,就足以达到同样效果。 这种情况下,常用的一种方法是颜色空间缩减。 其做法是: 将现有颜色空间值除以某个输入值,以获得较少的颜色数。 例如,颜色值0到9可取为新值0,10到19可取为10,以此类推。 uchar(无符号字符,即0到255之间取值的数)类型的值除以int值,结果仍是char。 因为结果是char类型的,所以求出来小数也要向下取整。 利用这一点,刚才提到在uchar定义域中进行的颜色缩减运算就可以表达为下列形式: 这样的话,简单的颜色空间缩减算法就可由下面两步组成: 一、遍历图像矩阵的每一个像素;二、对像素应用上述公式。 值得注意的是,我们这里用到了除法和乘法运算,而这两种运算又特别费时,所以,我们应尽可能用代价较低的加、减、赋值等运算替换它们。 此外,还应注意到,上述运算的输入仅能在某个有限范围内取值,如uchar类型可取256个值。 由此可知,对于较大的图像,有效的方法是预先计算所有可能的值,然后需要这些值的时候,利用查找表直接赋值即可。 查找表是一维或多维数组,存储了不同输入值所对应的输出值,其优势在于只需读取、无需计算。 我们的测试用例程序(以及这里给出的示例代码)做了以下几件事: 以命令行参数形式读入图像(可以是彩色图像,也可以是灰度图像,由命令行参数决定),然后用命令行参数给出的整数进行颜色缩减。 目前,OpenCV主要有三种逐像素遍历图像的方法。 我们将分别用这三种方法扫描图像,并将它们所用时间输出到屏幕上。 我想这样的对比应该很有意思。 你可以从这里下载源代码,也可以找到OpenCV的samples目录,进入cpp的tutorial_code的core目录,查阅该程序的代码。 程序的基本用法是: how_to_scan_imagesimageName.jpgintValueToReduce[G] 最后那个参数是可选的。 如果提供该参数,则图像以灰度格式载入,否则使用彩色格式。 在该程序中,我们首先要计算查找表。 intdivideWith;//convertourinputstringtonumber-C++style stringstreams; s< s>>divideWith; if(! s) { cout<<"Invalidnumberenteredfordividing."< return-1; } uchartable[256]; for(inti=0;i<256;++i) table[i]=divideWith*(i/divideWith); 这里我们先使用C++的stringstream类,把第三个命令行参数由字符串转换为整数。 然后,我们用数组和前面给出的公式计算查找表。 这里并未涉及有关OpenCV的内容。 另外有个问题是如何计时。 没错,OpenCV提供了两个简便的可用于计时的函数getTickCount()和getTickFrequency()。 第一个函数返回你的CPU自某个事件(如启动电脑)以来走过的时钟周期数,第二个函数返回你的CPU一秒钟所走的时钟周期数。 这样,我们就能轻松地以秒为单位对某运算计时: doublet=(double)getTickCount();//做点什么... t=((double)getTickCount()-t)/getTickFrequency();cout<<"Timespassedinseconds: "< 图像矩阵是如何存储在内存之中的? 在我的教程Mat-基本图像容器中,你或许已了解到,图像矩阵的大小取决于我们所用的颜色模型,确切地说,取决于所用通道数。 如果是灰度图像,矩阵就会像这样: 而对多通道图像来说,矩阵中的列会包含多个子列,其子列个数与通道数相等。 例如,RGB颜色模型的矩阵: 注意到,子列的通道顺序是反过来的: BGR而不是RGB。 很多情况下,因为内存足够大,可实现连续存储,因此,图像中的各行就能一行一行地连接起来,形成一个长行。 连续存储有助于提升图像扫描速度,我们可以使用isContinuous()来去判断矩阵是否是连续存储的.相关示例会在接下来的内容中提供。 1.高效的方法EfficientWay 说到性能,经典的C风格运算符[](指针)访问要更胜一筹.因此,我们推荐的效率最高的查找表赋值方法,还是下面的这种: Mat&ScanImageAndReduceC(Mat&I,constuchar*consttable){ //acceptonlychartypematrices CV_Assert(I.depth()! =sizeof(uchar)); intchannels=I.channels(); intnRows=I.rows*channels; intnCols=I.cols; if(I.isContinuous()) { nCols*=nRows; nRows=1; } inti,j; uchar*p; for(i=0;i { p=I.ptr for(j=0;j { p[j]=table[p[j]]; } } returnI;} 这里,我们获取了每一行开始处的指针,然后遍历至该行末尾。 如果矩阵是以连续方式存储的,我们只需请求一次指针、然后一路遍历下去就行。 彩色图像的情况有必要加以注意: 因为三个通道的原因,我们需要遍历的元素数目也是3倍。 这里有另外一种方法来实现遍历功能,就是使用data,data会从Mat中返回指向矩阵第一行第一列的指针。 注意如果该指针为NULL则表明对象里面无输入,所以这是一种简单的检查图像是否被成功读入的方法。 当矩阵是连续存储时,我们就可以通过遍历data来扫描整个图像。 例如,一个灰度图像,其操作如下: uchar*p=I.data; for(unsignedinti=0;i *p++=table[*p]; 这回得出和前面相同的结果。 但是这种方法编写的代码可读性方面差,并且进一步操作困难。 同时,我发现在实际应用中,该方法的性能表现上并不明显优于前一种(因为现在大多数编译器都会对这类操作做出优化)。 2.迭代法Theiterator(safe)method 在高性能法(theefficientway)中,我们可以通过遍历正确的uchar域并跳过行与行之间可能的空缺-你必须自己来确认是否有空缺,来实现图像扫描,迭代法则被认为是一种以更安全的方式来实现这一功能。 在迭代法中,你所需要做的仅仅是获得图像矩阵的begin和end,然后增加迭代直至从begin到end。 将*操作符添加在迭代指针前,即可访问当前指向的内容。 Mat&ScanImageAndReduceIterator(Mat&I,constuchar*consttable){ //acceptonlychartypematrices CV_Assert(I.depth()! =sizeof(uchar)); constintchannels=I.channels(); switch(channels) { case1: { MatIterator_ for(it=I.begin =end;++it) *it=table[*it]; break; } case3: { MatIterator_ for(it=I.begin =end;++it) { (*it)[0]=table[(*it)[0]]; (*it)[1]=table[(*it)[1]]; (*it)[2]=table[(*it)[2]]; } } } returnI;} 对于彩色图像中的一行,每列中有3个uchar元素,这可以被认为是一个小的包含uchar元素的vector,在OpenCV中用Vec3b来命名。 如果要访问第n个子列,我们只需要简单的利用[]来操作就可以。 需要指出的是,OpenCV的迭代在扫描过一行中所有列后会自动跳至下一行,所以说如果在彩色图像中如果只使用一个简单的uchar而不是Vec3b迭代的话就只能获得蓝色通道(B)里的值。 3.通过相关返回值的On-the-fly地址计算 事实上这个方法并不推荐被用来进行图像扫描,它本来是被用于获取或更改图像中的随机元素。 它的基本用途是要确定你试图访问的元素的所在行数与列数。 在前面的扫描方法中,我们观察到知道所查询的图像数据类型是很重要的。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- OpenCV 中文翻译 教程
![提示](https://static.bdocx.com/images/bang_tan.gif)