书签分享收藏举报版权申诉 / 79

立即下载加入VIP,免费下载

当前位置：首页 > PPT模板 > 商务科技 > OpenCV中文翻译教程.docx

OpenCV中文翻译教程.docx

文档编号：27920975
上传时间：2023-07-06
格式：DOCX
页数：79
大小：127.26KB

OpenCV中文翻译教程.docx

《OpenCV中文翻译教程.docx》由会员分享，可在线阅读，更多相关《OpenCV中文翻译教程.docx（79页珍藏版）》请在冰豆网上搜索。

OpenCV中文翻译教程.docx

OpenCV中文翻译教程

OpenCV2基础（补充材料）

OpenCV_tutorials翻译资料整理而来

翻译材料出处:

.cn/opencvdoc/

[2014/10]

一、

Mat-基本图像容器

目的

从真实世界中获取数字图像有很多方法，比如数码相机、扫描仪、CT或者磁共振成像。

无论哪种方法，我们（人类）看到的是图像，而让数字设备来“看“的时候，则是在记录图像中的每一个点的数值。

比如上面的图像，在标出的镜子区域中你见到的只是一个矩阵，该矩阵包含了所有像素点的强度值。

如何获取并存储这些像素值由我们的需求而定，最终在计算机世界里所有图像都可以简化为数值矩以及矩阵信息。

作为一个计算机视觉库，OpenCV其主要目的就是通过处理和操作这些信息，来获取更高级的信息。

因此，OpenCV如何存储并操作图像是你首先要学习的。

Mat

在2001年刚刚出现的时候，OpenCV基于C语言接口而建。

为了在内存（memory）中存放图像，当时采用名为IplImage的C语言结构体，时至今日这仍出现在大多数的旧版教程和教学材料。

但这种方法必须接受C语言所有的不足，这其中最大的不足要数手动内存管理，其依据是用户要为开辟和销毁内存负责。

虽然对于小型的程序来说手动管理内存不是问题，但一旦代码开始变得越来越庞大，你需要越来越多地纠缠于这个问题，而不是着力解决你的开发目标。

幸运的是，C++出现了，并且带来类的概念，这给用户带来另外一个选择：

自动的内存管理（不严谨地说）。

这是一个好消息，如果C++完全兼容C的话，这个变化不会带来兼容性问题。

为此，OpenCV在2.0版本中引入了一个新的C++接口，利用自动内存管理给出了解决问题的新方法。

使用这个方法，你不需要纠结在管理内存上，而且你的代码会变得简洁（少写多得）。

但C++接口唯一的不足是当前许多嵌入式开发系统只支持C语言。

所以，当目标不是这种开发平台时，没有必要使用旧方法（除非你是自找麻烦的受虐狂码农）。

关于Mat，首先要知道的是你不必再手动地

（1）为其开辟空间

（2）在不需要时立即将空间释放。

但手动地做还是可以的：

大多数OpenCV函数仍会手动地为输出数据开辟空间。

当传递一个已经存在的Mat对象时，开辟好的矩阵空间会被重用。

也就是说，我们每次都使用大小正好的内存来完成任务。

基本上讲Mat是一个类，由两个数据部分组成：

矩阵头（包含矩阵尺寸，存储方法，存储地址等信息）和一个指向存储所有像素值的矩阵（根据所选存储方法的不同矩阵可以是不同的维数）的指针。

矩阵头的尺寸是常数值，但矩阵本身的尺寸会依图像的不同而不同，通常比矩阵头的尺寸大数个数量级。

因此，当在程序中传递图像并创建拷贝时，大的开销是由矩阵造成的，而不是信息头。

OpenCV是一个图像处理库，囊括了大量的图像处理函数，为了解决问题通常要使用库中的多个函数，因此在函数中传递图像是家常便饭。

同时不要忘了我们正在讨论的是计算量很大的图像处理算法，因此，除非万不得已，我们不应该拷贝大的图像，因为这会降低程序速度。

MatA,C;//只创建信息头部分

A=imread（argv[1],CV_LOAD_IMAGE_COLOR）;//这里为矩阵开辟内存

MatB（A）;//使用拷贝构造函数

C=A;//赋值运算符

为了搞定这个问题，OpenCV使用引用计数机制。

其思路是让每个Mat对象有自己的信息头，但共享同一个矩阵。

这通过让矩阵指针指向同一地址而实现。

而拷贝构造函数则只拷贝信息头和矩阵指针，而不拷贝矩阵。

以上代码中的所有Mat对象最终都指向同一个也是唯一一个数据矩阵。

虽然它们的信息头不同，但通过任何一个对象所做的改变也会影响其它对象。

实际上，不同的对象只是访问相同数据的不同途径而已。

这里还要提及一个比较棒的功能：

你可以创建只引用部分数据的信息头。

比如想要创建一个感兴趣区域（ROI），你只需要创建包含边界信息的信息头：

MatD（A,Rect（10,10,100,100））;//usingarectangle

MatE=A（Range:

all（）,Range（1,3））;//usingrowandcolumnboundaries

现在你也许会问，如果矩阵属于多个Mat对象，那么当不再需要它时谁来负责清理？

简单的回答是：

最后一个使用它的对象。

通过引用计数机制来实现。

无论什么时候有人拷贝了一个Mat对象的信息头，都会增加矩阵的引用次数；反之当一个头被释放之后，这个计数被减一；当计数值为零，矩阵会被清理。

但某些时候你仍会想拷贝矩阵本身（不只是信息头和矩阵指针），这时可以使用函数clone（）或者copyTo（）。

MatF=A.clone（）;MatG;A.copyTo（G）;

在改变F或者G就不会影响Mat信息头所指向的矩阵。

总结一下，你需要记住的是

∙OpenCV函数中输出图像的内存分配是自动完成的（如果不特别指定的话）。

∙使用OpenCV的C++接口时不需要考虑内存释放问题。

∙赋值运算符和拷贝构造函数（ctor）只拷贝信息头。

∙使用函数clone（）或者copyTo（）来拷贝一副图像的矩阵。

存储方法

这里讲述如何存储像素值。

需要指定颜色空间和数据类型。

颜色空间是指对一个给定的颜色，如何组合颜色元素以对其编码。

最简单的颜色空间要属灰度级空间，只处理黑色和白色，对它们进行组合可以产生不同程度的灰色。

对于彩色方式则有更多种类的颜色空间，但不论哪种方式都是把颜色分成三个或者四个基元素，通过组合基元素可以产生所有的颜色。

RGB颜色空间是最常用的一种颜色空间，这归功于它也是人眼内部构成颜色的方式。

它的基色是红色、绿色和蓝色，有时为了表示透明颜色也会加入第四个元素alpha（A）。

有很多的颜色系统，各有自身优势：

∙RGB是最常见的，这是因为人眼采用相似的工作机制，它也被显示设备所采用。

∙HSV和HLS把颜色分解成色调、饱和度和亮度/明度。

这是描述颜色更自然的方式，比如可以通过抛弃最后一个元素，使算法对输入图像的光照条件不敏感。

∙YCrCb在JPEG图像格式中广泛使用。

∙CIEL*a*b*是一种在感知上均匀的颜色空间，它适合用来度量两个颜色之间的距离。

每个组成元素都有其自己的定义域，取决于其数据类型。

如何存储一个元素决定了我们在其定义域上能够控制的精度。

最小的数据类型是char，占一个字节或者8位，可以是有符号型（0到255之间）或无符号型（-127到+127之间）。

尽管使用三个char型元素已经可以表示1600万种可能的颜色（使用RGB颜色空间），但若使用float（4字节，32位）或double（8字节，64位）则能给出更加精细的颜色分辨能力。

但同时也要切记增加元素的尺寸也会增加了图像所占的内存空间。

显式地创建一个Mat对象

教程读取、修改、保存图像已经讲解了如何使用函数imwrite（）将一个矩阵写入图像文件中。

但是为了debug，更加方便的方式是看实际值。

为此，你可以通过Mat的运算符<<来实现，但要记住这只对二维矩阵有效。

Mat不但是一个很赞的图像容器类，它同时也是一个通用的矩阵类，所以可以用来创建和操作多维矩阵。

创建一个Mat对象有多种方法：

Mat（）构造函数

MatM（2,2,CV_8UC3,Scalar（0,0,255））;

out<<"M="<

对于二维多通道图像，首先要定义其尺寸，即行数和列数。

然后，需要指定存储元素的数据类型以及每个矩阵点的通道数。

为此，依据下面的规则有多种定义

CV_[Thenumberofbitsperitem][SignedorUnsigned][TypePrefix]C[Thechannelnumber]

比如CV_8UC3表示使用8位的unsignedchar型，每个像素由三个元素组成三通道。

预先定义的通道数可以多达四个。

Scalar是个short型vector。

指定这个能够使用指定的定制化值来初始化矩阵。

当然，如果你需要更多通道数，你可以使用大写的宏并把通道数放在小括号中，如下所示

·在C\C++中通过构造函数进行初始化

intsz[3]={2,2,2};

MatL（3,sz,CV_8UC

（1）,Scalar:

:

all（0））;

上面的例子演示了如何创建一个超过两维的矩阵：

指定维数，然后传递一个指向一个数组的指针，这个数组包含每个维度的尺寸；其余的相同

为已存在IplImage指针创建信息头:

IplImage*img=cvLoadImage（"greatwave.png",1）;Matmtx（img）;//convertIplImage*->Mat

Create（）function:

函数

M.create（4,4,CV_8UC

（2））;

cout<<"M="<

这个创建方法不能为矩阵设初值，它只是在改变尺寸时重新为矩阵数据开辟内存。

·MATLAB形式的初始化方式：

zeros（）,ones（）,:

eyes（）。

使用以下方式指定尺寸和数据类型：

MatE=Mat:

:

eye（4,4,CV_64F）;

cout<<"E="<

MatO=Mat:

:

ones（2,2,CV_32F）;

cout<<"O="<

MatZ=Mat:

:

zeros（3,3,CV_8UC1）;

cout<<"Z="<

对于小矩阵你可以用逗号分隔的初始化函数:

MatC=（Mat_（3,3）<<0,-1,0,-1,5,-1,0,-1,0）;

cout<<"C="<

·使用clone（）或者copyTo（）为一个存在的Mat对象创建一个新的信息头。

MatRowClone=C.row

（1）.clone（）;

cout<<"RowClone="<

格式化打印

Note：

调用函数randu（）来对一个矩阵使用随机数填充，需要指定随机数的上界和下界：

MatR=Mat（3,2,CV_8UC3）;

randu（R,Scalar:

:

all（0）,Scalar:

:

all（255））;

从上面的例子中可以看到默认格式，除此之外，OpenCV还支持以下的输出习惯

·默认方式

cout<<"R（default）="<

·Python

cout<<"R（python）="<

·以逗号分隔的数值（CSV）

cout<<"R（csv）="<

·Numpy

cout<<"R（numpy）="<

·C语言

cout<<"R（c）="<

打印其它常用项目

OpenCV支持使用运算符<<来打印其它常用OpenCV数据结构。

·2维点

Point2fP（5,1）;

cout<<"Point（2D）="<

·3维点

Point3fP3f（2,6,7）;

cout<<"Point（3D）="<

·基于cv:

:

Mat的std:

:

vector

vectorv;

v.push_back（（float）CV_PI）;v.push_back

（2）;v.push_back（3.01f）;

cout<<"VectoroffloatsviaMat="<

·std:

:

vector点

vectorvPoints（20）;

for（size_tE=0;E

vPoints[E]=Point2f（（float）（E*5）,（float）（E%7））;

cout<<"Avectorof2DPoints="<

这里的例子大多数出现在一个短小的控制台应用程序中，你可以在here下载到，或者在c++示例部分中找到。

二、

OpenCV如何扫描图像、利用查找表和计时

目的

我们将探索以下问题的答案：

∙如何遍历图像中的每一个像素？

∙OpenCV的矩阵值是如何存储的？

∙如何测试我们所实现算法的性能？

∙查找表是什么？

为什么要用它？

测试用例

这里我们测试的，是一种简单的颜色缩减方法。

如果矩阵元素存储的是单通道像素，使用C或C++的无符号字符类型，那么像素可有256个不同值。

但若是三通道图像，这种存储格式的颜色数就太多了（确切地说，有一千六百多万种）。

用如此之多的颜色可能会对我们的算法性能造成严重影响。

其实有时候，仅用这些颜色的一小部分，就足以达到同样效果。

这种情况下，常用的一种方法是颜色空间缩减。

其做法是：

将现有颜色空间值除以某个输入值，以获得较少的颜色数。

例如，颜色值0到9可取为新值0，10到19可取为10，以此类推。

uchar（无符号字符，即0到255之间取值的数）类型的值除以int值，结果仍是char。

因为结果是char类型的，所以求出来小数也要向下取整。

利用这一点，刚才提到在uchar定义域中进行的颜色缩减运算就可以表达为下列形式：

这样的话，简单的颜色空间缩减算法就可由下面两步组成：

一、遍历图像矩阵的每一个像素；二、对像素应用上述公式。

值得注意的是，我们这里用到了除法和乘法运算，而这两种运算又特别费时，所以，我们应尽可能用代价较低的加、减、赋值等运算替换它们。

此外，还应注意到，上述运算的输入仅能在某个有限范围内取值，如uchar类型可取256个值。

由此可知，对于较大的图像，有效的方法是预先计算所有可能的值，然后需要这些值的时候，利用查找表直接赋值即可。

查找表是一维或多维数组，存储了不同输入值所对应的输出值，其优势在于只需读取、无需计算。

我们的测试用例程序（以及这里给出的示例代码）做了以下几件事：

以命令行参数形式读入图像（可以是彩色图像，也可以是灰度图像，由命令行参数决定），然后用命令行参数给出的整数进行颜色缩减。

目前，OpenCV主要有三种逐像素遍历图像的方法。

我们将分别用这三种方法扫描图像，并将它们所用时间输出到屏幕上。

我想这样的对比应该很有意思。

你可以从这里下载源代码，也可以找到OpenCV的samples目录，进入cpp的tutorial_code的core目录，查阅该程序的代码。

程序的基本用法是：

how_to_scan_imagesimageName.jpgintValueToReduce[G]

最后那个参数是可选的。

如果提供该参数，则图像以灰度格式载入，否则使用彩色格式。

在该程序中，我们首先要计算查找表。

intdivideWith;//convertourinputstringtonumber-C++style

stringstreams;

s<

s>>divideWith;

if（!

s）

{

cout<<"Invalidnumberenteredfordividing."<

return-1;

}

uchartable[256];

for（inti=0;i<256;++i）

table[i]=divideWith*（i/divideWith）;

这里我们先使用C++的stringstream类，把第三个命令行参数由字符串转换为整数。

然后，我们用数组和前面给出的公式计算查找表。

这里并未涉及有关OpenCV的内容。

另外有个问题是如何计时。

没错，OpenCV提供了两个简便的可用于计时的函数getTickCount（）和getTickFrequency（）。

第一个函数返回你的CPU自某个事件（如启动电脑）以来走过的时钟周期数，第二个函数返回你的CPU一秒钟所走的时钟周期数。

这样，我们就能轻松地以秒为单位对某运算计时：

doublet=（double）getTickCount（）;//做点什么...

t=（（double）getTickCount（）-t）/getTickFrequency（）;cout<<"Timespassedinseconds:

"<

图像矩阵是如何存储在内存之中的？

在我的教程Mat-基本图像容器中，你或许已了解到，图像矩阵的大小取决于我们所用的颜色模型，确切地说，取决于所用通道数。

如果是灰度图像，矩阵就会像这样：

而对多通道图像来说，矩阵中的列会包含多个子列，其子列个数与通道数相等。

例如，RGB颜色模型的矩阵：

注意到，子列的通道顺序是反过来的：

BGR而不是RGB。

很多情况下，因为内存足够大，可实现连续存储，因此，图像中的各行就能一行一行地连接起来，形成一个长行。

连续存储有助于提升图像扫描速度，我们可以使用isContinuous（）来去判断矩阵是否是连续存储的.相关示例会在接下来的内容中提供。

1.高效的方法EfficientWay

说到性能，经典的C风格运算符[]（指针）访问要更胜一筹.因此，我们推荐的效率最高的查找表赋值方法，还是下面的这种：

Mat&ScanImageAndReduceC（Mat&I,constuchar*consttable）{

//acceptonlychartypematrices

CV_Assert（I.depth（）!

=sizeof（uchar））;

intchannels=I.channels（）;

intnRows=I.rows*channels;

intnCols=I.cols;

if（I.isContinuous（））

{

nCols*=nRows;

nRows=1;

}

inti,j;

uchar*p;

for（i=0;i

{

p=I.ptr（i）;

for（j=0;j

{

p[j]=table[p[j]];

}

returnI;}

这里，我们获取了每一行开始处的指针，然后遍历至该行末尾。

如果矩阵是以连续方式存储的，我们只需请求一次指针、然后一路遍历下去就行。

彩色图像的情况有必要加以注意：

因为三个通道的原因，我们需要遍历的元素数目也是3倍。

这里有另外一种方法来实现遍历功能，就是使用data，data会从Mat中返回指向矩阵第一行第一列的指针。

注意如果该指针为NULL则表明对象里面无输入，所以这是一种简单的检查图像是否被成功读入的方法。

当矩阵是连续存储时，我们就可以通过遍历data来扫描整个图像。

例如，一个灰度图像，其操作如下：

uchar*p=I.data;

for（unsignedinti=0;i

*p++=table[*p];

这回得出和前面相同的结果。

但是这种方法编写的代码可读性方面差，并且进一步操作困难。

同时，我发现在实际应用中，该方法的性能表现上并不明显优于前一种（因为现在大多数编译器都会对这类操作做出优化）。

2.迭代法Theiterator（safe）method

在高性能法（theefficientway）中，我们可以通过遍历正确的uchar域并跳过行与行之间可能的空缺-你必须自己来确认是否有空缺，来实现图像扫描，迭代法则被认为是一种以更安全的方式来实现这一功能。

在迭代法中，你所需要做的仅仅是获得图像矩阵的begin和end，然后增加迭代直至从begin到end。

将*操作符添加在迭代指针前，即可访问当前指向的内容。

Mat&ScanImageAndReduceIterator（Mat&I,constuchar*consttable）{

//acceptonlychartypematrices

CV_Assert（I.depth（）!

=sizeof（uchar））;

constintchannels=I.channels（）;

switch（channels）

{

case1:

{

MatIterator_it,end;

for（it=I.begin（）,end=I.end（）;it!

=end;++it）

*it=table[*it];

break;

}

case3:

{

MatIterator_it,end;

for（it=I.begin（）,end=I.end（）;it!

=end;++it）

{

（*it）[0]=table[（*it）[0]];

（*it）[1]=table[（*it）[1]];

（*it）[2]=table[（*it）[2]];

}

returnI;}

对于彩色图像中的一行，每列中有3个uchar元素，这可以被认为是一个小的包含uchar元素的vector，在OpenCV中用Vec3b来命名。

如果要访问第n个子列，我们只需要简单的利用[]来操作就可以。

需要指出的是，OpenCV的迭代在扫描过一行中所有列后会自动跳至下一行，所以说如果在彩色图像中如果只使用一个简单的uchar而不是Vec3b迭代的话就只能获得蓝色通道（B）里的值。

3.通过相关返回值的On-the-fly地址计算

事实上这个方法并不推荐被用来进行图像扫描，它本来是被用于获取或更改图像中的随机元素。

它的基本用途是要确定你试图访问的元素的所在行数与列数。

在前面的扫描方法中，我们观察到知道所查询的图像数据类型是很重要的。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: OpenCV 中文翻译教程

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：OpenCV中文翻译教程.docx
链接地址：https://www.bdocx.com/doc/27920975.html

OpenCV中文翻译教程.docx

热门标签