数字图像处理Word文档格式.docx
- 文档编号:20706722
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:23
- 大小:1.71MB
数字图像处理Word文档格式.docx
《数字图像处理Word文档格式.docx》由会员分享,可在线阅读,更多相关《数字图像处理Word文档格式.docx(23页珍藏版)》请在冰豆网上搜索。
<
"
打开图像失败!
endl;
return-1;
}
imshow("
原始图像"
srcImage);
//将输入图像延扩到最佳的尺寸,边界用0补充
intm=getOptimalDFTSize(srcImage.rows);
intn=getOptimalDFTSize(srcImage.cols);
//将添加的像素初始化为0.
Matpadded;
copyMakeBorder(srcImage,padded,0,m-srcImage.rows,0,n-srcImage.cols,BORDER_CONSTANT,Scalar:
:
all(0));
//为傅立叶变换的结果(实部和虚部)分配存储空间。
//将planes数组组合合并成一个多通道的数组complexI
Matplanes[]={Mat_<
float>
(padded),Mat:
zeros(padded.size(),CV_32F)};
MatcomplexI;
merge(planes,2,complexI);
//进行就地离散傅里叶变换
dft(complexI,complexI);
//将复数转换为幅值,即=>
log(1+sqrt(Re(DFT(I))^2+Im(DFT(I))^2))
split(complexI,planes);
//将多通道数组complexI分离成几个单通道数组,planes[0]=Re(DFT(I),planes[1]=Im(DFT(I))
magnitude(planes[0],planes[1],planes[0]);
//planes[0]=magnitude
MatmagnitudeImage=planes[0];
//进行对数尺度(logarithmicscale)缩放
magnitudeImage+=Scalar:
all
(1);
log(magnitudeImage,magnitudeImage);
//求自然对数
//剪切和重分布幅度图象限
//若有奇数行或奇数列,进行频谱裁剪
magnitudeImage=magnitudeImage(Rect(0,0,magnitudeImage.cols&
-2,magnitudeImage.rows&
-2));
//重新排列傅立叶图像中的象限,使得原点位于图像中心
intcx=magnitudeImage.cols/2;
intcy=magnitudeImage.rows/2;
Matq0(magnitudeImage,Rect(0,0,cx,cy));
//ROI区域的左上
Matq1(magnitudeImage,Rect(cx,0,cx,cy));
//ROI区域的右上
Matq2(magnitudeImage,Rect(0,cy,cx,cy));
//ROI区域的左下
Matq3(magnitudeImage,Rect(cx,cy,cx,cy));
//ROI区域的右下
//交换象限(左上与右下进行交换)
Mattmp;
q0.copyTo(tmp);
q3.copyTo(q0);
tmp.copyTo(q3);
//交换象限(右上与左下进行交换)
q1.copyTo(tmp);
q2.copyTo(q1);
tmp.copyTo(q2);
//归一化,用0到1之间的浮点值将矩阵变换为可视的图像格式
normalize(magnitudeImage,magnitudeImage,0,1,CV_MINMAX);
//显示效果图
频域"
magnitudeImage);
//(3)频域-->
空域
Matinversed;
dft(complexI,inversed,DFT_INVERSE|DFT_REAL_OUTPUT);
normalize(inversed,inversed,0,1,CV_MINMAX);
空域"
inversed);
waitKey();
return0;
效果图:
4)
题目二
对于下面这幅图像,请问可以通过那些图像增强的手段,达到改善视觉效果的目的?
请显示处理结果,并附简要处理流程说明。
该图像存在的主要问题:
1.存在椒盐噪声
2.曝光不够导致光线昏暗
1.采用中值滤波去噪
2.增加亮度,调整对比度
详细代码:
opencv2/opencv.hpp>
intContrastValue;
//对比度值
intBrightValue;
//亮度值
Matsrc,dst;
//改变图像对比度和亮度值的回调函数
staticvoidContrastAndBright(int,void*)
//创建窗口
namedWindow("
【原始图窗口】"
WINDOW_AUTOSIZE);
//更改图像亮度与对比度
for(inty=0;
y<
src.rows;
y++)
for(intx=0;
x<
src.cols;
x++)
for(intc=0;
c<
3;
c++)
dst.at<
Vec3b>
(y,x)[c]=saturate_cast<
uchar>
((ContrastValue*0.01)*(src.at<
(y,x)[c])+BrightValue);
//显示图像
src);
【效果图窗口】"
dst);
intmain(intargc,char*argv[])
//打开图像
src=imread("
two.png"
);
if(src.empty())
//中值滤波去噪
medianBlur(src,src,Size(5,5));
dst=Mat:
zeros(src.size(),src.type());
//设定对比度和亮度的初值
ContrastValue=80;
BrightValue=80;
namedWindow("
//创建轨迹条
createTrackbar("
对比度:
"
&
ContrastValue,300,ContrastAndBright);
亮度:
BrightValue,200,ContrastAndBright);
//调用回调函数
ContrastAndBright(ContrastValue,0);
ContrastAndBright(BrightValue,0);
//等待用户按键,起到暂停的作用
题目三
对于下面这幅图像,编程实现染色体计数,并附简要处理流程说明。
1.图像存在椒盐噪声,所以先利用中值滤波对图像进行去噪处理。
2.进行二值化。
3.因为图像中染色体内、染色体间存在空白点,所以要进行腐蚀操作。
4.接下来就是要求以上图像存在的染色体的个数了。
抛开数字图像处理的专业性知识,利用我们以往掌握的知识,该怎么去做呢?
在数据结构中,我们学到过连通区域、深度优先遍历等知识。
那么,我们是不是把上图看做是由一个个染色体组成的连通区域呢?
没错,求染色体的个数转化为求连通区域(黑色区域)的个数。
一次DFS(深度优先遍历)便可以求得一个连通区域,也就是求得存在一个染色体。
我们都知道DFS最简单的实现方式是使用递归函数。
递归调用是个很美的函数,但是递归函数调用也会带来开栈、清栈性能上的损失。
虽然以上算法性能上不是最优的,但是也不失为一种解决办法。
以下是利用数字图像处理里的相关知识:
利用OpenCV里的findContours函数检测染色体边缘,然后统计染色体个数。
根据我们观察,以上图像含有46个染色体,但是我们求出来的是47条。
根据我的个人理解:
整个图像的边缘构成了一个最大的轮廓线,所以正确的染色体个数应为46,而不是47。
=.=口说无凭,还是拿代码来说话。
我们可以把轮廓的坐标打印出来:
for(inti=0;
i<
contours.size();
i++)
for(intj=0;
j<
contours[i].size();
j++)
contours[i][j]<
"
;
打印出:
[1,1][1,410][523,410][523,1]。
而我们的染色体这幅图片的大小为:
525*412。
虽然略有偏差,但是足可以证明以上假设。
vector>
intmain(intargc,char**argv)
Matgray,src,dst;
image.png"
rows="
src.rows<
cols="
src.cols<
//转换为灰度图
cvtColor(src,gray,CV_BGR2GRAY);
//中值滤波
medianBlur(gray,gray,7);
//图像二值化
threshold(gray,dst,170,255,THRESH_BINARY);
//腐蚀,默认内核3*3
erode(dst,dst,Mat());
//erode(dst,dst,Mat());
Matcanny_output;
vector<
vector<
Point>
>
contours;
Vec4i>
hierarchy;
//画轮廓线
Canny(dst,canny_output,100,100*2,3);
//检测轮廓
findContours(dst,contours,hierarchy,CV_RETR_TREE,CV_CHAIN_APPROX_SIMPLE,Point(0,0));
一共检测到染色体数目:
contours.size()-1<
//显示图片
src"
canny_output"
canny_output);
//将图片保存到文件
imwrite("
dst.png"
//等待用户输入
题目四
对MNIST手写数字数据库(可在网上搜索下载),编程实现来提取其链码。
1.将Mnist字库读取到以OpenCV里的Mat为储存单元的vector中。
2.使用findContours将链码保存在vector中。
3.输出链码。
string>
fstream>
//格式转换
intReverseInt(inti)
unsignedcharch1,ch2,ch3,ch4;
ch1=i&
255;
ch2=(i>
8)&
ch3=(i>
16)&
ch4=(i>
24)&
return((int)ch1<
24)+((int)ch2<
16)+((int)ch3<
8)+ch4;
/**
*将Mnist数据库读取到OpenCV:
Mat格式中
*格式:
*magicnumber
*numberofimages
*rows
*cols
*averyverylongvectorcontainsalldigits
*/
voidread_Mnist(stringfilename,vector<
Mat>
&
vec)
ifstreamfile(filename,ios:
binary);
if(file.is_open())
intmagic_number=0;
intnumber_of_images=0;
intn_rows=0;
intn_cols=0;
file.read((char*)&
magic_number,sizeof(magic_number));
magic_number=ReverseInt(magic_number);
number_of_images,sizeof(number_of_images));
number_of_images=ReverseInt(number_of_images);
n_rows,sizeof(n_rows));
n_rows=ReverseInt(n_rows);
n_cols,sizeof(n_cols));
n_cols=ReverseInt(n_cols);
number_of_images;
++i)
cv:
Mattp=Mat:
zeros(n_rows,n_cols,CV_8UC1);
for(intr=0;
r<
n_rows;
++r)
n_cols;
++c)
unsignedchartemp=0;
temp,sizeof(temp));
tp.at<
(r,c)=(int)temp;
vec.push_back(tp);
}//if
intcount=1;
//存储Mnist字库
vec;
//将Mnist字库读取到vector中
read_Mnist("
t10k-images.idx3-ubyte"
vec);
共含有:
vec.size()<
幅图片"
for(autoiter=vec.begin();
iter!
=vec.end();
iter++)
第"
count++<
幅图片..."
//显示Mnist字库
Mnist"
*iter);
//读取轮廓
findContours(*iter,contours,CV_RETR_EXTERNAL,CV_CHAIN_CODE);
//输出链码
contours[i][j];
waitKey(1000);
从以上输出看到,我们所得到的链码并不是我们所熟悉的4方向和8方向的链码。
无论是在StackOverFlow还是知乎、Google均没有找到相关资料。
不得不说是一个遗憾。
总结
以下是自己完成本次论文所学习和使用到的知识点:
图像噪声:
就像对于听觉而言,在打电话时对方说话我们有时候会听到很嘈杂的噪声,以至于听不清楚对方在说什么。
同样的,对于图像,原本我们可以很清晰的看到一幅图像,但是有时候图像上会有一些我们不需要的图案,使我们无法很清楚的看清一幅图,这就是图像的噪声。
常见的图像噪声的分类:
1.高斯噪声
高斯噪声是一种具有正态分布(也称作高斯分布)概率密度函数的噪声。
换句话说,高斯噪声的值遵循高斯分布或者它在各个频率分量上的能量具有高斯分布。
它被极其普遍地应用为用以产生加成性高斯白噪声(AWGN)的迭代白噪声。
2.瑞利噪声
3.伽马噪声
4.指数分布噪声
5.均匀分布噪声
6.椒盐噪声
椒盐噪声也称为脉冲噪声,是图像中经常见到的一种噪声,它是一种随机出现的白点或者黑点,可能是亮的区域有黑色像素或是在暗的区域有白色像素(或是两者皆有)。
常用的去除这种噪声的有效手段是使用中值滤波器。
例如:
带有椒盐噪声的图像:
原始图像:
直方图:
直方图是对数据的集合统计,并将统计结果分布于一系列预定义的bins中。
这里的数据不仅仅指的是灰度值,统计数据可能是任何能有效描述图像的特征。
形态学操作:
形态学操作就是基于形状的一系列图像处理操作。
通过将结构元素作用于输入图像来产生输出图像。
最基本的形态学操作有:
腐蚀与膨胀(Erosion与Dilation)。
二值图像:
二值图像是每个像素只有两个可能值的数字图像。
人们经常用黑白、B&
W、单色图像表示二值图像,但是也可以用来表示每个像素只有一个采样值的任何图像,例如灰度图像等。
OpenCV(OpenSourceComputerVisionLibrary):
OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和MacOS操作系统上。
它轻量级而且高效——由一系列C函数和少量C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。
Mnist:
MNIST是一个标准的手写字符测试集,收集者是人工智能领域著名的科学家,现在最火的深度学习网络ConvulutionNueralNetworks的创始人,现任FacebookAI实验室的主任--YannLeCun。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理