2013基于最小二乘法的碎纸片拼接复原数学模型文档格式.doc
- 文档编号:13086537
- 上传时间:2022-10-04
- 格式:DOC
- 页数:28
- 大小:2.78MB
2013基于最小二乘法的碎纸片拼接复原数学模型文档格式.doc
《2013基于最小二乘法的碎纸片拼接复原数学模型文档格式.doc》由会员分享,可在线阅读,更多相关《2013基于最小二乘法的碎纸片拼接复原数学模型文档格式.doc(28页珍藏版)》请在冰豆网上搜索。
随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。
对于一页印刷文档,针对不同的破碎方法,讨论下列三个问题:
(1)将给定的一页印刷文字文件纵切,建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。
(2)对于碎纸机既纵切又横切的情形,设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。
(3)对于双面打印文档,研究如何进行碎纸片的拼接复原问题。
附件5给出的是一页英文印刷文字双面打印文件的碎片数据。
要求尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果。
二、模型的基本假设
(1)待拼接的碎纸片来自同一页印刷文字文件。
(2)待拼接复原的碎纸片是规整的矩形。
(3)模型中的碎纸片长度、宽度和面积都相等。
(4)附件中照片都是同标准拍摄。
三、符号说明
表1符号说明
符号
符号说明
灰度值
红色
绿色
蓝色
矩阵
裁截距
裁截文字长度
行间距
裁截空白距离
字体高度
四、问题分析
将不规则的文档碎纸片进行拼接,一般是利用碎纸片的边缘曲线,尖点、尖角、面积等几何特征,搜索与之匹配的相邻碎纸片。
但对于边缘形状相似的碎纸片,这种基于边界几何特征的拼接方法失效,拼接时不但要考虑待拼接碎纸片边缘是否匹配,还要判断碎片内的字迹断线或碎片内的文字内容是否匹配。
本问题给定的碎纸片有以下几个特点:
1、每一张碎纸片都是规整的矩形;
2、所有的碎纸片的长度、宽度都相等,形状是完全一样的;
3、每一张碎纸片里都包含着文字(汉字、英文),不存在空白的碎纸片;
4、不同的碎纸片之间没有重叠部分。
由于碎纸片的形状相同,因而不能针对碎纸片的几何特征建立数学模型;
碎纸片间无重叠,也不能利用图像融合技术进行图像配准。
根据上述分析,我们考虑将图片进行数字化处理,根据每张碎纸片上的边缘文字特征进行匹配,也就是利用图片边缘文字的像素进行最优化匹配。
五、模型的建立与求解
5.1问题一的建模与算法
由于碎纸片本身不具有体现其拼接特性的数字特征,我们需要将其数字化、矩阵化,将问题转化为矩阵之间的相关性。
5.1.1图片的灰度处理
利用软件,将附件中所给的BMP格式的图片转化成JPG格式,去除图片的多彩性。
为了对碎纸片进行数字化,我们将图像进行灰度处理,取出图像中每一个像素点的灰度值,灰度值的大小与像素点颜色的红绿蓝成分有关。
根据文献[1],每个像素点的,即
,
其中,的取值范围是。
问题一将同一页印刷文字文件纵切为19张图片(见图1),根据实际情况,我们将每张图片设置为格式,于是,每张图片对应一个的灰度矩阵。
图1附件1未进行拼接的19张碎纸片
5.1.2图片的二值化处理
将图片进行灰度处理以后,每个像素的灰度值介于之间。
灰度值不能直接用于文字图片的拼接,还须进行二值化处理。
将图片放入直角坐标系,规定:
若点的像素灰度值大于或等于,该点用数值表示,并将其设定为白色;
若点的像素灰度值小于,该点用数值表示,并将其设定为黑色。
由此得到像素点的二值化函数:
其中,为预先设定的全局灰度阈值。
于是,每张图片的灰度矩阵转化为下列的数字矩阵:
其中
5.1.3最小二乘法
1、图片左右拼接的数学模型
设分别表示左右放置的两张图片对应的数字矩阵,定义前一个矩阵的最后一列与后一个矩阵的第一列之间的偏差函数为:
其中,分别表示矩阵第列和第列的元素。
对于给定的矩阵,若存在矩阵,使得与之间的偏差函数达到最小,则称与可以匹配,此时与对应的图片可以左右拼接。
2、图片上下拼接的数学模型
类似地,设分别表示上下放置的两张图片对应的数字矩阵,定义上面矩阵的最后一行与下面矩阵的第一行之间的偏差函数为:
其中,分别表示矩阵第行和第行的元素。
对于给定的矩阵,若存在矩阵,使得与之间的偏差函数达到最小,则称与可以匹配,此时与对应的图片可以上下拼接。
我们称上述基于数字矩阵之间列(或行)距离的图片拼接模型为最小二乘法拼接复原模型。
5.1.4算法与求解
(一)算法思想
第一步,对附件中的19幅图片分别进行灰度处理,然后取灰度阈值,进行二值化,得到19个数字矩阵,即图片的数字化。
第二步,对上述19个数字矩阵进行检测,若存在一个矩阵的最左侧一列元素全是1,根据破碎图片的特点,则该图片即为从左边起第一张碎纸片,记为。
第三步,计算与其余18张图片对应矩阵的列偏差值。
若存在,使得达到最小,则即位第二张图片。
重复上述的步骤,依次得到所有碎纸片的排列,即可拼接成完整图片。
(二)附件1、2的拼接复原结果
附件1和附件2的拼接顺序如下表:
(附件1的算法程序见附录一,复原图片见附录二;
附件2的算法程序见附录三,复原图片见附录四)
表2附件1拼接顺序
8
14
12
15
3
10
2
16
1
4
5
9
13
18
11
7
17
6
表3附件2拼接顺序
5.2问题二的模型建立与算法
5.2.1图片的数字化处理
步骤一:
将附件所给的BMP格式图片转换成JPG格式的图片;
步骤二:
对图片进行灰度处理;
步骤三:
然后进行二值化处理;
最后,得到209张图片的数字化矩阵。
5.2.2聚类分析
对于碎纸机既纵切又横切的情形,与问题一仅纵切相比,图片变小,因而每张图片包含的信息量明显变小,如果仅利用最小二乘法,碎片之间的匹配不唯一。
为了解决这个问题,我们利用聚类分析法,对碎片先进行分类。
经观察测试,原始文档碎片具有下列特点:
(1)字体大小:
字体的最大高度和最大宽度一致。
(2)切割的均匀性:
同方向的切割线平行,图片大小均相等,沿纵横方向按直线切割。
(3)文字的行距:
文字的行间距等同,段落间距为定值。
为了对209幅图片进行聚类分析,如图2所示,我们定义聚类指标如下:
表示图片上端裁接处的字体长度,我们称之为裁截文字长度;
为行间距;
表示图片上端文字与切割线之间的空白距离,我们称之为裁截空白距离;
为字体高度,其中,。
图2图片聚类指标示意图
令或,称为第张图片的裁截距,由图2,如,则。
一般地,图片从上往下看,不同的裁截线形成的裁截文字长度不同,文字间的行间距相同,所以,如果裁接处的文字长度不相等,那么文字与空白间距之和就不相等。
根据的不同取值,下面对图片进行分类。
根据二值化矩阵的特点以及文字的特征,只要存在文字,则矩阵的某一行元素一定存在0元素,且在文字之间的元素为1。
如下图所示:
图3文字特征图
利用软件进行编程,将每个图片的裁截文字长度、行间距、裁截空白距离、字体高度以及裁截距的结果以的形式输出到表格之中。
(程序见附录五)
按裁接距进行聚类分析,使用软件分析处理后,得到聚类中心分布图如下所示:
表4聚类中心
聚类中心
聚类
V1
52
32
120
44
58
133
64
109
69
78
根据表4所示的聚类中心,对表格中裁截距进行初步分类。
得到聚类结果如下表所示:
表5每个聚类中的案例数
每个聚类中的案例数
2.000
36.000
18.000
1.000
46.000
38.000
11.000
19.000
有效
209.000
缺失
.000
根据聚类结果发现,并不能将图片平均分成11个组。
这时需要增加信息量来更好地进行分类,进一步观察图2,我们可以发现:
图片的上端裁截处可能是文字,也可能为空白。
但是裁截距可能相等,此时通过图片上端裁截处是空白还是文字加以人工分类。
用将数据导出到中并进行分析,结果如下:
-100
-50
50
100
150
200
250
高度
图片数量
图4分析结果
由图4可以看出:
图片大体分为11个组别,为了得到更精确地聚类结果,通过软件,我们再次确立聚类中心如下图所示:
表6第二次聚类中心
最终聚类中心
25
40
-38
-93
-69
-84
34
-23
-10
通过上面两次聚类,确立了两个不同聚类中心。
利用第一次确立的裁接距的聚类中心对图片进行初步分类,然后利用裁截文字或者裁接空白再次进行判别,最终将图片分成了11组。
如下表所示:
(以上的算法都是在软件下操作,程序见附件六)
表7各组图片数量
组别
19
由上表可以看出大部分图片已经分出组别,其中有4个组达到了19张图片,有6个组有18张图片,仅缺少一张图片。
此时我们进行人工干预,根据每组图片总数目应为19,且每类都应存在可作为文件左右边缘的碎纸片
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2013 基于 最小二乘法 纸片 拼接 复原 数学模型