数控机床调整决策在硬盘驱动臂制造方面的数据挖掘.docx
- 文档编号:9475032
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:12
- 大小:369.99KB
数控机床调整决策在硬盘驱动臂制造方面的数据挖掘.docx
《数控机床调整决策在硬盘驱动臂制造方面的数据挖掘.docx》由会员分享,可在线阅读,更多相关《数控机床调整决策在硬盘驱动臂制造方面的数据挖掘.docx(12页珍藏版)》请在冰豆网上搜索。
数控机床调整决策在硬盘驱动臂制造方面的数据挖掘
数控机床调整决策在硬盘驱动臂制造
方面的数据挖掘和实证研究
PongsakHolimchayachotikul1andWimalinLaosiritaworn2
1清迈大学艺术媒体与科技学院,
泰国清迈50200
g490631075@
2清迈大学工学院和工业工程系,
泰国清迈50200
wimalin@
摘要:
在过去的几年里硬盘驱动头的制造数量在泰国迅速增长,而硬盘驱动头中最重要的一个部件就是硬盘驱动臂。
这种组件已经被大量生产并且成为案例研究公司的一项重要收入来源。
这种硬盘驱动臂的制造过程尤其是加工过程是非常复杂的因此成为决定最终产品可用性的一项主要因素。
然而,在尺寸检查的过程中,许多导致生产力、销售以及利润整体下降的缺陷被检测出来了。
通常情况下,被检测的部件是从任意一台数控机床中随机挑选出来。
如果出现有缺陷的产品,那么这台机器将会停止工作且该机器加工的工具将会被重置。
如果正在生产有缺陷产品的机器在轮班检查中很晚才检查出来,那么它将导致大批量有缺陷的产品在任何纠正措施采取之前就已制造出来。
因此,这项研究提供了一种综合多属性决策(MADM)和数据集成开发(DM)的应用来定义工具调试的指令,可以使具有更高风险来生产有缺陷零部件的机器比其他低风险的机器更快的被检查出来并且予以纠正。
该方法如下。
首先,要收集每台机器的原始测量数据并且使用异常聚类分析方法实施噪声的消除。
其次,在一台机器通过性能假设测试确定每台机器的性能不相同之后,分类归并后的K-均值被选择用来把原始数据区分成三组,包括良好的,正常的和损坏的机器。
最后,一种日常的以简单加权方法为基础发展起来的数控机床优先评估模型,使机床工具作业调试得到了性能得分的最优化。
实验结果表明这项提议让机器的调试机制成为可能从而使有缺陷倾向的机器能得到优先维修,减少有缺陷零部件的生产并使整体的生产率得到提高。
关键词:
硬盘驱动臂,数据采集,聚类,MADM.
1.引言
如今,硬盘驱动器制造业的竞争取决于成本、质量、和交易时间,其中质量是一个公司维持长期竞争的最重要的因素。
在现代磁盘驱动器制造工业中大批量的原始数据已被自动或半自动的收集。
隐含在原始数据中的基本模式或知识通过数据的挖掘来帮助工程师对所有过程中有可能发展成为最好的过程做决定。
硬盘驱动臂的制造过程是复杂的。
在这个过程中,大量数据被生成和收集。
当机器调试过程中出现问题时,工程师们必须提出实用的检测方法来检测出那些易于产生有缺陷产品的机器以尽可能快地减少返工的零部件。
大多数的工程师们依靠自己的专业知识、经验或其他随机方法来确定检测的顺序。
有时候它可以在生产出有缺陷的零件之前就将这些异常机器检测出来。
然而,这些判断是无效的并且常常受限于他们的专业知识。
因此,在信息日益更新的基础上有效的将数据的挖掘和决策整合,来提取有助于加工过程改进和增大生产量的知识成为了一个重要的课题。
此外,在基于机器调节性能的异常先进性检测调查研究中,这些提取的信息和知识能够作为工程师们的参考和依据。
这项研究旨在发展一种介于数据挖掘和用于机器性能得分决策模型之间的综合框架以便得出最佳的机器加工调整指令。
特别地,在硬盘驱动臂的制造过程中k-均值和表面声波被用来分析和聚集数控机床条件。
通过使用真实的数据,一项经验研究被实施用来验证所提出的方法。
研究结果表明了这种方法的实际可行性,它能够有效的提供一种日常的恰当的测量顺序用于减少由于机器加工条件改变所产生的缺陷。
该篇论文组织结构如下。
第一部分描绘的是这项研究的研究背景、本质和研究目的。
第二部分阐明了这项研究和评论所涉及的相关文献的基本原理。
第三部分提出了一个在硬盘驱动器制造中具有详细程序的实证研究的研究框架,通过使用数据挖掘、决策模型和从机器数据库中检索到的知识。
被提议框架的结果和讨论在第四部分中会涉及和分析。
最后,第五部分提出了结论和进一步的研究方向。
2.背景
数据挖掘技术已被广泛使用并在20世纪90年代(汉等2001年,伊拉尼等1993年,李1993年)的生产领域中受到了关注。
目前,数据挖掘技术不仅使用于商业上而且在制造工程的许多不同领域用于加工建模预测维护、故障检测、设计、生产、质量保证、调度和决策支持系统的知识检索。
数据挖掘技术一般可分为四大类,也就是关联规则,聚类,分类和预测(法耶兹1996年,富1997年,Piatetsky-夏皮罗1999年)。
这项决策已经被广泛的应用于生产管理以便在实际生产中选择敏捷和适当的解决方案。
现今,统计资料和数据挖掘方法之间的整合尝试解决了长期以来的产品质量问题。
这项研究已经被广泛的应用在模型和优化过程的各个领域。
例如,航天工业的超塑性成形过程(Sukthomya等2005年),硬盘驱动臂的超声波清洗过程(Holimchayachotikul等2008年),和第II型糖尿病的胰岛素剂量预测(Holimchayachotikul等2007年)。
然而,在制造业中数据挖掘技术的研究仍存在许多空白和没有考虑到的地方有待去提高(哈丁等2006年)。
2.1聚类
聚类是一种不需管理就可将模型分类成感兴趣群集的数据挖掘技术。
已被提议的许多聚类的算法可以划分成两大类:
体系和和无体系方法。
K-均值的聚类是最著名的,且经常应用于无体系的聚类中。
在这项研究中,在开发进制脉冲数控机床之前,异常和K-均值已被作为初级和最终的聚类方法来应用。
异常检测程序是在集群标准偏差的基础上来检索异常情况的。
该程序的设计是在探究性数据分析步骤中快速检索异常情况以达到数据审计的目的,优先于任何推理性的数据分析。
该算法是为一般的异常情况监测设计的;也就是说,这里说的异常情况不是为了某种特殊应用而定义的,例如医疗保健行业中异常支付模式的检测或对金融行业洗钱行为的监测,这些异常情况能够被明确的定义。
K-均值是一种聚类的方法,用在以一组有相似值的输入域为基础的组进行记录。
其基本思路是尝试发现k群集,这样的话每个群集中的记录是彼此相似的但又有别于其他群集。
K均值是一种迭代的运算法则;一组初始的群集被定义,群集被反复更新直到不能再进行更一步的改进(或直到迭代次数超过了规定限度)。
K均值聚类的步骤是在用户指定了K值和模型中的群集数目之后才开始。
初始群集中心选择使用极大极小运算法则:
1.将初始化的第一个中心群作为输入域标准值的第一个数据来记录。
2.对于每一个记录的数据,计算记录和每一个被定义的中心群集之间的最小距离(欧几里德几何学)。
3.从确定的群集中心里选择最小记录距离里的最大值。
为被选择的值添加一个新的有输入域测试值的群集中心。
4.重复步骤2和步骤3直到k群集中心被添加到模型中。
一旦初始群集中心被选择出来,运算法则就开始迭代更新。
2.2简单加权(SAW)方法
这也称为加权合计方法(菲什伯恩1997年),是最简单和仍然是最广泛使用的多属性决策方法。
在这个方法里,每种属性都被赋予了一个重量,而且所有的重量之和必须等于1。
对于每种属性来说每一个供替代的选择都会用记录来进行评估。
供替代的选择的全部或综合性能得分是由方程式1给出。
这里的mij正常情况下表示的是mij的标准值,Pi是供选择的值Ai的全部或综合性得分。
所有供选择的Pi中的最高值被认为是最好的选择。
这种属性可能是有益的也可能是无益的。
核心函数的许多类型可以被应用。
方程式
(1)暗示着髙空间的点乘积等同于一个核心函数的输入空间。
Mercer的条件被用来决定核心函数是否可以被采用。
3.方法论
上述被提议的步骤的原理图见图1.多属性决策和数据挖掘技术的组合被用来定义硬盘驱动臂工具调整的最适当的检测顺序。
这项研究开始从于硬盘驱动臂制造过程中所获得的数据。
在这之后,使用异常聚类的方法来消除噪音。
然后,一种单因子变异数分析被用来核实每台机器假设性能的不同;这之后,使用K均值聚类的方法将原始数据分成三种群集。
在以简单加权方法为基础的进制脉冲数控机床的发展开始之前,统计学的参数加权方法、工程师领域的知识以及每台机器的平均参数都是必须的。
从那之后日常机器的聚类仅使用最重要的参数来执行。
根据每一个群组,最终聚类的结果是由以每个因素的不同值为基础的工程领域知识来解释的。
每台机器的每种因数的平均值被总结,而且来自统计学和工程领域知识的日常加权参数被整理。
然后这两个组成部分被用于普通数控机床优先评估模型的简单加权结构。
这种模型的结果是机器的性能得分,这也使每台机器的等级能够被考虑到。
目前测量顺序可以从那些结果中得出。
根据正在加工的结果,当天获得的新数据将会为第二天的加工等级做更新。
这个应用程序的实例在图4中表示出来了。
最终,工具调整的最佳检测顺序的结果与未定义的传统方法进行了比较。
图一.该体系结构原理图
4.结果与讨论
数据采集过程
硬盘驱动臂的生产是以30-35台机器完成120台机器的总额进行的,日以继夜的工作。
数据的收集是根据客户的关注点从每班的每台机器中选择六个样本来测量总共22个尺寸值。
其结果将用于工具安装决策的制定,以防止因生产出有缺陷的产品而被迫关闭超出临界参数的机器。
然而,目前,机器的序列指令是随机选择的。
因此,没有方法可以明确的校正出易于生产有缺陷产品的机器。
首先,目前的操作没有任何证据表明所有机器的执行性各有不同。
因此,基于单项方差的机器假设性检验用来证明决定性参数和机器编号是不同的。
一个例子的分析结果见表格1。
如果至少有一个决定性参数可以证明每台机器存在着显著差异,那么便可以得出每台机器的表现都不同的结论。
从表格1我们可以得出,一些机床生产与工作分组数据在置信区间上存在95%的显著差异;如图2所示,工作分组数据不受控制20%是关机的原因.如图3中所示,3月-6月9号生产有缺陷产品的原因,与其他方面的缺陷相比占有很大的比例。
基于2009年3月到6月的生产计划,总共有大约36000条纪录被使用。
前90%被用于模型的发展而其余的被用于模型的测试。
使用k均值的初始聚类开始于使用所有参数的数据的第一部分。
通过使用工程领域知识和皮尔森特征选择方法不必要的聚类参数被减少。
如图4所描述,P值大于或等于0.95的参数是将每一个测量记录正确分类的最重要的要素。
表1.单项方差方法:
工作分组数据因素与机床
来源DFSSMSFP
机器1190.12963220.001089323.860.000
误差169320.77298440.0000457
总计170510.9026166
S=0.006757R-Sq=14.36%R-Sq(adj)=13.76%
在模型被建造之后,为了验证模型,传统方法的随机序列像平常一样进行。
然后把最初检验的和有缺陷部分的发现之间的间隔记录下来。
该进制脉冲数控机床应用实例与实际生产所用的传统方法之间的比较就是证明。
例如编号为303和392的机床正在生产有缺陷的零部件。
从初始检验到检测出303号和392号机床之间的时间被记录。
在这段时间里,被提议方法的测定序列将被实施。
数控机床调整决策的数据挖掘
图2.3月9号-6月9号机器停机的常见原因
图3.3月9号到6月9号出现最多的生产缺陷
由于现在的检测顺序是最优先检查出容易出现缺陷的机器,编号为303和392号的机器应该比以前的方法早一点被检查出来。
以此为例,在图5中这两种方法就时间和缺陷产品成本上的不同进行了描绘。
如表2所示,从4月9号日常数控机床的优先级来看,用被提议的方法检查出易于生产有缺陷产品的机床所用的时间在置信区间上比传统方法减少了95%。
表2.配对t检验和置信区:
4月9日传统日常数控机床的优先级
数目
平均值
标准差
标准偏差
传统的
日常数控机床的优先级
差异
30
30
30
68.53
30.51
38.02
17.75
10.46
21.48
3.24
1.91
3.92
95%置信区间的平均差:
(30.00,46.05)P值=0.000。
T检验的平均差:
=0(vsnot=0):
T值=9.69。
图4.基于特征选择的聚类参数的减少
图5.建议的数控机床工具调整示范的日常检查顺序
5.结论
由于驱动臂成品的质量取决于准确性和数控机床的性能,因此数控机床的加工处理过程在硬盘驱动臂的生产中是一个决定性的过程。
依据生产出来的好的零部件,数控机床工具安装的适当时间能够直接增加数控机床的准确性和性能。
因此,这项研究开发了一种结合多属性决策和资料管理的应用程序来向数控机床工具调整提供日常的检测序列,从而使具有高风险来生产有缺陷零件的机床可以在低风险的机床之前得到检查和校正。
大多数的工程师们熟悉表面声波方法;然而,这种方法存在一些值得考虑的要点例如常规的方法或许太复杂而不能解决一些问题。
知识发现和实践中的数据检索的一个关键因素是数据的准备。
数据的收集和预处理要花费许多的时间,不能忽略而且需要极大的耐心。
不完整的数据可能违背数据挖掘结果的初衷。
因此,在工程领域内反复检查原始数据是非常关键的。
鉴于经验结果,我们验证了被提议的方法的实际可行性。
它帮助工程师找到了供决策制定者了解如何克服问题的日常工具调整检测顺序。
然而,这项研究还有一定的局限性例如检查异常机床的时间取决于进制脉冲数控机床加权参数的重要性。
从马尔可夫链随机过程的分析来看,进制脉冲数控机床包含缺陷事件出现的几率和第一时间关机的概率。
更进一步的研究可能依据其他的多属性决策研究方法而展开,例如模糊表面声波模糊层次分析方法而不是表面声波或者提高表面声波的标准化参数。
此外,根据随机过程我们可以发展和真正自然过程有关的进制脉冲数控机床来增加检测异常机床的效率。
鸣谢
这项研究如果没有硬盘驱动器组件工业/大学合作研究中心(I/UCRC)和国家电子以及泰国计算机技术中心的资金支持是不会完成的。
参考文献
Fayyad,U.,Piatetsky-Shapiro,G.,Smyth,P.:
从大量数据中提取有用知识的KDD
过程。
美国计算机协会交流39(11),27-34(1996)。
菲什伯恩,出版物:
添加剂工业的估算方法。
管理科学13-17,435-453(1997
年).
Fu,Y.:
数据挖掘。
电机及电子学工程师联合会16418-20(1997)。
Han,J.,Kamber,M.:
数据挖掘:
概念与技术。
摩根考夫曼,旧金山(2001)。
Harding,J.A.,Shahbaz,M.,Srinivas,Kusiak,A.:
:
制造业的数据挖掘:
评论
制造科学与工程杂志128,969-976(2006)。
Holimchayachotikul,P.,Laosiritaworn,W.:
使用支持矢量回归的硬盘驱动臂的
超声波清洗过程的建模和优化。
KKU研究杂志13(4)416-422(2008)。
Holimchayachotikul,P.,Jintawiwat,R.,Leksakul,K.:
以胰岛素剂量预测第II型糖尿病患者为基础的支持向量回归。
见:
第五届质量和可靠性国际会议,第192-197(2007)。
Irani,K.B.,Cheng,J.,Fayyad,U.M.,Qian,Z.:
半导体制造业机器学习的应用。
IEEE专家81,41-47(1993)。
Lee,M.H.:
基于工厂的知识。
Artif.Intell.Eng.8,109-125(1993)。
Piatetsky-Shapiro,G.:
数据挖掘工业时代的到来。
IEEEIntell.Syst.14(6),32–34(1999)
Sukthomya,W.,Tannock,J.:
使用田口设计实验方法的神经网络参数的最优化:
在制造过程建模中的应用。
神经计算机与应用14(4),337-344(2005)。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数控机床 调整 决策 硬盘 驱动 制造 方面 数据 挖掘
![提示](https://static.bdocx.com/images/bang_tan.gif)