数据挖掘课程设计.docx
- 文档编号:28624393
- 上传时间:2023-07-19
- 格式:DOCX
- 页数:13
- 大小:44.09KB
数据挖掘课程设计.docx
《数据挖掘课程设计.docx》由会员分享,可在线阅读,更多相关《数据挖掘课程设计.docx(13页珍藏版)》请在冰豆网上搜索。
数据挖掘课程设计
试验设计及数据挖掘技术课程设计
一、均匀设计试验方案的构造(10/每小项,共20分)
已知一试验有四个因素,他们的试验范围及因素水平见表1:
表1、因素水平表
NO.
1
2
3
4
5
6
7
8
9
10
11
12
X1
20
25
30
35
40
45
50
55
60
65
70
75
X2
80
85
90
95
X3
200
250
300
350
400
450
X4
120
125
130
135
140
145
150
155
160
165
170
1、请给出12拟水平的因素水平表
NO.
1
2
3
4
5
6
7
8
9
10
11
12
X1
20
25
30
35
40
45
50
55
60
65
70
75
X2
80
80
80
85
85
85
90
90
90
95
95
95
X3
200
200
250
250
300
300
350
350
400
400
450
450
X4
120
125
130
135
140
145
150
155
160
165
170
170
2、请给出12拟水平的试验方案
NO.
1
2
3
4
5
6
7
8
9
10
11
12
X1
20
25
30
35
40
45
50
55
60
65
70
75
X2
85
95
85
95
85
95
80
90
80
90
80
90
X3
350
250
450
300
200
400
250
450
350
200
400
300
X4
165
150
135
120
170
155
140
125
170
160
145
130
二、回归分析建模(15分/每小项,共30分)
表2、试验方案及结果
No.
X1
X2
X3
X4
X5
Y
1
15
40
25
45
160
527
2
15
60
35
55
150
453
3
20
100
20
40
140
481
4
20
20
30
55
130
462
5
25
40
40
40
120
614
6
25
80
20
50
160
557
7
30
100
30
35
150
682
8
30
20
40
50
140
562
9
35
60
25
35
130
556
10
35
80
35
45
120
538
表2为一个试验的试验方案及结果,请对表2的数据进行数据中心化的回归分析建模并对所得的回归方程进行F显著性检验,要求如下:
1、用一次项加交叉项的模型建模,如有不显著项须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程及其系数进行F显著性检验。
一次模型加上交叉项模型:
Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1*X2+A7*X1*X3+A8*X1*X4+A9*X1*X5+A10*X2*X3+A11*X2*X4+A12*X2*X5+A13*X3*X4+A14*X3*X5+A15*X4*X5
参数:
N=16,M=10,B1=5,T2=1
>回归分析结果:
I=1B=3.89295774647887F=39453.829110832
I=2B=-9.50704225352109E-02F=376.478873266637
I=3B=.023*********F=65708.1591596774
I=4B=-6.60140845070422F=113449.605172517
I=5B=2.83239436619718F=83540.5277055669
I=8B=-.754866310160428F=56931.8445755423
I=10B=-3.87700534759358E-02F=2400.11415542456
I=12B=9.54545454545455E-02F=3904.68750028214
剔除F2
剔除后保留的6个变量项:
回归分析结果:
I=1B=3.82584921292461F=42.4793566222967
I=3B=5.16561723280862F=87.1202672010196
I=4B=-6.45973487986744F=136.239845488711
I=5B=2.79884009942005F=90.9365341824574
I=8B=-.682283105022831F=64.3454168594943
I=12B=.143607305936073F=16.2893368976606
BO=557.203196347032F=73.3441801574753R=.996608742535172S=9.95102629716467FO=1.54
JYY*Y-Y*A/%
1527520.3719588549296.628041145070821.25769281690148
2453459.688956732606-6.68895673260624-1.47659089020005
3481484.602297102518-3.60229710251843-.748918316531899
4462452.6685657863389.331434213662362.01979095533817
5614619.295396337196-5.29539633719594-.862442400194778
6557 563.339306859151-6.33930685915118-1.13811613270219
7682 676.0985575013345.90144249866648.865314149364587
8562 561.575785089262 .4242149107375337.54830802024079E-02
9556557.76766427196-1.76766427196003-.317925228769789
10538536.5915114647051.40848853529451.261800842991544
>回归方程:
Y*=557.203196347032+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.45973487986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.682283105022831)*(X3-30)*(X4-45)+(.143607305936073)*(X1-25)*(X5-140)
II、对方程各项进行F检验
f1=1,f2=M-2=10-2=8
F12=16.289>F1,8(0.01)=11.3∴方程各项通过α=0.01的F检验。
III、对整个方程(或者总方程)进行F检验
f1=N*-1=6,f2=M-N*=10-6=4
F=73.34>F6,4(0.01)=15.2,∴总的方程通过α=0.01的F检验。
3、二次全模型(一次项,二次项加上交叉项)建模,如有不显著须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程其系数进行F显著性检验。
二次全模型(一次项,二次项加上交叉项)建模:
Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1^2+A7*X2^2+A8*X3^2+A9*X4^2+A10*X5^2+A11*X1*X2+A12*X1*X3+A13*X1*X4+A14*X1*X5+A15*X2*X3+A16*X2*X4+A17*X2*X5+A18*X3*X4+A19*X3*X5+A20*X4*X5
参数:
N=21,M=10,B1=5,T2=2
剔除后保留的6个变量项:
>回归分析结果:
I=1B=3.82584921292461F=86.7697973506949
I=3B=5.16561723280862F=177.954859283416
I=4B=-6.45973487986744F=278.288202179139
I=5B=2.79884009942005F=185.750097699096
I=10B=-.131********0704F=36.4010641102972
I=13B=-1.20464788732394F=151.811777236324
BO=581.62676056338F=150.336666495772R=.99834120225772S=6.96261766428546FO=1.54
JYY*Y-Y*A/%
1527520.7564208782116.243579121789371.18473987130728
2453459.164871582436-6.16487158243575-1.3608988040697
3481482.907622203811-1.90762220381117-.396595052767395
4462456.7216238608125.278376139188031.14250565783291
5614617.076636288318-3.07663628831824-.501080828716326
6557561.120546810273-4.12054681027348-.739775010821092
7682680.1516155758081.8483844241922.271024109119092
8562559.8811101905552.11888980944468.377026656484819
9556557.24357912179-1.24357912178971-.223665309674408
10538536.9759734879871.02402651201317.190339500374194
>回归方程:
Y*=581.62676056338+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.45973487986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.131901408450704)*(X5-140)^2+(-1.20464788732394)*(X3-30)*(X4-45)
II、对方程各项进行F检验
f1=1,f2=M-2=10-2=8
F10=36.40>F1,8(0.01)=11.3∴方程各项通过α=0.01的F检验。
III、对整个方程(或者总方程)进行F检验
f1=N*-1=6,f2=M-N*=10-6=4
F=41.05093>F6,4(0.01)=15.2,∴总的方程通过α=0.01的F检验。
三、优化计算寻优(10分/每小项,其20分)
一个试验的试验范围及所得的数学模型(回归方程)如下:
Y=90.7893-4.6267E-02*(X1-30)-0.8373*(X2-3)+5.2768E-05*(X3-800)^2
-5.2094E-03*(X2-3)*(X3-800)
X1:
20~40;X2:
2.0~4.0;X3:
700~900,实验得到的最大值为Y=90.2
1、用网格优化法寻优求Y的最大值,给出相应的程序及优化结果
程序:
10INPUT"ZM=";ZM
20INPUT"G=";G
30S1=(40-20)/G:
S2=(4-2)/G:
S3=(900-700)/G
40FORX1=20TO40+S1/2STEPS1
50FORX2=2TO4+S2/2STEPS2
60FORX3=700TO900+S3/2STEPS3
70Y1=90.7893-4.6267E-02*(X1-30)-0.8373*(X2-3)+5.2768E-05*(X3-800)^2
80Y2=(-5.2094E-03)*(X2-3)*(X3-800)
90Y=Y1+Y2
100IFY 110IFY>ZMTHENZM=Y 120PRINTTAB (1)"X1=";X1;TAB(16)"X2=";X2;TAB(31)"X3=";X3; 130PRINTTAB(46)"Y=";ZM 140NEXTX3,X2,X1 150END 结果: RUN ZM=? 90.2 G=? 20 X1=20X2=2X3=700Y=92.09601 X1=20X2=2X3=810Y=92.14664 X1=20X2=2X3=820Y=92.21457 X1=20X2=2X3=830Y=92.29304 X1=20X2=2X3=840Y=92.38208 X1=20X2=2X3=850Y=92.48166 X1=20X2=2X3=860Y=92.5918 X1=20X2=2X3=870Y=92.71249 X1=20X2=2X3=880Y=92.84374 X1=20X2=2X3=890Y=92.98554 X1=20X2=2X3=900Y=93.13789 2、用蒙特卡罗优化法寻优求Y的最大值,给出相应的程序及优化结果 程序: 10INPUT"ZM=";ZM 20INPUT"N=";N 30G=20*N 35S1=(40-20)/N: S2=(4-2)/N: S3=(900-700)/N 40FORI=1TOG 50A1=INT(N*RND (1)) 60A2=INT(N*RND (1)) 70A3=INT(N*RND (1)) 90X1=20+A1*S1 100X2=2+A2*S2 110X3=700+A3*S3 120Y1=90.7893-4.6267E-02*(X1-30)-0.8373*(X2-3)+5.2768E-05*(X3-800)^2 130Y2=(-5.2094E-03)*(X2-3)*(X3-800) 140Y=Y1+Y2 150IFY 160IFY>ZMTHENZM=Y 170PRINTTAB (1)"X1=";X1;TAB(16)"X2=";X2;TAB(31)"X3=";X3; 180PRINTTAB(46)"Y=";ZM 190NEXTI 200PRINTTAB (1)"S1=";S1;TAB(16)"S2=";S2;TAB(32)"S3=";S3 210END 结果: RUN ZM=? 90.2 N=? 2000 X1=22.42X2=3.303X3=873.7Y=91.05659 X1=29.8X2=2.909X3=721.4Y=91.16348 X1=39.42X2=2.641X3=891.2Y=91.26351 X1=28.51X2=2.11X3=853.6Y=92.00355 X1=29.73X2=2.334X3=898Y=92.20621 X1=21.98X2=2.214X3=879.5Y=92.47751 X1=21.75X2=2.177X3=884.9Y=92.60446 X1=22.48X2=2.103X3=888.6Y=92.71652 X1=23.5X2=2.052X3=890Y=92.75568 X1=22.59X2=2.06X3=892.6Y=92.82512 X1=21.96X2=2.08X3=899.4Y=92.92936 X1=23.26X2=2.03X3=899.1Y=92.93231 X1=20X2=2.026X3=895.4Y=93.0318 X1=20.47X2=2.033X3=898.5Y=93.04806 X1=20.16X2=2.037X3=899.5Y=93.07246 S1=.01S2=.001S3=.1 四、配方均匀设计(7.5分/每小项,其15分) 1、一个饲料的配方由四种主要的成分组成,根据试验条件的允许和精度的要求,需要选择UM14(144)表来安排试验,请用相应的软件生成该配方试验方案表。 3750DATA1,2,3,4,5,6,7,8,9,10,11,12,13,14 3760DATA4,8,12,1,5,9,13,2,6,10,14,3,7,11 3770DATA7,14,6,13,5,12,4,11,3,10,2,9,1,8 结果: RUN N,S? 14,4 G1=1RESTRICTEDMUD? G1=? 0 MU14(14^4) ------------------------------------------------------------------ NO.X1X2X3X4 ------------------------------------------------------------------ 1.6706831.16465848.820988E-027.644855E-02 2.5250429.12732411.241547E-02.3352175 3.43687615.274952E-02.3098702.2005042 4.3700395.51090921.275551E-02.1062959 5.3149933.2966445.2635316.1248307 6.2676059.1617172.1019066.4687704 7.22566584.265714E-02.5487578.1829193 8.1878347.54632186.646088E-02.1993826 9.1532336.3160275.43596429.477481E-02 10.1212504.1548758.2326738.4912001 119.143972E-021.637173E-02.79659699.559164E-02 126.346667E-02.5407758.1554762.2402814 133.707165E-02.3068033.63269212.343304E-02 141.204932E-02.1323603.3972384.458352 ------------------------------------------------------------------ 2、一配方有三个成分,这三个成分的范围如下: 0.6≤X1≤0.86,0.10≤X2≤0.25,0.05≤X3≤0.16,X1+X2+X3=1 根据试验的要求,请26水平的均匀设计表去生成相应的试验方案表。 RUN N,S? 26,3 G1=1RESTRICTEDMUD? G1=? 1 MU14(14^3) --------------------------------------------------- NO.X1X2X3 --------------------------------------------------- 1.8037859.13134166.487258E-02 2.777964.12946639.256974E-02 3.7661197.18077295.310744E-02 4.754847.1217908.1233623 5.7440704.17573088.019886E-02 6.7337295.1093048.1569657 7.7237755.1658301.1103945 8.7141679.22586095.997118E-02 9.704873.151711.143416 10.6958619.21408149.005668E-02 11.6785969.1984997.1229034 12.6622131.1794701.1583168 13.6543123.2492949.639369E-02 14.6390291.2291667.1318042 --------------------------------------------------- 五、用方程绘图(7.5分/每小项,其15分)(图形要求打印出来) 已知有一试验的试验范围为: X1: 1.0-4.0,X3: 1.0-3.5,得到的方程及最佳参数如下 Y=0.078+0.226*X3-0.168*X3^2+0.136*X1*X3 X1=4;X3=2.2903时有最优值Y=0.9603 1、绘出反映Y与X3关系的曲线图 Y=0.078+0.77*X3-0.168*X3^2 2、绘出Y分别为0.96,0.94,0.92,0.90,0.88时的X1,X3交互作用的Y值等高线图 X1=(Y-0.078-0.226*X3+0.168*X3^2)/(0.136*X3) Y=0.96,0.94,0.92,0.90,0.88 Y-0.078=0.882,0.862,0.842,0.822,0.802
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 课程设计