数学建模B作业非参数统计灰色系统时间序列分析010综述.docx
- 文档编号:27475919
- 上传时间:2023-07-01
- 格式:DOCX
- 页数:19
- 大小:166.99KB
数学建模B作业非参数统计灰色系统时间序列分析010综述.docx
《数学建模B作业非参数统计灰色系统时间序列分析010综述.docx》由会员分享,可在线阅读,更多相关《数学建模B作业非参数统计灰色系统时间序列分析010综述.docx(19页珍藏版)》请在冰豆网上搜索。
数学建模B作业非参数统计灰色系统时间序列分析010综述
2014年数学建模B作业:
非参、灰色、时间序列分析
非参数统计
Ⅴ-1某制造商想要比较两种不同的生产方法所花费的生产时间是否有差异。
随机地选取了11个工人,每一个工人都分别使用两种不同的生产方法来完成一项相同的任务,在样本中的每一个工人都做了观察。
数据见表,试用Wilcoxon秩和检验这两种方法有无差异?
工人编号
1
2
3
4
5
6
7
8
9
10
11
方法1
10.2
9.6
9.2
10.6
9.9
10.2
10.6
10.0
11.2
10.7
10.6
方法2
9.5
9.8
8.8
10.1
10.3
9.3
10.5
10.0
10.6
10.2
9.8
解:
提出原假设,这两组方法没有显著性差异,用配对实验的符号检验法,相应代码如下:
dataex;
inputx1x2@@;
y=x1-x2;
cards;
10.29.5
9.69.8
9.28.8
10.610.1
9.910.3
10.29.3
10.610.5
1010
11.210.6
10.710.2
10.69.8
;
procunivariate;
vary;
run;
运行结果如下:
从结果中可以看出,sign统计量为3,其显著性为0.1094,大于0.05,故接受原假设,认为这两组方法没有显著性差异。
Ⅴ-2为培训大学生志愿者为社区服务,设计了4种培训方案,记作为A,B,C,D.将报名的30名大学生随机地分为4组,分别接受不同培训。
训练一周后,按规定的要求考试,评定的成绩如下,试用非参数检验方法检验这四种培训方案的有效性是否存在显著差异?
培训方案A
60,75,62,76,73,98,86
培训方案B
72,52,68,82,74,64,87
培训方案C
61,85,78,66,70,59,69,79
培训方案D
63,58,65,71,84,77,80,89
解:
提出原假设,这四种培训方案方法没有显著性差异,相应代码如下:
dataex;
doa=1to4;inputn@@;
doi=1ton;
inputx@@;
output;end;end;
cards;
760756276739886
772526882746487
86185786670596979
86358657184778089
;
procnpar1waywilcoxon;classa;varx;
run;
运行结果如下:
从结果中可以看出,Chi-Square统计量为0.5537,其显著性为0.9069,大于0.05,故接受原假设,认为四种培训方案方法没有显著性差异。
Ⅴ-3双胞胎智力的相关分析
某研究所对10对双胞胎儿童的智力进行调查,试计算其Pearson、Spearman和Kendall相关系数并对其进行相关性检验。
双胞胎编号
先出生儿童X
后出生儿童Y
1
9.0
7.8
2
16.6
19.3
3
16.2
20.1
4
11.3
7.1
5
16.2
13.0
6
7.1
4.8
7
7.8
8.9
8
4.0
7.4
9
11.2
10.0
10
1.3
1.5
解:
求其Pearson,Spearman和Kendall相关系数,代码如下:
DATAnew;
INPUTxy@@;
CARDS;
9.07.8
16.619.3
16.220.1
11.37.1
16.213.0
7.14.8
7.88.9
4.07.4
11.210.0
1.31.5
;
PROCCORRpearsonspearmankendall;
VARxy;
RUN;
结果如下:
PearsonCorrelationCoefficients,N=10
Prob>|r|underH0:
Rho=0
xy
x1.000000.88081
0.0008
y0.880811.00000
0.0008
SpearmanCorrelationCoefficients,N=10
Prob>|r|underH0:
Rho=0
xy
x1.000000.82067
0.0036
y0.820671.00000
0.0036
KendallTaubCorrelationCoefficients,N=10
Prob>|r|underH0:
Rho=0
xy
x1.000000.67420
0.0071
y0.674201.00000
0.0071
可见,x与y的Pearson相关系数为0.88081,概率为0.0008,达到极显著水平;Spearman相关系数为0.82067,概率为0.0036,达到极显著水平;Kendall相关系数0.67420,概率为0.0071达到极显著水平;故,x与y显著相关。
灰色系统作业:
Ⅴ-4陕西省农业总产值数据如下:
已知下表数据
年份
1985
1986
1987
1888
1989
1990
1991
1992
1993
1994
总产值
62.9
58.8
61.4
87.2
104.9
124.8
110.7
129.0
155.3
219.03
请建立灰色系统GM(1,1)模型,并预测1995-1997三年的农业总产值。
解:
有原始时间1985-1994序列
,对
生成1-AGO序列
另外可得Yn见表:
、1-AGO序列
、Yn
k
1
2
3
4
5
6
7
8
9
10
62.9
58.8
61.4
87.2
104.9
124.8
110.7
129
155.3
219.03
62.9
121.7
183.1
270.3
375.2
500
610.7
739.7
895
1114.03
Yn
58.8
61.4
87.2
104.9
124.8
110.7
129
155.3
219.03
利用MATLAB编程得:
function[X,c,error1,error2]=example9_11()
%利用MATLAB编程预测2003年中国蔬菜产量,
%并对预测结果做残差检验和后验差检验,程序如下:
X0=[62.958.861.487.2104.9124.8110.7129.0155.3219.03
];
k=3;
[X,c,error1,error2]=GM11(X0,k)
plot(1985:
1994,X0,'g*-')
holdon
plot(1985:
1997,X)
%%
function[X,c,error1,error2]=GM11(X0,k)
%建立函数[X,c,error1,error2]=example9_3_2_3(X0,k)
%其中X0为输入序列,k为预测长度,
%X为预测输出序列,c为后验差检验数,error1为残差,error2为相对误差
formatlong;
n=length(X0);
X1=[];
X1
(1)=X0
(1);
fori=2:
n
X1(i)=X1(i-1)+X0(i);%计算累加生成序列
end
fori=1:
n-1
B(i,1)=-0.5*(X1(i)+X1(i+1));%计算B,Yn
B(i,2)=1;
Y(i)=X0(i+1);
end
alpha=(B'*B)^(-1)*B'*Y';%做最小二乘估计
a=alpha(1,1);
b=alpha(2,1);
d=b/a;%计算时间响应函数参数
c=X1
(1)-d;
X2
(1)=X0
(1);
X
(1)=X0
(1);
fori=1:
n-1
X2(i+1)=c*exp(-a*i)+d;
X(i+1)=X2(i+1)-X2(i);%计算预测序列
end
fori=(n+1):
(n+k)
X2(i)=c*exp(-a*(i-1))+d;%计算预测序列
X(i)=X2(i)-X2(i-1);
end
fori=1:
n
error(i)=X(i)-X0(i);
error1(i)=abs(error(i));%计算残差
error2(i)=error1(i)/X0(i);%计算相对误差
end
c=std(error1)/std(X0);%计算后验差检验数
运行结果见表格:
年份
1985
1986
1987
1888
1989
1990
1991
1992
1993
1994
1995
1996
1997
总产值
62.9
58.8
61.4
87.2
104.9
124.8
110.7
129
155.3
219.03
预测值
62.9
58.58326
68.15687
79.29499
92.25329
107.3292
124.8688
145.2748
169.0154
196.6357
228.7697
266.155
309.6498
残差
0
0.216
6.756
7.905
12.64
17.47
14.16
16.27
13.71
22.39
相对误差
0
0.003
0.110
0.090
0.120
0.139
0.127
0.126
0.088
0.102
画出预测与实际值变化曲线,如图所示:
预测与实际值变化曲线
实验模型以及结果检验:
由表与图的结果可见,预测值与实际值偏离不大,其后验残差检验数C=0.1475小于0.35,所以模型精度为优。
时间序列分析作业
Ⅴ-5某车站1993-1997年各月的列车运行数量数据如下表,试用时间序列建立合适的模型。
并预测1998年1月的数值
1196.81181.31222.61229.31221.51148.41250.21174.41234.51209.7
1206.51204.01234.11146.01304.91221.91244.11194.41281.51277.3
1238.91267.51200.91245.51249.91220.11267.41182.31221.71178.1
1261.61274.51196.41222.61174.71212.61215.01191.01179.01224.0
1183.01288.01274.01218.01263.01205.01210.01243.01266.01200.0
1306.01209.01248.01208.01231.01244.01296.01221.01287.01191.0
解:
(1)首先进行平稳性检验:
dataa;/*a为数据名*/
inputlieche@@;/*lieche为变量名*/
month=intnx('month','1jan1993'd,_n_-1);/*intnx间隔取时间变量*/
formatmonthdate.;/*月按?
?
?
?
*/
cards;
1196.81181.31222.61229.31221.51148.41250.21174.41234.51209.7
1206.51204.01234.11146.01304.91221.91244.11194.41281.51277.3
1238.91267.51200.91245.51249.91220.11267.41182.31221.71178.1
1261.61274.51196.41222.61174.71212.61215.01191.01179.01224.0
1183.01288.01274.01218.01263.01205.01210.01243.01266.01200.0
1306.01209.01248.01208.01231.01244.01296.01221.01287.01191.0
;
run;
procgplot;/*画图*/
plotlieche*month;/*纵轴为lieche,横轴为mouth*/
symbolv=squarei=joinc=red;/*图形特征,v表示点的形状,i表示图形连线的情况,c代表颜色*/
procarimadata=a;/*调用arima模块*/
identifyvar=liechenlag=22;/*延迟阶数为22阶*/
run;
运行得自相关图:
由此自相关图可看出,自相关系数很快的衰减向0,且始终控制在2倍范围内,可以认为该序列为平稳序列。
时序图:
由图可知,此车站列车运行数量数据在一个常数值附近随机波动,而且波动范围有界,无明显趋势及周期特征,基本可以视序列为平稳序列。
(2)进行随机性检验:
选取结果中TheARIMAProcedure部分:
由于统计量P值均大于0.05,则认为在0.05的显著水平下,无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定,因而认为此车站列车运行数量为纯随机波动序列,各序列之间没有任何行相关关系,即为无记忆序列,也就是说,该车站列车运行数量前后两年并无大的联系,也就是实说,我们很难根据历史信息预测未来年份此车站列车运行数量,故,该平稳序列不值得继续分析下去,对该序列分析到此结束。
Ⅴ-6对我国1952-1994年的社会消费品零售总额数据建立合适的时间序列模型,并预测1995-1997年的数据。
社会消费品零售总额
1952
262.7
328.8
356.1
1955
364.0
424.0
441.6
481.2
556.5
1960
595.4
537.7
543.7
544.8
572.7
1965
590.1
632.8
679.1
649.2
698.2
1970
728.8
776.9
853.5
917.7
967.4
1975
1046.4
1099.0
1174.3
1264.9
1476.0
1980
1794.0
2002.5
2181.5
2426.1
2899.2
1985
3801.4
4374.0
5115.0
6534.6
7074.2
1990
7250.3
8245.7
9704.8
12462.1
16264.7
解:
(1)首先进行平稳性检验:
dataa;/*a为数据名*/
inputxf@@;/*xf为变量名*/
year=intnx('year','1jan1952'd,_n_-1);/*intnx间隔取时间变量*/
formatyearyear4.;/*年按四位数显示*/
cards;
262.7328.8356.1
364.0424.0441.6481.2556.5
595.4537.7543.7544.8572.7
590.1632.8679.1649.2698.2
728.8776.9853.5917.7967.4
1046.41099.01174.31264.91476.0
1794.02002.52181.52426.12899.2
3801.44374.05115.06534.67074.2
7250.38245.79704.812462.116264.7
;
run;
procgplot;/*画图*/
plotxf*year;
symbolv=squarei=joinc=red;/*图形特征,v表示点的形状,i表示图形连线的情况,c代表颜色*/
procarimadata=a;/*调用arima模块*/
identifyvar=xfnlag=22;/*延迟阶数为22阶*/
run;
首先分析时序图:
由时序图可得,该时间序列显著递增,初步判断此序列不平稳。
再分析自相关图:
由自相关图中,自相关系数从正数缓慢递减为到零后,又不断在负值范围内增大,该序列自相关系数并未较快的衰减为零,因此该序列并非为平稳时间序列。
(2)随机性检验:
选取结果中TheARIMAProcedure部分:
从运行结果得出,次统计量的P值均小于0.0001,则认为在0.05的显著水平下拒绝原假设,可以认为此序列为非随机序列。
这说明我们可以根据历史是信息预测未来年份我国的社会消费品零售总额。
(3)模型选取
原序列自相关系数拖尾,偏自相关系数一阶截尾,根据ARMA模型相关性特征表,应该选取AR
(1)模型。
首先对其进行一阶差分:
dataa;/*a为数据名*/
inputxf@@;/*lieche为变量名*/
year=intnx('year','1jan1952'd,_n_-1);/*intnx间隔取时间变量*/
formatyearyear4.;/*年按四位数显示*/
dif1=dif(xf);
cards;
262.7328.8356.1
364.0424.0441.6481.2556.5
595.4537.7543.7544.8572.7
590.1632.8679.1649.2698.2
728.8776.9853.5917.7967.4
1046.41099.01174.31264.91476.0
1794.02002.52181.52426.12899.2
3801.44374.05115.06534.67074.2
7250.38245.79704.812462.116264.7
;
run;
procgplot;/*画图*/
plotdif1*year;
symbolv=squarei=joinc=red;/*图形特征,v表示点的形状,i表示图形连线的情况,c代表颜色*/
procarimadata=a;/*调用arima模块*/
identifyvar=xf;
procarimadata=a;/*调用arima模块*/
identifyvar=dif1;
run;
得到时序图如下:
又该图可以简单看出差分后,数据在某个数据间波动,范围有界,无明显趋势及周期性特征,初步判断一阶差分后序列平稳。
(4)模型建立:
选取AR
(1)摸型
dataa;/*aΪÊý¾ÝÃû*/
inputxf@@;
year=intnx('year','1jan1952'd,_n_-1);/*intnx¼ä¸ôȡʱ¼ä±äÁ¿*/
formatyearyear4.;/*Äê°´ËÄλÊýÏÔʾ*/
dif1=dif(xf);
cards;
262.7328.8356.1
364.0424.0441.6481.2556.5
595.4537.7543.7544.8572.7
590.1632.8679.1649.2698.2
728.8776.9853.5917.7967.4
1046.41099.01174.31264.91476.0
1794.02002.52181.52426.12899.2
3801.44374.05115.06534.67074.2
7250.38245.79704.812462.116264.7
;
run;
procarima;
identifyvar=dif1;
estimatep=1noint;
forecastlead=3id=yearout=out;
procgplotdata=out;
plotdif1*year=1forecast*year=2l95*year=3u95*year=3/overlay;
symbol1c=blacki=nonev=star;
symbol2c=redi=joinv=none;
symbol3c=greeni=joinv=none;
run;
原序列为非白噪声序列;
再对得到残差序列的白噪声声结果为:
从而,残差为白噪声序列,因此,得到模型。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 作业 参数 统计 灰色 系统 时间 序列 分析 010 综述