实验二 数据预处理及时序图绘制.docx
- 文档编号:6924364
- 上传时间:2023-01-12
- 格式:DOCX
- 页数:12
- 大小:339.99KB
实验二 数据预处理及时序图绘制.docx
《实验二 数据预处理及时序图绘制.docx》由会员分享,可在线阅读,更多相关《实验二 数据预处理及时序图绘制.docx(12页珍藏版)》请在冰豆网上搜索。
实验二数据预处理及时序图绘制
实验二数据预处理及时序图绘制
一、实验目的:
了解GPLOT过程的使用,利用GPLOT绘制时序图并对时序图进行分析。
了解ARIMA过程的使用,利用ARIMA进行平稳性分析及纯随机性检验。
二、实验内容
(1)Gplot过程
生成高分辨率图形的PROCGPLOT过程的一般使用格式如下:
PorcGplotDATA=数据集;
Plot纵坐标变量Y*横坐标变量X……选项列表>;
Symboln<选项列表>;
Axisn<选项列表>;
Run;
使用PROCGPLOT过程和PROCPLOT过程的区别是,对于PROCGPLOT语句,PROCPLOT语句中的VPCT和HPCT等选项不可使用。
两者的PLOT语句使用方法基本相同。
最主要的区别是,在PROCGPLOT过程中,可使用SYMBOLn语句和AXISn语句。
SYMBOLn语句的主要作用:
可以定义数据点的符号,可以定义数据点之间的连接方式,可以定义数据点和线的颜色。
SYMBOLn语句的n取值范围从1到99,缺省值是1,n代表Y*X两个变量形成数据连线的系列数。
一些主要选项如下:
V=数据点图形符号——数据点的符号有NONE(没有)、PLUS(缺省值加号)、STAR(星号)、SQUAR(小方块)、DIAMOND(小菱形)、TRANGLE(三角形)、CIRCLE(小圆圈)。
I=数据点间连接方式——常用的连接有NONE(没有)、JOIN(直线)、SPLINE(平滑)、NEEDLE(从数据点到横坐标画垂直线)、HILOC(最高、最低、收盘价)、RL(直线回归线)、BOX25(盒形线)。
W=连线的线宽——例如,w=5。
H=图形符号的高度——例如,h=2.5。
L=定义连线的类型——例如,l=2。
C=定义颜色——例如,c=red。
FONT=定义一种字体——例如,font=swissb。
SYMBOLn语句所定义的各种选项,由于数量众多,用户一般很难记忆,我们上面所列出的仅仅是一小部分。
通常可以在命令输入框中发布SYMBOL命令,调出SYMBOL窗口,在选项参数的横线上键入?
后,在参数对话框中选择参数。
共有14项参数选项,每项中还有许多参数值。
一个SYMBOLn语句一旦被定义就一直保持有效,直到重新定义或者退出SAS系统。
执行一个不带任何选项的SYMBOLn语句将取消SYMBOLn的全部定义,并不影响其他的SYMBOL语句。
如果想要取消所有的SYMBOL语句定义,提交下面的语句:
goptionsreset=symbol;
题目一(P33.第二题)
2.1975-1980年夏威夷岛莫那罗亚火山(Maunaloa)每月释放的
数据如下(单位:
ppm),见表2-7.
330.45
330.97
331.64
332.87
333.61
333.55
331.9
330.05
328.58
328.31
329.41
330.63
331.63
332.46
333.36
334.45
334.82
334.32
333.05
330.87
329.24
328.87
330.18
331.5
332.81
333.23
334.55
335.82
336.44
335.99
334.65
332.41
331.32
330.73
332.05
333.53
334.66
335.07
336.33
337.39
337.65
337.57
336.25
334.39
332.44
332.25
333.59
334.76
335.89
336.44
337.63
338.54
339.06
338.95
337.41
335.71
333.68
333.69
335.05
336.53
337.81
338.16
339.88
340.57
341.19
340.87
339.25
337.19
335.49
336.63
337.74
338.36
解答:
(1)绘制序列时序图,并判断该系列是否平稳。
结论:
从时序图给我们的提供的信息可以非常明确的看到,夏威夷岛莫那罗亚火山(Maunaloa)每月释放的
时间序列图有明显的递增趋势,所以它不是平稳序列。
(2)计算该序列的样本自相关系数
(3)绘制该样本自相关图,并解释该图形。
结论:
从自相关图中可以看出,它显示序列子相关系数长期位于零轴的一边,这是具有单调趋势序列的典型特征,同时自相关图呈现出明显的正弦波动规律,这是具有周期变化规律的非平稳序列的典型特征。
自相关图显示出来的这两个性质和该序列时序图显示的带长期递增趋势的周期性质是非常吻合的。
题目二(P34.第三题)
3.1945-1950年费城月度降雨量数据如下(单位:
mm)
69.3
80
40.9
74.9
84.6
101.1
225
95.3
100.6
48.3
144.5
28.3
38.4
52.3
68.6
37.1
148.6
218.7
131.6
112.8
81.8
31
47.5
70.1
96.8
61.5
55.6
171.7
220.5
119.4
63.2
181.6
73.9
64.8
166.9
48
137.7
80.5
105.2
89.9
174.8
124
86.4
136.9
31.5
35.3
112.3
43
160.8
97
80.5
62.5
158.2
7.6
165.9
106.7
92.2
63.2
26.2
77
52.3
105.4
144.3
49.5
116.1
54.1
148.6
159.3
85.3
67.3
112.8
59.4
(1)计算该序列的样本自相关系数
dataH2;
inputprice@@;
time=intnx('month','01jan1945'd,_n_-1);
formattimeyymmdd10.;
cards;
69.38040.974.984.6101.122595.3100.648.3144.528.3
38.452.368.637.1148.6218.7131.6112.881.83147.570.1
96.861.555.6171.7220.5119.463.2181.673.964.8166.948
137.780.5105.289.9174.812486.4136.931.535.3112.343
160.89780.562.5158.27.6165.9106.792.263.226.277
52.3105.4144.349.5116.154.1148.6159.385.367.3112.859.4
;
procarimadata=H2;
identifyvar=price;
run;
(2)判断该序列的平稳性
dataH1
inputprice@@;
time=intnx('month','1jan1945'd,_n_-1);
formattimeyymmdd10.;
cards;
69.380.040.974.984.6101.1225.095.3100.648.3144.528.3
38.452.368.637.1148.6218.7131.6112.881.831.047.570.1
96.861.555.6171.7220.5119.463.2181.673.964.8166.948.0
137.780.5105.289.9174.8124.086.4136.931.535.3112.343.0
160.897.080.562.5158.27.6165.9106.792.263.226.277.0
52.3105.4144.349.5116.154.1148.6159.385.367.3112.859.4
;
procgplotdata=H2;
plotprice*time=1;
symbol1c=blackv=stari=join;
run;
该序列的时序图如上,图上可以看出该序列在一个常值附近上下波动,且不具有周期性,判断该序列为平稳序列。
(3)
题目三(P34第五题)
5表2-9数据是某公司在2000-2003年期间每月的销售量。
销售量
2000年
2001年
2002年
2003年
1月
153
134
145
117
2月
187
175
203
178
3月
234
243
189
149
4月
212
227
214
178
5月
300
298
295
248
6月
221
256
220
202
7月
201
237
231
162
8月
175
165
174
135
9月
123
124
119
120
10月
104
106
85
96
11月
85
87
67
90
12月
78
74
75
63
(1)绘制该序列时序图及样本自相关图
dataH3;
inputsell@@;
time=intnx('month','1jan2000'd,_n_-1);
formattimemonyy.;
cards;
1531872342123002212011751231048578
1341752432272982562371651241068774
145203189214295220231174119856775
117178149178248202162135120969063
;
procgplotdata=H3;
plotsell*time;
symbolc=redv=stari=join;
run;
自相关图:
(2)序列在一个常值附近上下波动,但据周期性,因此判定该序列为不平稳序列。
(3)
从上可知,该序列不是纯随机序列。
题目四(P35第六题)
6.1969年1月至1973年9月在芝加哥海德公园内每28天发生的抢包案件表如下
10
15
10
10
12
10
7
7
10
14
8
17
14
18
3
9
11
10
6
12
14
10
25
29
33
33
12
19
16
19
19
12
34
15
36
29
26
21
17
19
13
20
24
12
6
14
6
12
9
11
17
12
8
14
14
12
5
8
10
3
16
8
8
7
12
6
10
8
10
5
解答:
(1)
dataH4;
inputcase@@;
time=intnx('month','1jan1969'd,_n_-1);
formattimemonyy.;
cards;
101510101210771014817
141839111061214102529
333312191619191234153629
2621171913202412614612
9111712814141258103
16887126108105
;
procgplotdata=H4;
plotcase*time;
symbolc=redv=stari=join;
run;
从上图可知,该序列平稳。
从上表可知,该序列不是纯随机序列。
(2)
dataH5;
inputcase@@;
time=intnx('month','1jan1969'd,_n_-1);
formattimemonyy.;
cards;
5-502-2-3034-69-3
4-152-1-462-41544
0-217-330-722-921-7-3
-5-42-674-12-68-86-3
26-5-460-2-732-713
-80-15-64-22-5
;
procgplotdata=H5;
plotcase*time;
symbolc=redv=stari=join;
run;
从时序图可得,该序列并不明显的趋势性及周期性,为平稳序列。
有上表可得,该序列为纯随机序列。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验二 数据预处理及时序图绘制 实验 数据 预处理 时序 绘制