云愁绪.docx
- 文档编号:3536990
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:35
- 大小:265.57KB
云愁绪.docx
《云愁绪.docx》由会员分享,可在线阅读,更多相关《云愁绪.docx(35页珍藏版)》请在冰豆网上搜索。
云愁绪
第9章统计预测与决策
学习要点:
统计预测概念及分类、时间数列预测法和回归预测法的内容、统计决策的三要素、风险型决策与完全不确定型决策的方法。
第1节统计预测的分类
一、统计预测的分类
统计预测的种类很多,可以从不同的角度进行分类。
1.按预测对象的表现形式不同,统计预测可以分为定性预测和定量预测。
定性预测是指预测者以统计资料为依据,根据已知资料,凭借个人的工作经验和分析能力,对事物的未来发展情况做出判断。
定量预测则着重对事物的数量方面进行预测。
它是预测者根据预测事物的历史数据,运用统计方法进行科学的推算,以求得准确的预测结果。
大部分统计预测方法都属于定量预测。
2.按预测对象的范围大小,统计预测可以分为宏观预测和微观预测。
宏观预测是指对大系统总体的综合性预测。
微观预测是指对个别具体单位经营管理活动进行的预测。
3.按预测时距的长短,统计预测可以分为短期预测、中期预测和长期预测。
短期预测一般是指预测时距在二年以内的预测,适用于基层企业对日常业务问题进行的预测;中期预测一般是指2-5年的预测,适用于企业制定人员培训计划、银行借贷计划及编制国民经济计划等;长期预测一般是指5年以上的预测,它通常用于社会发展战略目标的预测。
4.按预测对象是否包含时间变动因素,统计预测可以分为动态预测和静态预测。
动态预测是根据预测对象随时间推移的发展变化规律而进行的预测。
静态预测是指在一定时间上,利用现象之间的因果关系,由一种现象变动去推断另一种现象的状况。
其中,动态预测是统计预测中的主要内容。
二、统计预测的程序
1.明确预测的目的。
预测目的的确定,关系到统计资料的搜集与整理,也关系到预测方法的选用。
2.搜集和整理资料。
在预测时,对于搜集到的资料需要进行审核和分析,对于不完全适用的资料要进行调整,对偶然事件的数据要加以排除。
3.选用预测方法。
在初步分析资料的基础上,选择适当的预测模型。
4.进行预测。
根据选用的预测方法进行数学模型中参数值的计算,使模型成为具体化的公式,据以进行预测。
5.预测误差的分析。
预测的结果与实际值不可能完全一致,总要有一定的误差,可以测定、分析、控制预测的误差。
三、统计预测的基本原则
1.掌握现象之间的联系。
在进行统计预测时,需要分析所研究的现象,找出现象的内在联系及最主要的数量关系。
2.依据现象的特点,选用适宜的预测方法。
客观现象发展变化的情况非常复杂,统计预测的方法也很多。
因此,在对客观现象变化情况进行实事求是的分析基础上,需要选用相应的预测模型和方法。
3.必须以丰富的实际统计资料作为统计预测的依据。
科学的统计预测是从实际出发,以确凿的实际材料为依据,并掌握事物内在联系,反映事物的发展变化规律。
否则,预测就没有可靠的基础,预测结果与实际值也将有较大的误差。
第2节统计预测的方法
统计预测的常用方法包括时间数列预测法和回归预测法两大类。
时间数列预测法就是以时间数列为依据,推测现象发展的未来状况。
回归预测法是通过表明两个或几个变量之间关系的回归方程式进行预测的方法。
一、移动平均法
移动平均法是以一个数列局部资料的平均数作为外推预测的依据,选择包括本期在内的n个时期的数值,把计算出的平均数作为下一个时期的预测数。
1.简单移动平均预测法。
如果认为n个时期数值对预测数是同等重要的,给予同样的权数,求得的平均数称为简单移动平均数。
这种以简单平均数作为下一时期预测数的方法称为简单移动平均预测法。
这里,时期个数n根据预测者的实践经验和分析加以确定,一般地n=3或n=5。
计算公式为:
式中,n为时期长度;
为下一期预测值;t代表本期;t-1代表上期;y为实际值。
例如,某油田2002年各月采油量见表8.1,用简单平均预测法进行预测,结果见表8.1。
表8.1
月份(t)
采油量(万吨)
三个月简单移动平均
三个月加权移动平均
1
45
—
—
2
47
—
—
3
46
—
—
4
54
46
46.17
5
45
49
50.17
6
48
48.3
48.17
7
44
49
48.00
8
39
45.7
45.50
9
38
43.7
42.17
10
36
40.3
39.33
11
38
37.7
37.17
12
47
37.3
37.33
如表中4月份采油量预测值是根据前三个月的采油量进行简单平均计算而得的:
2003年1月份的采油量为:
(36+38+47)÷3=40.3(万吨)
简单移动平均预测法的优点是计算简便,数学要求不高,适用于趋势变动不太明显的时间数列。
但是,这种预测方法将资料中的近期值与远期值同等看待,而实际上,在时间数列中近期数值对预测期影响较大,远期数值对预测期的影响较小,因而采用加权移动平均预测法比较切合实际。
2.加权移动平均预测法。
加权移动平均预测法就是根据距离预测期的远近,给几个时期的各个数值以不同的权数。
由于离预测期越近的数值对预测期的影响越大,所以给近期项数以较大的权数,远期项数以较小的权数,把求得的加权平均数作为下一期的预测数。
可以表示为:
式中,ft为第t期的权数,且ft>ft-1>…>ft-n+1。
在上例中,用加权移动平均预测法预测2003年1月份的采油量为:
当现象发展变化比较平稳时,用加权移动平均预测法进行预测比简单移动平均预测法更接近实际。
由于加权移动平均预测法计算比较繁琐,并且权数的确定缺乏客观依据,近年来已逐渐被指数平滑预测法所代替。
二、指数平滑预测法
指数平滑预测法是加权移动平均预测法的一种改良,应用十分广泛。
它所用的权数采取指数的形式,基本算式可简化为本期实际值与本期预测值的加权平均数,因此又称为“指数平滑移动平均法”。
其基本形式为:
式中,yt为第t期的实际值;α为平滑系数。
平滑系数α根据需要而设定,其值在0至1之间。
α值的大小直接影响着预测的结果。
当α值越小时,yt的权数越小,预测值主要取决于上期的预测值;反之,当α值越大时,预测值则主要取决于上期的实际值。
从选择的方法上看,应取预测误差较小的α值。
例如,以表8.1的资料为例,取α=0.2与α=0.7两个值,并假定一月份实际数为二月份的预测数,试利用指数平滑法预测各月的采油量。
表8.2
月份
采油量(万吨)yt
预测值
α=0.2
α=0.7
α=0.2
α=0.7
1
45
—
—
—
—
2
47
45
45
2
2
3
46
45.4
46.4
0.6
0.4
4
54
45.5
46.1
8.5
7.9
5
45
47.2
51.6
2.2
6.6
6
48
46.8
47.0
1.2
1.0
7
44
48.6
47.7
4.6
3.7
8
39
47.7
45.1
8.7
6.1
9
38
46.0
40.8
8
2.8
10
36
44.4
38.8
8.4
2.8
11
38
42.7
36.8
4.7
1.2
12
47
41.8
37.6
5.2
9.4
合计
—
—
—
54.1
43.9
α取值不同,预测的结果也不同。
α取值需要根据预测误差的大小来选择。
常用预测误差为平均绝对偏差(MAE)。
当α=0.2时,MAE=54.1/11=4.92;当α=0.7时,MAE=43.9/11=3.99。
因此,本例α=0.7的预测值更接近实际。
需要注意的是:
应用指数平滑法进行预测时,其初始值可以用上期实际数,也可以对上期实际数修正后加以确定。
这种预测方法在短期预测和中期预测中应用比较广泛。
三、三点预测法
通常,配合时间数列的趋势方程所包含的参数最多不超过三个。
这样,如果在时间数列原始数据中或经过修匀后的数据中找到三个数据点,就有可以配合各种预定的曲线。
三点预测法的设计思路就在于此。
三点预测法有以下几个要点:
第一,采用加权平均法,权数取简单整数;
第二,不用全部资料计算,只是从数列的头部、中部、尾部各取出三项或五项数据平均,权数由近到远分别为3、2、1或5、4、3、2、1;
第三,资料必须是奇数项,遇到偶数项时,要去掉最初的一个数据;
第四,总项数不能少于九项,若总项数在15项以上,则可采用5项平均式。
设n为时间数列总项数,R、S、T分别为初期、中期、近期的加权平均数,d为数列正中间位置,d=(n+1)/2。
所取的三点坐标值如下:
3项平均式:
5项平均式:
三点预测法用于测定直线趋势时,只需用首尾两点而不用中间点,直线趋势中的两个参数a与b可用下式计算:
3项平均式:
5项平均式:
例如,某管理局1986年至2002年采油量资料见表8.3,用三点预测法预测2003年的采油量。
计算过程如下:
配合的直线趋势方程式为:
预测2003年的采油量(t=18):
表8.3
年份
产量(万吨)
t
权数
1986
2094.5
1
1
1987
2143.9
2
2
1988
2256.7
3
3
1989
2306.6
4
4
1990
2367.8
5
5
1991
2465.9
6
—
1992
2529.7
7
1
1993
2678.3
8
2
1994
2773.7
9
3
1995
2849.4
10
4
1996
2885.5
11
5
1997
3016.8
12
—
1998
3117.7
13
1
1999
3192.8
14
2
2000
3326.6
15
3
2001
3471.1
16
4
2002
3657.2
17
5
四、分割平均预测法
分割平均预测法是把时间数列按其类型分成相等的部分,求出各部分平均数代入方程,求得趋势方程用于预测。
如果时间数列为直线型,则把数列分成相等的两部分(若为奇数项,则舍掉数列的首项),由每半个数列各求出一个平均数作为直线上的两个点,代入直线方程式联立求解,得出直线趋势方程;若时间数列属于抛物线型,由于抛物线方程中有三个待定参数,所以,要把数列分成三等分;若时间数列为指数曲线型,则把数列等分为两部分,然后将指数曲线化为对数直线求解。
1.直线型时间数列。
直线型时间数列的判断,可以通过作散布图进行观察,也可以从数量上进行分析。
当时间数列中现象的每期逐期增长量大致相同时,就可以认为是直线型,其方程为:
例如,某企业1997年至2002年产品销售产值资料如下,试配合直线方程并预测2004年的销售产值。
表8.4
年份
t
销售产值(万元)
逐期增长量(万元)
1997
1
162
—
1998
2
188
26
1999
3
216
28
2000
4
243
27
2001
5
269
26
2002
6
296
27
可以看出,各期逐期增长量大体相同,因此可以认为现象的变化趋势是直线型。
化简为:
解方程,求得b=26.867,a=134.96
配合的直线方程为:
预测2004年的销售产值(t=8)为:
2.指数曲线型时间数列。
当现象发展的各年环比增长速度大体相同时,则其发展趋势属于指数曲线型。
可以表示为:
在求待定参数a和b时,通常要把指数方程化为直线方程形式。
通过等式两边取对数的形式把
转化为:
令
,A=lga,B=lgb
则原方程化为:
例如,某企业1997-2002年某产品单位成本资料如下,试配合趋势方程并预测2004年的成本。
表8.5
年份
t
成本(元/吨)
环比增长速度(%)
y′=lgy
1997
1
24.4
—
1.3873
1998
2
26.9
10.2
1.4298
1999
3
29.6
10.0
1.4713
2000
4
31.9
10.7
1.5038
2001
5
35.1
11.0
1.5453
2002
6
38.4
10.9
1.5843
在表8.5的资料中,各年的环比增长速度大体相等,其发展趋势属于指数曲线型。
用平均法把资料分成两部分得到:
化简为:
解得B=lgb=0.0383,A=lga=1.3529
则b=1.029,a=22.537
配合的趋势方程为:
预测2004年的成本为:
3.抛物线型时间数列
抛物线型时间数列最简单的判断方法就是绘图观察。
此外,还可以根据二次增长量大体相同来判断。
其方程为:
由于抛物线方程有三个待定参数,因此需要把资料分成相等的三部分,通过解联立方程组求a、b和c的值。
例如,某企业1997-2002年的产量资料如表8.6所示。
根据表中资料配合适当的曲线并推算2003年可能的产量。
由于二次增长量大体相等,可以断定趋势曲线属于抛物线型。
表8.6
年份
t
产量(万吨)
增长量(万吨)
二次增长量
1997
1
120.0
—
—
1998
2
140.0
20.0
—
1999
3
162.0
22.0
2.0
2000
4
186.2
24.2
2.2
2001
5
212.7
26.5
2.3
2002
6
241.3
28.6
2.1
化简为:
解得:
c=1.1,b=16.55,a=102.43
所求得的抛物线趋势方程为:
2003年可能的产量为:
五、回归预测法
1、一元线性回归预测
只考虑一个因素的变动对预测对象的影响,称为一元回归分析。
如果两现象的变化呈现出一定的比例,则称为一元线性回归。
其应用的条件是:
两个变量之间确实存在显著的直线相关关系。
式中,x为自变量,
为因变量,a和b为待定参数。
根据最小平方法的原理,由下列标准方程组解出a和b的值:
解联立方程组,得:
例如,某企业产品产量与单位成本的资料如表8.7所示,运用一元回归预测法预测当产量为36.5万吨时的单位成本。
表8.7
序号
产量x(万吨)
单位成本y(元)
x2
xy
1
28.38
45.4
800.9
1284.8
2
28.70
44.6
823.7
1280.0
3
29.4
44.1
864.4
1296.5
4
30.6
42.7
936.4
1306.6
5
32.0
40.8
1024
1305.6
6
33.0
38.9
1089
1283.7
7
33.2
39.2
1102.2
1301.4
8
34.3
38.0
1176.5
1303.4
9
34.9
36.7
1218.0
1280.8
10
35.0
37.5
1225
1312.5
合计
319.4
407.9
10260.1
12955.3
代入计算公式得:
所以,一元线性回归方程为:
当产量为36.5万吨时,单位成本预测值为:
2、多元线性回归预测
在许多情况下,影响事物变化的因素不止一个。
例如,劳动生产率的提高可以降低成本,原材料单耗的降低也可以节约成本。
设y代表单位成本,x1代表劳动生产率,x2代表单耗,则:
利用最小平方法可以求出三个标准方程式:
把已知数代入方程中,就可以求出参数a、b1、b2的值。
如果影响y的因素有n个,则x与n个因素之间可配合成:
第3节统计预测误差
一、统计预测误差的产生
统计预测技术是一种科学的方法,但由于实际情况是复杂多变的,预测误差的存在是不可避免的。
预测误差产生的原因主要有:
(1)预测方法选择不当,建立的预测模型不符合客观事实;
(2)历史资料不完整,存在虚假因素;(3)外部条件发生了根本的变化;(4)预测人员认识水平的局限性。
二、统计预测误差的种类
1.平均绝对误差MAE
由于(
)有正值和负值,为了防止互相抵消问题,可以采用计算绝对误差的算术平均数的方法,即:
2.均方误差MSE
均方误差是预测误差平方和的平均数,可用于比较不同预测方法的准确程度,计算公式为:
3.均方根误差RMSE
表8.8
年份
t
产量y
1986
1
2094.5
2022.88
71.62
5129.424
1987
2
2143.9
2119.75
24.15
583.223
1988
3
2256.7
2216.63
40.07
1605.605
1989
4
2306.6
2313.50
-6.90
47.610
1990
5
2367.8
2410.38
-42.58
1813.056
1991
6
2465.9
2507.26
-41.36
1710.650
1992
7
2529.7
2604.13
-74.43
5539.825
1993
8
2678.3
2701.01
-22.71
515.744
1994
9
2773.7
2797.88
-24.18
584.672
1995
10
2849.4
2894.76
-45.36
2057.530
1996
11
2885.5
2991.64
-106.14
11265.700
1997
12
3016.8
3088.51
-71.71
5142.324
1998
13
3117.7
3185.39
-67.69
4581.936
1999
14
3192.8
3282.26
-89.46
8003.092
2000
15
3326.6
3379.14
-52.54
2760.452
2001
16
3471.1
3476.02
-4.92
24.206
2002
17
3657.2
3572.89
84.31
7108.176
合计
153
47134.2
—
—
58473.225
均方根误差是均方误差的方根,其目的是为了取得与原预测误差相同计量单位的统计值。
现以表8.3中的资料为例,用三点预测法和最小平方法预测的误差。
用三点预测法配合的趋势方程为:
利用这一方程求出的各年预测值如表8.8所示。
则三点预测法所配合直线趋势方程的均方根预测误差为:
表8.9
年份
t
产量y
t2
ty
1986
1
2094.5
1
2094.5
2024.024
4966.867
1987
2
2143.9
4
4287.8
2117.596
691.900
1988
3
2256.7
9
6770.1
2211.168
2073.163
1989
4
2306.6
16
9226.4
2304.740
3.460
1990
5
2367.8
25
11839.0
2398.312
930.982
1991
6
2465.9
36
14795.4
2491.884
675.168
1992
7
2529.7
49
17707.9
2585.456
3108.732
1993
8
2678.3
64
21426.4
2679.028
0.530
1994
9
2773.7
81
24963.3
2772.600
1.210
1995
10
2849.4
100
28494.0
2866.172
281.300
1996
11
2885.5
121
31740.5
2959.744
5512.172
1997
12
3016.8
144
36201.6
3053.316
1333.418
1998
13
3117.7
169
40530.1
3146.888
851.939
1999
14
3192.8
196
44699.2
3240.460
2271.476
2000
15
3326.6
225
49899.0
3334.032
55.235
2001
16
3471.1
256
55537.6
3427.604
1891.902
2002
17
3657.2
289
62172.4
3521.176
18502.529
合计
153
47134.2
1785
462385.2
—
43151.983
使用最小平方法配合直线趋势方程所需基本资料见表8.9。
根据表8.9中的资料计算直线趋势方程的待定系数。
则直线趋势方程为:
根据直线趋势方程进行预测,有关数据见表8.9,其均方根预测误差为:
比较两种预测方法的均方根误差,可以看到58.65万吨大于50.38万吨,即最小平方法的预测精度高于三点预测法,因而可以选择最小平方法进行预测。
预测2003年的产量为:
30.452-93.572×18=246.2(万吨)
第4节统计决策
统计决策理论是在20世纪发展起来的,它是由阿·瓦尔德通过把统计理论中的假设检验和估计方法在决策中加以应用而创立的。
经过20世纪40年代和50年代的发展,统计决策科学逐渐形成。
到20世纪60年代,统计决策理论和方法得到迅速发展,并在社会经济活动中得到广泛地应用。
决策是对未来行动做出的决定。
统计决策是指为了达到某种既定的目标,在统计分析和统计预测的基础上提出各种行动方案,并从中选择最优方案的过程。
一、统计决策的三要素
统计决策包括的三要素为策略集、自然状态集和损失函数。
策略集是决策者全部可供选择策略的集合,也称决策者的行动集或行动空间。
例如,某种产品有投产与不投产两种策略。
自然状态集是决策问题所有自然状态的集合。
例如,某种产品投产后有销路好、销路中等和销路差三种自然状态,它们构成的集合为自然状态集。
损失函数是对决策问题行动结果的计量表达式。
其含义是当自然状态取某个值时采取某一行动所遭受到的损失。
按照决策三要素的不同及与决策方法的联系,统计决策可以分为确定型决策、不确定型决策和对抗型决策三种。
确定型决策是指自然状态及状态的发生都是已知的,决策者根据自然状态的变化和约束条件,从策略集中选择出最优策略或行动。
不确定型决策是指自然状态及状态的发生都是不确定的,可以采用风险型决策或完全不确定型决策的方法进行决策,这也是统计决策研究的主要内容。
对抗型决策是指人和人之间、不同利益或不同军事
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 愁绪