食品价格变动汇总.docx
- 文档编号:10293429
- 上传时间:2023-02-09
- 格式:DOCX
- 页数:42
- 大小:670.80KB
食品价格变动汇总.docx
《食品价格变动汇总.docx》由会员分享,可在线阅读,更多相关《食品价格变动汇总.docx(42页珍藏版)》请在冰豆网上搜索。
食品价格变动汇总
2014年河南科技大学模拟训练三
承诺书
我们仔细阅读了数学建模选拔赛的规则.
我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。
我们知道,抄袭别人的成果是违反选拔规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。
如有违反选拔规则的行为,我们将受到严肃处理。
我们选择的题号是(从A/B/C中选择一项填写):
C
队员签名:
1.王瑞
2.徐水帅
3.石赛赛
日期:
2014年8月27日
2014年河南科技大学数学建模竞赛选拔
编号专用页
评阅编号(评阅前进行编号):
评阅记录(评阅时使用):
评
阅
人
评
分
备
注
食品价格变动分析
摘要
食品价格是居民消费价格指数的重要组成部分,食品价格波动直接影响居民生活成本和农民收入,是关系国计民生的重要战略问题。
本文通过对问题的分析,
针对问题一,我们先对附件1中的数据进行了极差标准化处理,消除了量纲和量级对问题分析的影响。
然后,我们对给出的27种食品运用系统聚类法分成了五大类,根据分类的结果,制作了价格波动图及查找资料分析各类食品价格的波动特征,从而体现我国食品价格波动的特点。
针对问题二,问题要求对2014年5月份食品价格走势进行预测,我们灰色预测模型为理论,先对原始时间序列进行数据处理,得到生成列,然后构建灰色预测模型,得到GM(1,1)的表达式,运用数学软件matlab编写程序,分别求出每种食品5月份的价格,然后又运用数学软件spss拟合出每一种食品的价格趋势曲线,图和程序见于附录
针对问题三,问题三要求通过监测尽量少的食品种类价格即能相对准确地计算、预测居民消费者价格指数并在同样精度要求下,考察不同地区所选取的食品种类以及种类数目是否一致。
运用spss中的主成分分析对27种食品进行降维,从中选取对居民食品价格指数影响较显著的几类食品,在考察不同地区所选取的食品种类以及种类数目是否一致时,仍采用主成分分析。
然后根据恩格尔系数,可由食品价格指数计算居民消费价格指数
关键词系统聚类灰色预测模型曲线拟合因子分析
一、问题重述
为监测食品价格的实际变化情况,国家统计部门定期统计50个城市主要食品平均价格变动情况,数据见附件1。
居民消费者价格指数(CPI),是根据与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。
附件2提供了近期居民消费者价格指数数据。
请根据以上信息(附件中只是列出了近期食品价格以及CPI数据,如希望利用更长时间周期内的数据信息,请自行查找,但必须在论文中注明数据来源!
),建立数学模型解决以下问题:
(1)根据附件以及相关统计网站的数据,分析我国食品价格波动的特点。
(2)对2014年5月份食品价格走势进行预测。
(3)目前统计部门需要监测大量食品价格变动情况以计算居民消费者价格指数变动情况,能否仅仅通过监测尽量少的食品种类(这里,食品种类是指附件1表格中的商品名称,可以认为每一种商品名称即为一种食品种类)价格即能相对准确地计算、预测居民消费者价格指数?
在同样精度要求下,不同地区所选取的食品种类以及种类数目是否一致?
请至少选择两个有特点的城市进行说明。
附件:
1.近期50个城市主要食品平均价格变动情况数据
2.居民消费价格(CPI)变动情况
3.部分数据查看地址
二、问题分析
1、为什么采用系统聚类不用常规聚类2对数据的分析,标准化
问题一的分析,该问要求对食品价格的特点进行分析。
我们首先对附件1中的数据进行分析,发现共有27种食品,相关描述指标有价格、比上期价格涨跌、涨跌幅,根据题目要求将食品价格作为研究对象。
由于食品种数较多,所以需对食品进行分类再进行价格特点分析。
此外,考虑到量纲和量级对趋势的影响,还需要对数据进行归一化处理。
问题二的分析,
问题三的分析,居民消费指数(CPI)是一种度量通货膨胀水平的工具,每一类食品价格变化对CPI的重要性并不相同。
本题要求通过检测尽量少的食品种类价格即能计算、预测居民消费指标,即通过检测尽量少的食品种类价格变化趋势反映出CPI的变化趋势。
通过spss因子分析从而筛选出影响CPI发展趋势较大的食品种类,白条鸡,猪肉后臀尖(后腿肉,鸡蛋,大白菜,带鱼,香蕉六种。
再选取两个有特点的城市西安、北京,根据地区的差别分析并选取合适的商品种类及数目,利用同一种数学模型再进行重新筛选。
三、模型假设
1、假设在食品预测的时间段类不存在重大自然灾害等不可预测性因素对食品价格产生影响。
2、假设附件中给出的数据来源真实可靠。
3、假设国家政策与食品价格相关的指定方案在食品预测的时间段内不发生较大改变。
4、假设食品价格影响因素的复杂程度在可预测范围内。
四、符号说明
a
发展系数
b
灰色作用量
待估参数向量
t
时间
x
价格
X(i)
第i个时间单位的价格
GM(1,1)
一节现行常微分方程
五、模型的建立与求解
5.1问题一的建立与求解
5.1.1数据的预处理
由附件1可以看出,不同种食品价格的量纲存在差异,如果直接用原始数据进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用。
而且,在接下来的分类中,可能会出现将价格高的食品和价格低的分到一类,这样在做图表时高价格的食品会影响到低价格食品在图表中的走势,因此,为了保证结果的可靠性,需要对原始数据进行标准化处理。
这里,我们采用“Min-max标准化”,其方法如下:
设minA和maxA分别为属性A的最小值和最大值,将A的一个原始值x通过min-max标准化映射成在区间[0,1]中的值x',其公式为:
新数据=(原数据-极小值)/(极大值-极小值)。
由此,我们得到了标准化后的食品价格表1:
注:
由于猪肉和鸡各有两种,为方便处理,我们将它们简记为“猪肉1”、“猪肉2”、“鸡1”、“鸡2”。
5.1.2模型的建立与求解
由于食品种数较多,如果逐个地分析每一种食品的价格波动情况,势必导致过程繁琐,毫无无概括性与简洁性,所以需对已给的食品进行分类整理。
这里,如果根据常识进行分类,如分为肉类、水果、蔬菜等,可能会出现某一类中各个食品的价格走势不一样,这样,会影响到对这一类食品的整体分析。
为避免这种情况的发生,我们采用“系统聚类”对数据进行分类整理。
由于SPSS可直接对数据进行分类,所以将标准化处理后的表1中的数据导入SPSS中,选择系统聚类并进行相关参数的设定后,运行得到系统聚类的结果,包括龙骨图、聚类关系表等。
于是,我们得到了分类结果表2:
类别
食品名
第一类
大米、面粉1、面粉2、豆制品、花生油、大豆油、菜籽油、鸡1、鸡2、鸭、鸡蛋
第二类
大米、面粉1、面粉2、豆制品、花生油、大豆油、菜籽油、鸡1、鸡2、鸭、鸡蛋
第三类
牛肉
第四类
羊肉、苹果、香蕉
第五类
大白菜
5.1.3食品价格特点的分析
根据上述的分类结果表2和标准化处理后的数据表1,我们绘制了各类中不同食品的价格折线图,如下:
由上图可以看出,第一类食品价格曲线走势整体较为平缓,中间有一段时期有略微的下降,但很快又恢复过来。
这一类食品主要为需求和供给都很大的生活必需品。
第二类食品价格曲线初期缓慢增长,中期会有一段增长较快而后见见下降。
这类食品中猪肉常常会出现供需不平衡,其余食品受季节性影响较大,故会出现图中的变化。
第三类食品价格曲线先是缓慢增长,然后骤减,紧接着又骤增,然后趋于平缓,最后又下降,总体来说,价格波动性较大。
第四类食品价格曲线一直较为平缓,后期会有略微下降趋势。
因为羊肉的供需一直较为平衡市场稳定,而苹果香蕉为常见的主要水果,所以价格波动甚小。
(注:
由于标注化处理后得到的大白菜的价格全为零为一直线,与真实值不符,故此处仍用原始数据进行分析)
第五类食品价格曲线先是一小段增长,而后又下降。
这是因为冬季对大白菜的需求量增大,随着时间推移,气候变暖,人们对大白菜的需求又变小了,所以价格下降。
5.2问题二的建立与求解
5.2.1理论建立
根据问题要求,我们采取“灰色预测模型”进行价格的预测。
灰色模型是利用离散随机数经过生成变为随机性被显著削弱而且较有规律的生成数,建立起的微分方程形式的模型,这样便于对其变化过程进行研究和描述,并在对数据的短期预测上具有明显的优势。
为了弱化原始时间序列的随机性,在建立灰色预测模型之前,需先对原始时间序列进行数据处理,经过数据处理后的时间序列即称为生成列。
关于单变量t,建立一阶单变量的灰色预测模型,即GM(1,1)
模型建立过程如下:
1.GM(1,1)模型
令
为GM(1,1)建模序列,
,
为
的一次累加序列,
,
令
为
的紧邻均值(MEAN)生成序列
=0.5
+0.5
则GM(1,1)的定义型,即GM(1,1)的灰微分方程模型为
(1)
式中
称为发展系数,
为灰色作用量。
设
为待估参数向量,即
,则灰微分方程(7.3.2)的最小二乘估计参数列满足
=
其中
=
,
=
称
(2)
为灰色微分方程
的白化方程,也叫影子方程。
如上所述,则有
1)白化方程
的解也称时间响应函数为
2)GM(1,1)灰色微分方程
的时间响应序列为
[
]
+
,
3)取
,则
[
]
+
,
4)还原值
上式即为预测方程。
5.2.2模型的求解
根据GM(1,1)模型,我们用MATLAB编写了程序(见附录),实现此算法的批量调用,算得五月份的预测价格。
这里,我们以大米为例给出求解过程如下:
输入价格矩阵x=[5.925.915.925.935.935.935.945.945.955.95]
结果如下:
绝对残差为:
daita0=
Columns1through7
0.000000000000070.004686653956780.000660303159680.006003599760040.001343232962140.003320800110780.00201149765184
Columns8through10
0.002659876634020.002665074141260.00201365291177
相对残差为:
kesi=
Columns1through7
0.000000000000010.000793004053600.000111537695890.001012411426650.000226514833410.000560000018680.00033863596832
Columns8through10
0.000447790679130.000447911620380.00033842906080
残差检验优
关联度=0.59663
方差比=0.13685
小误差概率=1.00000
合格
w=
5.965.965.975.975.98
其中,W为预测价格。
最终,我们得到了5月份食品的预测价格表如下:
名称
规格等级
5月上旬
5月中旬
5月下旬
大米
粳米
5.97
5.97
5.98
面粉
富强粉
5.61
5.62
5.63
面粉
标准粉
4.5
4.51
4.51
豆制品
豆腐
4.49
4.49
4.5
花生油
压榨一级
27.19
27.19
27.18
大豆油
5L桶装
11.08
11.06
11.05
菜籽油
一级散装
13.9
13.89
13.87
猪肉
猪肉后臀尖(后腿肉)
20.86
20.41
19.96
猪肉
五花肉
20.85
20.39
19.95
牛肉
腿肉
65.99
65.86
65.73
羊肉
腿肉
66.3
66.2
66.1
鸡
白条鸡
18.82
18.81
18.81
鸡
鸡胸肉
20.5
20.47
20.45
鸭
白条鸭
16.89
16.93
16.96
鸡蛋
散装鲜鸡蛋
9.45
9.41
9.37
活鲤鱼
13.55
13.45
13.35
活草鱼
16.36
16.29
16.23
带鱼
30.69
30.61
30.54
大白菜
2.58
2.62
2.66
油菜
5.17
5.17
5.16
芹菜
4.82
4.74
4.65
黄瓜
6.4
6.28
6.16
西红柿
7.61
7.49
7.38
豆角
10.96
10.56
10.18
土豆
4.77
4.8
4.83
苹果
富士苹果
12.27
12.35
12.42
香蕉
国产
8.05
8.15
8.25
为分析5月份的价格趋势,我们将之前的价格和预测后的价格用SPSS作散点图进行拟合,得到各种食品的拟合曲线图如下(由于图片较多,只给出部分,其余见附录):
由拟合曲线可以得到各食品价格趋势表:
商品名
趋势
大米
价格呈增长趋势
面粉1
价格呈增长趋势
面粉2
价格呈增长趋势
豆制品
价格呈增长趋势
花生油
价格呈下降趋势
大豆油
价格呈下降趋势,下降较快
菜籽油
价格呈下降趋势,较为平缓
猪肉1
价格呈下降趋势,下降较快
猪肉2
价格呈下降趋势,下降较快
牛肉
价格呈下降趋势
羊肉
价格呈下降趋势
鸡1
价格呈下降趋势,但极为平缓
鸡2
价格呈下降趋势,下降较快
鸭
价格呈上升趋势,较为缓和
鸡蛋
价格呈下降趋势,下降较快
活鲤鱼
价格呈下降趋势
活草鱼
价格呈下降趋势
带鱼
价格呈下降趋势,较为平缓
大白菜
价格呈上升趋势,增长较快
油菜
价格呈上升趋势,较为平缓
芹菜
价格呈下降趋势,较为剧烈
黄瓜
价格呈下降趋势
西红柿
价格呈下降趋势,较为剧烈
豆角
价格呈下降趋势,下降较快
土豆
价格呈上升趋势,增长较快
苹果
价格呈上升趋势,增长较快
香蕉
价格呈上升趋势,增长较快
5.3模型建立
5.3.1理论建立
1)数据的标准化处理
其中
为第
个分区第
个指标的值,
,
为第
个指标的样本均值和样本标准差。
(2)计算数据表
的相关矩阵
。
(3)求
的
个特征值:
,以及对应的特征向量
它们标准正交
称为主轴。
(4)求主成分:
。
(5)精度分析:
通过求累计贡献率
来判断,
,一般要求取
>85%
的最小
值,则可得主平面的维数
从而可对
个主成分进行综合分析。
(6)在获得特征向量与特征值,并确定主超平面的维数之后,可以计算主因子载荷
矩阵,其计算公式为:
其中
5.3.2模型求解
下表给出了27个原始变量的变量共同度变量共同度反映每个变量对提取出的所有公共因子的依赖程度,几乎所有的变量共同度都在80%甚至90%以上说明提取的因子已经包含了原始变量的大部分信息,因子提取的效果比较理想。
Initial
Extraction
a1
1.000
.987
a2
1.000
.969
a3
1.000
.982
a4
1.000
.980
a5
1.000
.974
a6
1.000
.974
a7
1.000
.981
a8
1.000
.998
a9
1.000
1.000
a10
1.000
.994
a11
1.000
.990
a12
1.000
.963
a13
1.000
.934
a15
1.000
.842
a16
1.000
.987
a17
1.000
.995
a18
1.000
.998
a19
1.000
.999
a20
1.000
.954
a21
1.000
.977
a22
1.000
.986
a23
1.000
.981
a24
1.000
.985
a25
1.000
.998
a26
1.000
.982
a27
1.000
.999
ExtractionMethod:
PrincipalComponentAnalysis.
特征根与方差贡献表
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
RotationSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1
11.257
43.297
43.297
11.257
43.297
43.297
10.512
40.432
40.432
2
9.369
36.036
79.333
9.369
36.036
79.333
9.202
35.391
75.823
3
2.290
8.807
88.140
2.290
8.807
88.140
2.385
9.173
84.996
4
1.339
5.151
93.291
1.339
5.151
93.291
1.752
6.740
91.735
5
1.155
4.443
97.733
1.155
4.443
97.733
1.559
5.998
97.733
6
.307
1.183
98.916
7
.178
.684
99.599
8
.104
.401
100.000
9
.000
.000
100.000
10
.000
.000
100.000
11
.000
.000
100.000
12
.000
.000
100.000
13
.000
.000
100.000
14
.000
.000
100.000
15
.000
.000
100.000
16
.000
.000
100.000
17
.000
.000
100.000
18
.000
.000
100.000
19
.000
.000
100.000
20
.000
.000
100.000
21
.000
.000
100.000
22
.000
.000
100.000
23
.000
.000
100.000
24
.000
.000
100.000
25
.000
.000
100.000
26
.000
.000
100.000
ExtractionMethod:
PrincipalComponentAnalysis.
表 12-4给出了因子分析各个阶段的特征根与方差贡献表其中,Initial Eigenvalues栏给出初始的样本相关系数矩阵或协差阵的特征根,用于确定哪些因子应该被提取,共有三项:
Total列为各因子对应的特征根,本例中共有4个因子对应的特征根大于1,因此应提取相应的5个公因子;% of Variance列为各因子的方差贡献率;Cumulative %列为各因子的累积方差贡献率。
Extraction Sums of Squared Loadings栏给出提取出的因子方差贡献表,提取出的5个因子按方差贡献的大小自上而下列出。
同时可以看出,前5个因子已经可以解释原始变量89.651%的方差,已经包含了大部分的信息。
Rotation Sums of Squared Loadings栏给出提取出的公因子经过旋转后的方差贡献情况。
从中可以看到,由于经过了旋转,4个因子的方差贡献已经发生了变量,但是5个因子总的累积方差贡献率并没有改变,依然是89.651%。
给出了因子的碎石图。
图中横坐标为因子的序号,纵坐标为相应特征根的值。
从图中可以看到,第5个因子以前的特征根普遍较高,连接成了陡峭的折线,而第5个因子之后的特征根普遍较低,连接成了平缓的折线,这进一步说明提取5个因子是比较适当的
旋转前的因子载荷阵
Component
1
2
3
4
5
a1
.013
.074
-.021
.022
.221
a2
.073
.056
-.368
-.128
.005
a3
.016
-.008
.065
.051
.584
a4
.071
.060
.010
.004
.199
a5
.071
.025
-.129
-.617
-.012
a6
.027
-.049
.230
-.181
.145
a7
-.008
.065
.028
.145
-.406
a8
.064
-.092
-.044
-.122
.000
a9
.064
-.094
-.049
-.106
.001
a10
.114
-.001
-.075
-.103
-.053
a11
.113
.026
-.008
-.185
-.008
a12
.094
-.052
-.151
.175
.092
a13
.059
-.106
.047
.005
.204
a15
.021
.119
-.088
-.191
-.158
a16
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 食品 价格 变动 汇总