鞋的销售量与鞋单价和购买者月收入的回归分析Word文档格式.docx
- 文档编号:22490737
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:11
- 大小:92.88KB
鞋的销售量与鞋单价和购买者月收入的回归分析Word文档格式.docx
《鞋的销售量与鞋单价和购买者月收入的回归分析Word文档格式.docx》由会员分享,可在线阅读,更多相关《鞋的销售量与鞋单价和购买者月收入的回归分析Word文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
实验号
鞋需求量
购买者月收入
鞋单价
1
30
1200
72
2
25
1100
3
21
4
20
900
73.3
5
23
950
6
26
7
16
1000
8
19
1050
9
27
74
10
24
11
1150
12
28
71
13
22
14
15
780
17
18
890
850
800
73
960
990
980
870
29
3设计原理
本题是一道确定这三种组分含量与玻璃析晶上限温度的关系问题,首先做出该组数据的散点图,由图分析该数据属于线性回归问题,可以利用Excel解决这种类型的问题。
数据的处理时通过使用“最小二乘法”做直线拟合,然后再进行一元线性回归。
在整个过程中直接使用Excel进行数据处理,得出结论,然后队所得数据进行分析。
4设计程序
为了研究这些数据中所蕴含的规律,将温度T看做因变量,X1,X2,X3看做自变量,画出它们的散点图(图一),可见这些点分布在一条直线附近,所以两组分的百分比之间可能符合一元线性模型。
下面用Excel“分析工具库”提供的“回归”工具,找出线性回归方程,并检验其显著性。
4.1设计步骤
1在【工具】菜单中选中【数据分析】,则会弹出【数据分析】对话框,然后在“分析工具”中选择“回归”选项,如图二所示。
单击【确定】后,则弹出【回归】对话框,如图二所示。
2填写【回归】对话框。
如图三所示,该对话框的内容较多,可以根据需要,选择相关项目。
在“Y值输入区域”内输入队因变量数据区域的引用,该区域必须有单列数据组成,如本题中三种成分的含量;
在“X只输入区域”输入对自变量数据区域的引用,如本题中温度T。
该区域必须是连续的,Excel将对此区域中的自变量从左到右按升序排列,自变量的个数最多是25个。
“标志”:
如果输入区域的第一行中包含标志项,则选中此复选框,本题中的输入区域包含标志项;
如果在输入区域中没有标志项,则应清楚此复选框,Excel将在输出表中生成合适的数据标志。
“置信度”:
如果需要在汇总输出表中包含附件的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。
Excel默认的置信度为95%,相当于显著性水平a=0.05。
“常数为零”:
如果要强制回归线通过原点,则选中此复选框。
“输出选项”:
选择“输出区域”,在此输出对输出表左上角单元格的引用。
“残差”:
如果需要以残差输出表形式查看残差,则选中此复选框。
“标准残差”:
如果需要在残差输出表中包含标准残差,则选中此复选框。
“残差图”:
如果需要生成一张图表,绘制每个自变量及其残差,则选中此复选框。
“线性拟合图”:
如果需要为预测值和观察值生成和观测值生车一个图表,则选中此复选框。
“正态概率图”:
如果需要绘制正态概率图,则选中此复选框。
4.2设计结果
图一散点图
图二数据分
图三回归分析工具界面
SUMMARYOUTPUT
回归统计
MultipleR
0.999711
RSquare
0.999422
AdjustedRSquare
0.951748
标准误差
25.21578
观测值
方差分析
df
SS
MS
F
SignificanceF
回归分析
23088960
7696320
12104.26
9.45E-33
残差
13352.54
635.8355
总计
23102313
图四回归分析工具运行结果1
Coefficients
tStat
P-value
Lower95%
Upper95%
下限95.0%
上限95.0%
Intercept
#N/A
-5.52896
8.770542
-0.6304
0.535232
-23.7683
12.71038
13.5377
1.767926
7.65739
1.65E-07
9.861098
17.2143
9.1
10.55914
5.370546
1.96612
0.062643
-0.60952
21.7278
图四回归分析工具运行结果2
RESIDUALOUTPUT
PROBABILITYOUTPUT
预测1029
标准残差
百分比排位
1029
982.838
28.16198
1.193952
2.083333
925
972.2789
43.72112
1.853595
6.25
940
1007.828
-1.82842
-0.07752
10.41667
956
986.7101
6.28985
0.266664
14.58333
1000.437
3.562972
0.151055
18.75
965
989.8779
-22.8779
-0.96993
22.91667
967
979.3188
19.68125
0.834404
27.08333
1006.746
-14.7457
-0.62516
31.25
968
999.3543
-19.3543
-0.82054
35.41667
979
988.7951
-8.79514
-0.37288
39.58333
958.7412
25.25882
1.07087
43.75
942.6531
22.34692
0.947417
47.91667
984
987.8682
18.13181
0.768714
52.08333
966.7499
21.25008
0.900916
56.25
987
-3.86819
-0.164
60.41667
988
977.3091
-10.3091
-0.43706
64.58333
20.25008
0.85852
68.75
992
1.690946
0.071689
72.91667
993
956.1908
31.80922
1.34858
77.08333
999
990.8468
-22.8468
-0.96861
81.25
1004
980.2876
-40.2876
-1.70803
85.41667
1006
969.7285
-13.7285
-0.58203
89.58333
-34.8468
-1.47736
93.75
1011
-44.7285
-1.8963
97.91667
1016
图四回归分析工具运行结果3
4.3结果分析
由图四知,若保留两位有效数字,该回归方程的截距是0.7316,斜率为944.3,所以回归方程的表达式为:
y=0.7316x+944.3;
根据回归统计结果,知决定系数
=0.9264,即相关系数r=0.9625,说明自变量与因变量之间有较高的相关性;
根据方差分析的结果,F=44.2,SignificanceF<
0.01,所以建立的回归方程非常显著。
在图四的第三个表中,除了列出了回归系数,还有标准误差等项目。
其中“标准误差”表示的事对应回归系数的标准误差,其中偏回归系数的标准误差。
“tStat”就是t检验时的统计量t;
如果多元线性回归,则可直接根据“tStat”的大小,判断因素的主次顺序。
“P-value”表示t检验偏回归系数不显著的概率,如果P-value<
0.01,则可认为该系数对应的变量对试验结果影响非常显著(**),如果0.01<
P-value<
0.05,则可认为该系数对应的变量对试验结果影响显著(*);
对于常数项,P-value则表示常数项为零的几率。
5设计总结
通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识,而且使我对这些知识在实际中的应用产生了浓厚的兴趣,同时对我学习好概率论与数理统计这门课有很大帮助。
在实现这道题的过程中我应用了Excel软件,学会了该软件的一些新的应用,更加熟练的操作该软件进行一些数据上的处理。
参考文献
[1]沈恒范.概率论与数理统计教程[M].第四版.北京:
高等教育出版社,2003.4:
140-196
[2]MorrisH.DeGroot,MarkJ.Schervish[美].概率统计[M].叶中行,王蓉华,徐晓岭.第三版.人民邮电出版社,2007.3,175-333
[3]徐传胜.贝塔分布的有关性质及应用探讨[J].临沂师范学院学报,2001,23(4):
6-8
[4]陈家鼎,孙山泽.数理统计讲义[M].高等教育出版社,1993:
37-52
[5]陈希孺.数理统计引论[M].科学出版社,1981:
96-97
[6]苑诗松,王静龙.数理统计[M].华龙师范大学出版社,1987:
42-45,142-160
[7]杨虎等.数理统计[M].高等教育出版社,2004
[8]H.L.阿尔德,E.B.罗斯勒[美].概率论与数理统计[M].北京大学出版社,1984
[9]廖仲春.概率统计课程教学方法探索[J].大学时代(B版),2006,(01):
[10]StuartA.Klugman.,HarryH.panjer,GordenE.willmot.LossModelsFromDatatoDecisions,SecondEdition[M].AJOHNWITEY&
SONS,INC,PUBLICATION,2004,81-392
[11]潘承毅,何迎辉.数理统计的原理与方法[M].同济大学出版社,1993
[12]李贤平.概率论基础[M].高等教育出版社,1996:
153-130
[13]范金城,吴可法.统计推断导引[M].北京科学出版社,2001
[14]方世祖.概率论与数理统计教学探讨[J].广西大学学报(自然科学版),2008,33(06):
217-218
[15]杜世平.对区间估计与假设检验关系的思考[J].西南名族大学大学报(自然科学版),2005,31(03)
[16]潘高田,王精业,杨瑞平.小样本离散型多总体和统计量检验法[J].系统仿真学报.2001,13
(2):
182-183
[17]蔡季冰,宋海龄,陈永.小样本参数估计算法及其应用[J].北京理工大学学报,1989,9
(1):
92-98
[18]
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 销售量 单价 购买 月收入 回归 分析
![提示](https://static.bdocx.com/images/bang_tan.gif)