统计学实验.docx
- 文档编号:29187036
- 上传时间:2023-07-21
- 格式:DOCX
- 页数:26
- 大小:176.10KB
统计学实验.docx
《统计学实验.docx》由会员分享,可在线阅读,更多相关《统计学实验.docx(26页珍藏版)》请在冰豆网上搜索。
统计学实验
统计学实验内容
一、频数统计
1.A公司在招聘时采用了综合能力测试(满分为100分),由于应聘的人数较多,现随机抽取了157名应聘者的测试成绩,其测试分数的数据如book1所示。
(1)根据上面的资料,进行分组,并确定组数和组距。
根据资料判断,进行分组,分为六组,组距为10。
(2)编制频率分布表
上限成绩频数频率
0.1019111916~20100.171975272920~30
0.35668856~393040
0.24840850~3949400.08917250~601458
0.031847
~7056068
合计157
%累积接收频率
10.19%1619
27.39%2927
63.06%3956
87.90%4939
96.82%5914
100.00%695
100.00%
0其他
()画出直方图3
直方图6040率频率频200其他493929195868接收。
120.00%60100.00%5080.00%40率60.00%30频40.00%2020.00%100.00%0其他594969192939接收
家庭构成的一个样为评价家电行业售后服务的质量,随机抽取了由2.100较差。
调查D.差;E.A.好;B.较好;C.一般;本。
服务质量的等级分别表示为:
结果见book2。
(1)指出表中的数据属于什么类型?
定序型
(2)制作一张频数分布表;
频率频数服务质量等级
0.14114A
0.21B221
0.32C332
0.18D184
0.15E155
合计100
绘制一张条形图,反映服务质量的分布。
(3)
请将页字段拖至此处服务质量分布图计数项:
服务质量等级E级D等
在此处放置系列字段服务质量等级
量C质汇总务B服A402030100频数
19
/2
服务质量等级计数项:
汇服务质量等级总14A
21B
32C
18D
15E
100总计
二、参数估计现从一批产品中小时。
已知灯管使用寿命服从正态分布,1.其标准差为50的概率保证95%25个作为样本,测得其平均使用寿命为1600小时,要求在抽取函数)下估计该批产品平均使用寿命的置信区间。
(运用CONFIDENCE
标准差50
0.95置信度
样本容25量1600平均值
极限误19.59964差置信区1619.6
1580.4
间
1619,置信区间抽样平均误差19.59964)1580.4003~即(.59964
.在一篇关于“通货紧缩”的文章中,作者考察了各种各样投资的收益情2200况。
这些投资包括股票、债券以及房地产等。
这篇文章抽取的是样本容量为19
/3
的样本,计算的房地产投资收益(单位:
%)如book3所示。
同时根据经验假定,房地产投资收益的总体标准差为2.3%。
请你用区间估计的方法,采用95%的置信度估计房地产投资的平均收益率。
解:
用函数AVERAGE求得,样本均值=12.08
运用CONFIDENCE函数求得,CONFIDENCE(0.05,2.3,200)=房地产,取0.318758投资收益的=0.32
x△
房地产投资收益的置信区间为(11.76,12.40)
19
/4
3.MetropolitanResearch有限公司是一家消费者研究组织,它设计调查,对消费者所使用的大量的产品和服务进行评估。
在某一项研究中,Metropolitan调查消费者对底特律某一个主要制造商所生产的汽车的性能的满意程度。
分发给该制造商所生产的一种最大型号小汽车用户的调查表表明,许多人抱怨该车刚开始传动系统不佳。
为了更好地了解传动系统的问题,Metropolitan采用由底特律地区一个修理企业所提供的实际传动系统的维修记录为样本。
Book4数据是50辆汽车传动系统出现故障时所行驶的实际里程的数据。
(1)对样本数据进行描述性统计分析。
19
/5
)求曾经出现过传动系统问题的汽车总体中在出现传动系统问题时所行(295%置信区间。
驶里程的均值的
用运房地CONFIDENCE(0.05,24898.8,50)=CONFIDENCE函数求得,,取6901.468428,73342.3-6901.47产投资收益的=6901.47,房地产投资收益的置信区间为(x△80243.77)。
66440.8373342.3+6901.47)即(,估计出现传动系统问题时所行5000英里的允许误差下,)(3如果研究公司想在95%时应选取多大的样本容量?
驶里程的均值,则置信度为22?
z?
n2?
?
?
?
?
运用公式样本容量n=95.2624898.8,所以5000z=1.96,,有知,。
9695%故在置信度为时应选取样本容量为19
/6
三、方差分析(选做)三种不同的培训方式对产品组装CB一家产品制造公司管理者想比较A、、1.名新员工随机分配给每种培训方式。
在培训26时间的多少是否有显著影响,将。
所示(单位:
分钟)参加培训的员工组装一件产品所花的时间如结束后,book5,确定不同培训方式对产品组装的时间是否有显著影响?
取显著性水平=0.05
公司为了使新产品迅速占领市场,2.一家食品制造商推出了一种新的产品,并且在三个地区分别采用这三种营销方的市场营销部经理提出了三种营销方式,这三种营销方式在市场上推出然后观察营销方式所产生的产品销售额情况。
式,,如周的销售额数据(单位:
千元)之后,公司的统计分析人员随机抽查了20book6所示。
市场营销部经理提出的三种营销方式所产生的销售额是否存在显著性试问:
差异?
(取显著性水平=0.05)
四、相关与回归分析
1.根据教材第207页表9-4的资料及补充的几个问题,进行相关与回归分析。
(1)根据表中数据绘制散点图,观察其相关类型。
19
/7
人均收入与寿险保额605040额保30系列1险寿20100301015202505人均收入
(2)计算相关系数,判断相关密切程度。
。
故其相关关系密切程度为高度相关。
计算得到相关系数为0.944相关程度是显著的,说明年收入与寿险保额整体呈现正的线性关系。
)建立寿险保额对人均年收入的回归方程,并解释回归方程的相关含义。
(319
/8
4)计算所建模型拟合优度并解释其意义。
(
19
/9
能够被估计的估计的回归方程89.17%R^2=0.8917,表明总平方和中的能够被产量与89.17%y=2.2326x-2.8033所解释,换句话说,单位成本差异性的单位成本之间的线性关系所解释。
?
的情况下,检验总体回归方程和总体回归系数)在显著性水平(5050.?
的显著性。
SUMMARYOUTPUT
回归统计0.944285MultipleR
0.891675RSquare
AdjustedR
0.878134
Square
19
/10
标准误差4.669242
10观测值
方差分析
SignificanceF
MS
SS
F
df
3.94E-051435.68511435.68565.85164
回归分析残差21.80182174.41458
9
1610.1总计
上限下限LowerUpper
Coefficients标准误差tStatP-value95%95%95.0%95.0%
8.114327
8.114327Intercept-13.721-13.721-2.803324.734442-0.592110.570128
XVariable
2.2326190.2751268.1149021
3.94E-051.5981782.867061.5981782.86706
对总体回归方程显著性检验
○01≠βo=0;H1:
β1提出假设:
Ho:
○F=65.851642根据回归分析知:
○=0.05αn-2),n=10,F3~F(1,查表得临界值F=5.32
0.05○。
接受H14因为F>F所以拒绝Ho,,0.05所以总体回归方程存在且有意义。
对总体回归系数的显著性检验
○01≠Ho:
βo=0;H1:
β1假设○t=根据回归分析知28.114902
○tt0.05=1.8125n-2)3α=0.05,,~(○ttH1。
>所以拒绝Ho,4因为接受0.05,所以总体回归系数存在显著性。
2.金融机构发放房屋抵押贷款必须了解市场上购买房屋的支付能力和支付状况,购房者的支付能力作为因变量y(用家庭平均月收入的百分比代表每月抵押贷款的平均支付能力),抵押贷款的成本费用作为自变量x(用抵押贷款的平均利率代表)。
统计分析人员随机收集了如book7所示的样本数据。
(1)采用最小二乘法求线性回归直线方程;
19
/11
购房能力散点图y=1.516x+7.02022=0.9801R25.020.0力15.0系列1能付线性(系列1)支10.05.00.012.0010.000.002.004.006.008.00抵押贷款利率
(2)计算可决系数,并解释其意义;表明估计的回归方程对样本数据的拟合效果0.9801可决系数为,接近于1,较好。
购房者的支付)显著性水平设为t检验统计量进行检验:
=0.05,采用(3能力与抵押贷款利率之间是否存在显著性的线性关系?
购房者的采用方差分析检验方法进行检验:
=0.054)显著性水平设为,(支付能力与抵押贷款利率之间是否存在显著性的线性关系?
SUMMARYOUTPUT
回归统计0.99002042MultipleR
0.980140432RSquare
0.977657986AdjustedRSquare
0.219955429标准误差
10观测值
方差分析Significance
F
dfSSMSF
4.29E-081394.828519.1019619.10196回归分析80.3870430.04838残差
总计19.4899
预测观测值Y
标准残差残差-1.1596122.24047-0.240471
1.35667721.118660.2813422
-0.0706719.314663-0.01466
1.08746517.874490.2255144
0.7501540.15556418.344445
-0.09887
-0.0205618.9205
19
/12
718.708270.0917320.442344
0.17943518.662790.0372118
-1.84943-0.3835317.783539
-0.63749
18.1322-0.132210
上限Upper下限Lower
Coefficients标准误差tStatP-value95%95%95.0%95.0%
8.4323535.6079545.6079548.432353Intercept7.0201538770.61240111.463333.04E-06
XVariable11.5159681660.07629319.870294.29E-081.3400361.6919011.3400361.691901
○0
≠β1假设Ho:
βo=0;H1:
1(3)○t=19.87029根据回归分析知2
○ttn=10,0.05=1.8125,~(n-23α=0.05,)○ttH1。
所以拒绝4因为Ho>,接受0.05,所以购房者的支付能力与抵押贷款利率之间存在显著性的线性关系。
○0
≠o=0;H1:
β11提出假设:
Ho:
β(4)○F=394.8285根据回归分析知:
2○=0.05α),n=10,(1,n-2F3F~查表得临界值F=5.32
0.05○H1。
所以拒绝Ho,接受F>F4因为,0.05所以购房者的支付能力与抵押贷款利率之间存在显著性的线性关系。
五、时间序列分析
1.从国家统计局网站上搜集2000-2012年各年按不变价计算的GDP资料。
要求:
(1)计算这段时间的经济增长率(即按不变价计算的GDP的平均增长速度);
(2)用3期移动平均法预测2013年的GDP。
预计2013年GDP=464519.65
(3)建立一个趋势直线方程,预测2014年的GDP。
19
/13
GDP(亿三期移动平○测预22013年均元年份)
增长速度200099214.55GDP=464519.65
109734.13672001109655.20.105232751121936.873320020.097373612120332.7
138677.93135822.820030.128727032
160212.82330.1771100812004159878.3
187043.380.1567381172005184937.4
222354.03670.169663168216314.42006
265390.05670.2288145092007265810.3
306919.5167314045.420080.181464444
352153.682009340902.80.085520684
405173.220.177792582010401512.8
464519.6520110.17830378473104.1
2012
518942.1
0.096887883
GDP增长y=35521x+8314.22=0.9457R600000500000400000值系列1300000PD线性(系列1)G2*******0000014101240268年份
2.教材第122页,第5题。
年份人口数
19998763
20008861
20018946
20029027
20039100
20049172
20059243
20069315
19
/14
人口资料散点图9400y=77.679x+8703.8930092009100数口人9000890088008700销售量变动y=0.6257x+29.8042R=0.2671量销
60
50
403020
系列1线性(系列1)系列1线性(系列1)
10
1046802
万人9400根据图表预测可知,2007年人口数为。
要求:
配合二次曲book8.某地区1992-2000年自行车的销售量数据见3,算出各年的趋势值,画出二次曲线趋势图。
线(试用“回归”分析工具)
t*tt年份销售量(万辆)1341
1992
41993422
91994583
168119954
259351996
3619971056
4971091998
649819998
81
20009
96
SUMMARYOUTPUT
回归统计
0.97799MultipleR
0.956464RSquare
AdjustedR
0.941952Square
6.738659标准误差
9观测值
方差分析
Significance
F
dfMS
F
SS
19
/15
回归分析2992.88365.90878.25E-0525985.765
残差6272.457145.40952
总计86258.222
UpperLower下限上限95.0%95.0%Coefficients标准误差tStatP-value95%95%
20.88554-21.076-21.07620.88554-0.095248.574391-0.011110.991498Intercept
37.4764127.842863.9370267.0720520.00040137.4764118.209318.2093t
-0.94141
-0.94141-2.820490.383971-4.898690.002714-2.82049t*t-1.88095
RESIDUALOUTPUT
观测残差销售量值预测(万辆)
8.133333125.86667
-6.06667248.06667
-8.50476366.50476
-0.1809581.180954
0.90476292.095245
5.75238199.247626
6.3619057102.6381
-4.266678102.2667
-2.13333
998.13333
tLineFitPlot万150(100)销售量(万辆)量辆50售销预测销售量(万0辆)1050t令
t*tLineFitPlot万150(100)销售量(万辆)量辆50售销0预测销售量(万辆)100050t*t
Y=a+bt+ct*t
19
/16
x1=t,x2=t*t,则由回归分析数据知a=-0.095238095,b=27.84285714,c=-1.880952381
Y=-0.095238095+27.84285714t-1.880952381t*t
4.某啤酒生产企业2000-2005年各季度销售量如book9所示。
要求:
(1)运用趋势剔除法测定各季度季节比率;
(2)建立恰当的趋势方程;
(3)考虑季节影响,预测2006年第一和第二季度的销售量。
某啤酒生产企业2000-2005年各季度的销售量如下:
时间时间序号销售量四季度移动平均趋势值TY/T(%)
2000.1125
223230
333731.2530.625118.4
442632.753279.38931298
2001.15303433.375
88.23529412
26383534.5108.5714286
374234.7534.875120.8633094
48303534.87585.71428571
2002.19293736
78.37837838
2103938.2537.625101.9607843
3115038.538.375129.8701299
4123538.538.590.90909091
2003.1133038.7538.625
77.41935484
2143939.253999.36305732
315513939.125130.7692308
4163739.7539.37593.08176101
2004.1172940.7540.25
71.16564417
218424140.875102.4390244
3195541.541.25132.5301205
4203841.7541.62591.01796407
2005.1213141.541.625
74.69879518
2224342.2541.875101.7751479
32354
42441
2001年2002年2003年年20002004年2005年合计同季平均季节比率季度78.90456596177.9794933471.1656441774.69879518389.8974788.2352941278.3783783877.41935484
104.0416671
514.10944102.8218885101.7751479108.5714286101.960784399.36305732102.43902442
127.9870712126.4865581130.7692308132.5301205632.43279118.4
3120.8633094129.8701299
89.06669578
440.1124188.0224829485.7142857179.38931490.9090909193.0817610191.01796407
400
1976.5521395.3104229-
-
-
-
-
-
合计
19
/17
------#VALUE!
98.82760572平均四个季度比率之和为395.3104229%,调整系数为:
400%/395.3104229%=1.011863024
025*********时间x=25
2006年第一季度为由上图可知:
x=262006年第二季度为Y=0.6257x+29.804又y=45.4465时当x=25y=46.0722时当x=26
19
/18
19
/19
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 实验
![提示](https://static.bdocx.com/images/bang_tan.gif)