统计学实训报告.docx
- 文档编号:28346889
- 上传时间:2023-07-10
- 格式:DOCX
- 页数:27
- 大小:414.93KB
统计学实训报告.docx
《统计学实训报告.docx》由会员分享,可在线阅读,更多相关《统计学实训报告.docx(27页珍藏版)》请在冰豆网上搜索。
统计学实训报告
统计学实训报告
实训
(一)和(三)excel基本统计
一、实训目的
利用Excel掌握建立数据文件、数据整理、数据描述与显示等操作。
能计算各种平均指标、离散指标,会应用基本统计函数,会使用Excel描述统计工具进行统计分析。
利用统计图表工具进行数据直观分析,掌握Excel柱形图、条形图、折线图、饼图、散点图、面积图、环形图等各种图形工具的使用方法和统计作用。
二、实训内容
(一)基本函数使用
某班学生期末成绩单
外语性语外数数性学号学号文别别学文学语语
0311男72567288030186女65
男888803127890男75820302
031376630303807276男女63
78031492030475867880男男031565男778070660305女58
78女031672800306女655081
95男769803179180女030788
66男810318766068770308男77女70031968790309女7267
男032088
031082
女78
96
75
95
最差按平均分从大到小进行排序挑选出学习成绩最好、1)计算个人平均成绩,(个同学;的3门课的平均分和标准差、最大值、最小值、峰度、偏度;求这3
(2)
(2)级分类统将数学成绩按性别分类汇总统计男女同学各科成绩平均值,并按5(3)(优、良、中、及格和不及格)人数。
计
(二)计算各种平均指标日收盘价如表,1年20149月
(1)(算术平均数)中国股市中的10种股票在种股票价格当日的平均价格。
求该10
证券名称股票代码价格证券名称股票代码价格124300002165.21600519贵州茅台神州泰岳110洋河股份116.5002304002310东方园林94.5
信立泰002294
100.89
红日药业300026
600547山东黄金79.02600150中国船舶76.873
76.38
300024
300011
鼎汉技机器
(2)(加权平均数)某公司员工工资情况如下表,计算平均工资。
按工资分频组中xxf
160以4
1600-17006
1700-180012
1800-190015
1900-20003
合计40
3)(调和平均数)成都某小区菜市芹菜的价格,早上3.8元/kg,中午3.5元(/kg,晚上2.9元/kg。
如果早、中、晚各买一元,求平均价格。
(4)(几何平均数)孙女士到中国银行存入一笔资金,按复利计算,10年的年利率分别是2.88%有3年,2.79%有2年,3.6%有2年,5%有3年。
计算其平均存款利率。
(5)根据上面
(2)员工工资表计算中位数和众数。
(三)计算各种离散指标
(1)(极差)景经理在2013年度工资收入分别是5280、6421、7345、4888、7243、6896、5889、7124、7586、9200、7854、8455,计算其工资收入的极差。
(2)(未分组数据平均差)某公司10名工人的工资为2569、2807、3018、2587、2848、1989、2368、2345、1956、1833,计算其平均差。
(3)(分组数据平均差)根据员工工资表计算员工收入的平均差。
(4)(标准差和方差)根据员工工资表计算员工工资收入的方差和标准差。
(5)(离散系数)根据员工工资表计算员工工资收入的离散系数。
(四)利用描述统计工具进行指标分析
现有300名员工,从中随机抽取30名员工的工资进行统计,具体资料为3569、3107、3013、2187、1848、1689、1368、1342、1256、1133、1157、1082、1088、2874、2310、1762、3172、1939、1851、1480、1424、1354、1700、1097、2003、3133、3176、1459、1097、1396,使用描述统计工具对工资进行统计
(五)图表的运用
根据某地三大产业情况基本数据,绘制该地三个产业的条形图、饼图、折线图。
第一产第二产第三产年份业业业
199053.229.817
19954433.722.3
200035.635.429
200426.143.630.3
200524.545.130.4
200622.645.831.6
200720.146.833.1
33.2
47.619.22008
三、实训步骤及结果分析
(一)、基本函数运用
1.通过函数AVERAGE把每个同学平均分求出来,数据按钮中的降序功能,成绩最好的3个同学和最差的3个同学就出来了,在把每科平均值求出,例:
Average(a1:
a5)或者Average(1,3,5)。
偏度函数SKEW(number1,number2,...),k?
3fx)(M?
ii1?
iSK?
?
3sf?
Mf为频数。
为中位数,。
其中s为标准差,iii2.使用KURT函数将峰度算出,然后使用STDEV函数求出标准差,同理最大值MAX,最小值MIN。
利用分内汇总功能,先将数据进行按性别降序或升序排列,再进行汇总,统计学生成绩优、良、中、差和不及格。
运用COUNTIF函数,例:
=IF(F2>=90,A,IF(F2>=80,B,IF(F2>=70,C,IF(F2>=60,D,E))))结果如下:
、IF、SKEW、从这道题来看,考核了一些基本函数的运用,比如,AVERAGECOUNT
函数嵌套时应该注意各函数之间的关系,另外分内等,特别是COUNTIFSTDEV。
汇总时应先进行排序,否则结果是错误的
(二)计算各种平均指标,得只股票价格加总除以算术平均即为各个数求和再除以总的个数,将1.1010到平均价格。
.
按照合理的比例来计算。
数据加权平均是不同比重数据的平均数,就是把原始2.
公式通过计算得以下结?
)是总体各单位标志值倒数的算术平均数的倒HarmonicAverage3.调和平均数(式用公价。
利,用金额除以单先也数,称倒数平均数,计算斤数得出下面结果。
=SUM(D24:
D26)/SUM(E24:
E26)
。
值几何平均的数返回正数组或数据区域:
何4.几平均GEOMEAN
n?
面这道
a?
a?
a...?
a?
但是上即为:
GEOMEAN(number1,number2,...)nni21n1?
i式后然利用公,速发变速增要算接能,题不直计,将长度为展度=POWER(D31^B31*D32^B32*D33^B33*D34^B34,0.1)计算,才能正确,如果直接利用函数GEOMEAM计算,结果会错误。
NS?
m1?
25.iLMiML?
?
中位数和众数,利用公式:
?
?
?
1?
e
2?
?
1?
fm
从这一道题来看,难点主要在于几何平均,加权平均,中位数,众数的计算,特别是数据为分组数据时,要注意分析和理解,才能减少错误。
(三)离散指标差1.极R=max-min=9200-4888=4312,此处叫为简单。
-?
XX?
2.与各个据未分组数据平均差,首先计算该组数据平均值,公式为:
n做差取绝对值求和再除以总的人数,计算较为简单。
、平均值|平均值、3.分组数据平均差,计算较为复杂,首先将下图中的X-|X-?
f平均值|*f/算出。
频数算出来,最后|X-平均值|*|X-?
:
估算样本方差。
4.方差和标准差,利用公式VARn?
2)x(x?
?
?
22)xnx?
(i=。
21i?
?
sVAR(number1,number2,...)
2n1n?
5.离散系数
由上图可算Vs=110.68/1768=0.0626
通过这道题可知,对极差、方差、标准差、离散系数等指标的分析来对数据分布离散程度的测度,数据比较多计算有点困难,但可以通过计算机,应注意样本方差和总体方差之间自由度的不同。
(四)描述统计
只需要加载宏利用数据分析工具,各种指标就出来了。
(五)图表运用年三大产业比重情资料,制作直方图、折线图、饼图。
-2008根据某地1990年所示。
首先把数据输入工作表中,如图1
利用插入图表功能,选中数据区域,生成折线图、直方图、饼图。
实训
(二)统计分组
一、实训目的
掌握Excel在统计资料搜集和整理中的应用。
用Excel进行统计分组和抽样数据搜集。
掌握利用Excel进行抽样的基本方法,掌握频数分布表和直方图数据分析基本技巧和操作方法。
二、实训内容
(一)(抽样)利用数据分析工具进行随机抽样。
假设欲对某公司50名工人工资进行调查,现要抽取10个,采用随机抽样和等距抽样方法分别确定抽取的员工编号。
(二)(函数法进行统计分组和编制频数分布表)在Excel中利用函数进行统计分组和编制频数分布表可利用COUNTIF()和FREQUENCY()等函数,但要根据变量值的类型不同而选择不同的函数。
当分组标志是品质标志时应使用COUNTIF()函数;当分组标志是数量标志时应使用FREQUENCY()函数。
三实训步骤及结果分析、1.首先将数据输入Excel单元格中,观察数据的类型个数,在工作表中的空余位置列出各组名称,如图所示。
.
第一,将上述资料输入Excel工作表;在单元格D2中输入“工作单位性质”,在E2中输入“学生人数”,在D3:
D6区域中依次输入国家机关、事业单位、企业、自主创业,表示分组方式,同时这也可以表示分组组限。
第二,选择单元格E3至E6区域,在“插入”菜单中单击“函数”选项,打开“粘贴函数”对话框;在“函数分类”列表中选择“常用函数”或者选择“统计”也可以,在“函数名”列表中选择“COUNTIF”。
第三,单击“确定”按钮,Excel弹出“函数参数”对话框。
在数据区域“Range”中输入单元格B2:
B31,在数据接受区间Criteria中输入单元格D3:
D6。
第四,由于频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应按Ctrl+Shift组合键,同时敲“回车”键,得到频数分布。
2.运用同样的方法可以将学生的英语成绩统计出来。
利用“直方图”工具进行统计分组3.直方图分析工具是一个用于确定数据的频数分布、累计频数分布,并提供
计它在给定工作表中数据单元格区域和接收区间的情况下,直方图的分析模块。
算数据的频数和累积频数.
这道题应该注意的是频数分布是数组操作,所以,此处不能直接单击“确定”按,得出频数分布。
组合键,同时敲“回车”键钮,而应按Ctrl+Shift
置信区间估计与假设检验应用实训实训(四)
一、实训目的
检验)及置信区间应用。
Excel软件中假设检验方法(单样本t掌握二、实训内容从某日生产的某厂生产的一种无缝钢管服从正态分布。
在正常生产情况下,根,测得其内径分别为:
钢管中随机抽取10mm)55.4、、55.5(单位:
52.1、54.2、、54.2、55.0、55.855.153.8、54.0、要求:
95%的置信区间?
(1)请建立该批无缝钢管平均内径的显著5%)若该日无缝钢管的内径服从均值为54mm的正态分布。
试在(2性水平下检验该日产品的生产是否正常?
三、实训步骤及结果分析
(一)区间估计s=1.0948871函数):
)计算样本标准差((1STDEV
x=54.51
函数):
AVERAGE
(2)计算样本平均值(t)TINV使用函数为显著性水平的一半,t)(3利用分布函数计算(。
=2.6850168?
2/
)计算抽样误差=0.929641251。
(4n/ts?
2/(5)构造置信区间(54.51-0.929641251,54.51+0.929641251)
(二)假设检验
(1)设定假设
?
原假设:
54?
:
H0?
备择假设:
54?
H:
1
(2)计算样本标准差(STDEV函数):
s=1.0948871
x=54.51
:
)计算样本平均值(AVERAGE函数)(3t=2.6850168。
(为显著性水平的一半,使用函数利用)t分布函数计算TINV)(4?
2/
?
?
x0=1.472994
()计算统计量5?
t
n/st,所以不拒绝原假设。
小于)决策:
(6t?
2/(三)用P值检验
(1)计算统计量t
(2)利用函数TDIST计算P值,即TDIST(1.472994,9,2)=0.17484316>0.05,。
不拒绝原假设结果如下:
有老师做时弄成了单侧检验,这道题注重考了对假设的检验,这题为双侧检验,二看是否落在拒绝域。
两种方法,一是计算出统计量和给定的显着性水平比较,,拒绝原假设。
P<α值,检验,计算出是PPP>,不拒绝原假设,α
实训(五)方差分析应用实训
一、实训目的
掌握Excel软件中方差分析应用(单因素方差分析和双因素方差分析)
二、实训内容
(1)某城市东西南北5个地区发生交通事故的次数如下表所示。
由于是随机抽样,有一些地区的汽车密度高、发生事故多(如南部和西部),而有些地区汽车密度低、发生事故少(如东部)。
试以α=5%的显著水平检验各地区平均每天交通事故次数是否相等?
表1某城市5个地区交通事故发生次数
西部南部中部北部东部
1312101415
129171014
91371314
1415111710
1012148-
9
-
-
-
7
)2(种不同的4种施肥方式和某农科所实训在水溶液中种植西红柿,采用了3的溶液;每月给水温。
1/2种施肥方式一开始就给可溶性的肥料;每两个月给3℃。
实验结果的产量如下表所℃、的溶液。
水温分别为1/4以416℃、10℃、20示。
施肥方式水温.
2表四次施肥一次施肥二次施肥
不同水温2120冷℃19
平不同施14151℃16凉方式下的119℃110
红柿产6
℃8
7
2(
=5%)?
问施肥的方式和水温对产量的影响是否显著(α三、实训步骤及结果分析
(一)单因素方差分析(?
?
?
?
?
?
?
?
H:
?
1)设定假设:
原假设:
0西中东北南?
?
?
?
?
不全相等,,:
H,,备择假设:
1西中东南北>单因素方差分析。
)工具——>数据分析——(2F>F)决策:
拒绝原假设。
(3?
二)双因素方差分析()假设:
(1?
?
?
?
?
施肥方式对产量没有有影响列因素(施肥方式)原假设:
:
H321:
0?
?
?
H,,:
施肥方式对产量有显著影响不全相等1321.
行因素(水温)H?
?
?
?
?
?
:
?
0冷凉温热水温对产量没有影响?
?
?
?
H,,:
,热1凉温冷水温对产量有影响
(2)操作:
工具——>数据分析——>双因素方差分析。
(3)决策
从上表可以看出F=1.423077 因为F行=78.4>Fcrit=4.75706,所以拒绝原假设,表明水温对产量有显著影响。 F列=0.25 相关与回归分析实训实训(六)一、实训目的 软件中回归分析及相关分析应用掌握Excel二、实训内容 零售商要了解每周的广告费X及消费额Y之间的关系,记录如表所示。 表1每周广告费X与消费额Y数据表 523848402255X402025185045 515248494256364039474438Y 0 0 5 0 5 0 5 5 0 0 0 5 )画出散点图;1)计算相关系数,并进行相关系数的显著性检验(α;=5%)2)求出线性回归方程,并评价其拟合程度;3)=5%)请对回归系数作统计检验。 4(α三、实训步骤及结果 (一)散点图 图表——>图标类型——>XY散点图 (二)计算相关系数并检验 (1)工具——>数据分析——>相关系数 (2)函数CORREL (3)相关系数显著性检验 ①提出假设: ? ? 0: H原假设: 0? ? : H0备择假设: 0. rn? 2=4.592645 ②计算统计量: ? t ? ③计算临界值==2.228139(函数TINV)2)(12nt(? 2)? t? 0.05④决策: t>,拒绝原假设,说明线性相关性显著。 2)(n? t? (三)求线性回归方程并评价 (1)工具——>数据分析——>回归 22=0.810392,回归效果较好。 判断。 根据回归分析表知道 (2)评价: 根据RR? 为例)(四)对回归系数进行统计检验(以 (1)提出假设: ? ? 0H: 原假设: 0? ? : 0H备择假设: 1? ? t=6.20212247183085 (2)计算检验统计量: ? )(Set(n? 2)? t(12? 2)=2.633767(3)计算临界值: (函数TINV)。 ? 0.025/2t(n? 2),拒绝原假设。 表明X是影响Y)决策: 因为(4t>的一个重要因素。 ? 2/ 2RR的平方根,又称为相关系数,它用来衡量变(复相关系数: )1、MultipleRxy之间相关程度的大小。 和量 如例中: R为0.900217688258665,表示二者之间的关系是高度正相关。 2,即可决系数R)复测定系数: 用来说明用自变量解释因变量变2、RSquare(差的程度,以测量同因变量y的拟合效果。 2R)调整复测定系数: 仅用于多元回归才有意义,它用3、AdjustedRSquare(于衡量加入独立变量后模型的拟合程度。 当有新的独立变量加入后,即使这一变22RR仅用于比较含有同修正的未经修正的也要增大,量同因变量之间不相关,一个因变量的各种模型。 4、标准误差: 又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量,此值越小,说明拟合程度越好。 5、观测值: 是指用于估计回归方程的数据的观测值个数。 模块二: 方差分析表 F检验来判断回归模型的回归效果。 方差分析表的主要作用是通过1、df列为自由度 2、SS为平方和 3、MS为均方差: MS=SS/df ESS/1~F(1,n? 2)F? 。 4、为对回归方程进行显著性检验的统计量。 F 2)? n/(RSS. 5、SignificanceF相当于计算后所得到的P值。 6、回归方程显著性检验的方法: (1)提出假设: ? 原假设: 0H: ? 0? 备择假设: 0H: ? 1ESS/1,一般方差分析表都给出。 计算统计量: (2)? F RSS/(n? 2)计算临界值)(32)? (1,nF? 决策: (4) F(1,n? 2),拒绝H,表明X方法一: 如果F>和Y之间存在显著的线性关系。 0? ? ,拒绝H,表明X和Y之间存方法二: 如果SignificanceF小于显著性水平0在显著的线性关系。 回归参数表: ? : 截距Intercept1、? (截距)和β(第二、三行: 斜率)的各项指标。 2、? (截距)和β(斜率)的值。 3、第二列: 回归系数4、第三列: 回归系数的标准误差 t的值。 计算的样本统计量=β=0: 、5第四列: 根据原假设Hβ10op值6、(第五列: 各个回归系数的双侧) 7、? 的置信区间的上下限。 为β第六列: 95%和实训总结 通过这次实训,对自己的统计学知识有了更深的理解,做到了学以致用,也加强了计算机基础知识的巩固,另外,在本次的实训活动中我们所收获知识较多既有学习中的也有生活中。 在学习中我们将自己所学的知识应用于实际的操作中,理论和实际是不可分的,在实践中我的知识得到了巩固,解决问题的能力也受到了锻炼。 本次实训还开阔了我的视野,使我对统计在现实中的运作有了进一步的理解。 我们这次实训时间较短,只是短短的两天。 我们所学到的知识相对来说还是少之又少的,因此,在以后涉及到日常的自我训练,要学会自己运用计算机等工具,处理统计计算问题。 同时,我们以后无论是在学习知识上,还是实际运用上都要学习运用统计学知识。 .
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 报告