统计学实训报告.docx
- 文档编号:25818733
- 上传时间:2023-06-15
- 格式:DOCX
- 页数:25
- 大小:433.31KB
统计学实训报告.docx
《统计学实训报告.docx》由会员分享,可在线阅读,更多相关《统计学实训报告.docx(25页珍藏版)》请在冰豆网上搜索。
统计学实训报告
四川师范大学经济与治理学院
统计分析实训报告册
课程名称统计分析软件应用实训
专业国际经济与贸易
班级2021级4班
学生姓名杨冬梅
学号29
指导教师张谦
实训一
一、实训目的
利用Excel把握成立数据文件、数据整理、数据描述与显示等操作。
能计算各类平均指标、离散指标,会应用大体统计函数,会利用Excel描述统计工具进行统计分析。
二、实训内容、步骤、结果分析
(一)大体函数利用
1.实训内容
(1)计算个人平均成绩,按平均分从大到小进行排序,挑选出学习成绩最好、最差的3个同窗;
(2)求这3门课的平均分和标准差、最大值、最小值、峰度、偏度;
表1某班学生期末成绩单
学号
性别
数学
语文
外语
学号
性别
数学
语文
外语
0301
女
88
86
72
0311
男
56
65
72
0302
男
75
88
90
0312
男
82
78
88
0303
男
80
76
63
0313
女
72
76
63
男
75
92
78
男
78
80
86
0304
0314
0305
女
65
70
58
0315
男
80
77
66
0306
女
72
50
80
0316
女
65
78
81
0307
女
91
88
95
0317
男
98
76
80
0308
男
68
76
81
0318
男
60
77
66
0309
女
72
77
79
0319
女
70
67
68
0310
女
95
88
96
0320
男
82
78
75
1.实训步骤
(1)先利用AVERAGE函数,计算出学号为301的平均分,然后利用填充柄计算出其他同窗的平均分。
选中A1:
F21,选择自概念排序,按“平均分”降序排序,再突出显示单元格,别离挑选出排名最靠前和靠后的三名同窗,用红色字体突出显示成绩最好的三位同窗,用蓝色字体显示成绩最差的三名同窗。
(2)用AVERAGE函数计算出全班数学、语文、外语的平均数;
用STDEV函数计算出全班数学、语文、外语的标准差;
用MAX函数计算出全班数学、语文、外语的最大值;
用MIN函数计算出全班数学、语文、外语的最小值;
用KURT函数计算出全班数学、语文、外语的峰度系数;
用SKEW函数计算出全班数学、语文、外语的偏度系数。
2.实验结果分析
(1)计算出全班每位同窗的平均分,降序排序后,挑选出成绩最好的三名同窗为310,307,317;成绩最差的三名同窗306,305,311。
(2)
用AVERAGE函数计算出全班数学、语文、外语平均分别离为,,;
用STDEV函数计算出全班数学、语文、外语标准不同离为11.,;;
用MAX函数计算出全班数学、语文、外语最大值别离为98,92,96;
用MAN函数计算出全班数学、语文、外语最小值别离为56,50,58;
用KURT函数计算出全班数学、语文、外语峰度系数别离为,,,别离为平峰、尖峰、平峰散布;
用SKEW函数计算出全班数学、语文、外语偏度系数别离为,,,别离为右偏、左偏、右偏散布。
(二)计算各类平均指标
1.实训内容
(算术平均数)中国股市中的10种股票在2021年9月1日收盘价如表,求该10种股票价钱当日的平均价钱。
股票代码
证券名称
价格
股票代码
证券名称
价格
600519
贵州茅台
300002
神州泰岳
124
002310
东方园林
002304
洋河股份
110
300026
红日药业
002294
信立泰
600547
山东黄金
600150
中国船舶
300024
机器人
300011
鼎汉技术
73
(1)(加权平均数)某公司员工工资情形如下表,计算平均工资。
按工资分组
频数
组中值x
xf
1600以下
4
1600-1700
6
1700-1800
12
1800-1900
15
1900-2000
3
合计
40
(2)(调和平均数)成都某小区菜市芹菜的价钱,早上元/kg,中午元/kg,晚上元/kg。
若是早、中、晚各买1KG,求平均价钱。
(3)(几何平均数)孙女士到中国银行存入一笔资金,按复利计算,10年的年利率别离是%有3年,%有2年,%有2年,5%有3年。
计算其平均存款利率。
(4)(中位数、众数)依照上面
(1)的股票价钱求中位数。
依照上面
(2)员工工资表计算众数。
2.实训步骤
(1)在EXCEL中依次输入当天十只股票的价钱,用AVERAGE函数计算当天十支股票平均价钱。
(2)输入各组组中值,计算出各组xf值和合计xf值,再用合计xf值除以权数40,取得加权平均数,即该公司的平均工资。
(3)用HARMEAN函数计算出调和平均数。
(4)在EXCEL中输入十年的年利率,用GEOMEAN函数计算出十年的几何平均数利率。
(5)先排序,再用MEDIAN函数计算出当日十支股票的中位数。
挑选工资频数的最大值,用黄色填充该单元格,那么该频数对应的工资水平计算为众数。
3.实训结果分析
(1)计算出当天十支股票平均价钱结果为。
(2)计算出该公司的平均工资为。
(3)计算出调和平均数结果为。
(4)计算出十年的平均利率为%
(5)计算出中位数为,计算出众数为1850。
(三)计算各类离散指标
1.实训内容
(1)(极差)景领导在2021年度工资收入别离是5280、642一、734五、488八、7243、689六、588九、7124、758六、9200、7854、8455,计算其工资收入的极差。
(2)(标准差和方差)依照
(二)
(2)题的员工工资表计算员工工资收入的方差和标准差。
(3)(离散系数)依照
(二)
(2)题的员工工资表计算员工工资收入的离散系数。
2.实训步骤
(1)在EXCEL表格中输入2021年度每一个月的工资,用MAX(B1:
B12)-MIN(B1:
B12)函数,取得其工资极差。
(2)先计算出所有工资的加权平均数平均数,在组中值后一列,计算出“=B20*(C20-$C$25)^2”的值,即每一个分组与均值的的加权离差平方和,然后在D25单元格用SUM函数求和D20:
D24的值,即所有分组的加权离差平方和之和,在D26单元格计算“=D25/(B25-1)”的值,取得方差,在D27单元格用SQRT函数计算出标准差。
(3)先计算出工资的加权平均数,再用STDEV函数计算出标准差,再用标准差除以加权平均数,取得离散系数。
3.实训结果分析
(1)如图,取得其工资极差为4312元,这说明其月收入差距较大。
(2)计算取得员工工资的方差为12250,标准差为。
(3)计算取得工资的离散系数为,说明员工工资散布较集中。
(四)利用描述统计工具进行指标分析
(1)实训内容
现有300名员工,从中随机抽取30名员工的工资进行统计,具体资料为356九、3107、3013、2187、184八、168九、136八、134二、125六、1133、1157、108二、108八、2874、2310、176二、317二、193九、185一、1480、1424、1354、1700、1097、2003、3133、317六、145九、1097、1396,利用描述统计工具对工资进行统计。
(2)实训步骤
在EXCEL表中输入数据,选择数据分析中的描述统计,选择计算区域为A1:
A30单元格,选中汇总统计和平均数置信度,点击确信,取得描述统计的结果。
(3)实训结果分析
如下图,取得描述统计结果:
平均数为;标准误差为;中位数为;众数为1097;标准差为;方差为602916;峰度为,即平峰散布;偏度为,即右偏散布;最小值为1082,最大值为3569;区域为2487,即极差为2487;工资总和为57066;由平均数和置信度可计算取得,在95%的置信度度水平下的区间估量为。
三、实训总结
1.我通过利用Excel把握了成立数据文件、数据整理、数据描述与显示等操作。
能熟练计算各类平均指标、离散指标,会应用大体统计函数,会利用Excel描述统计工具进行统计分析。
2.我学会了利用众数、中位数、分位数、均值、几何平均数等来测度数据的集中趋势,利用极差、方差、标准差、离散系数。
偏度和峰度系数等来测度数据的离散程度,进而更好的把握和分析数据。
实训二
一、实训目的
把握用Excel进行统计分组。
把握频数散布表和直方图数据分析大体技术和操作方式。
利用统计图表工具进行数据直观分析。
把握Excel柱形图、条形图、折线图、饼图、散点图、面积图、环形图等各类图形工具的利用方式和统计作用。
二、实训内容、步骤及结果分析
1.函数法进行统计分组、编制频数散布表、绘制直方图
(1)实训内容
在Excel中利用函数进行统计分组和编制频数散布表可利用COUNTIF()和FREQUENCY()等函数,但要依照变量值的类型不同而选择不同的函数。
某区共有30家企业,他们类型情形如下表,试编制此区企业类型的频数散布表,并生成直方图和拆线图(要求归并在一张图上)。
企业编号
企业类型
企业编号
企业类型
1
中型企业
16
中型企业
2
大型企业
17
大型企业
3
大型企业
18
小型企业
4
小型企业
19
小型企业
5
小型企业
20
中型企业
6
小型企业
21
小型企业
7
中型企业
22
小型企业
8
大型企业
23
中型企业
9
中型企业
24
小型企业
10
小型企业
25
中型企业
11
中型企业
26
大型企业
12
小型企业
27
中型企业
13
小型企业
28
大型企业
14
大型企业
29
小型企业
15
中型企业
30
小型企业
(2)实训步骤
a)先在EXCEL中别离输入该地域30家企业的类型,用COUNTIF函数计算大型企业、中型企业和小型企业的数量,制作出该地域企业类型情形的频率散布表。
b)利用数据分析工具,选择直方图,选择数据区域,点击确信,取得直方图,再把直方图的分类间距调整为0。
c)选中该地域企业类型情形的频率散布表,点击插入图表,制作出折线图,调整横纵轴距离。
(3)实训结果分析
如图,取得该地域企业类型情形的频率散布表、直方图和折线图,能够看出该地域的企业以大中型企业为主。
2.其他图形
(1)实训内容
依照某地三大产业情形大体数据,绘制该地三个产业的条形图、饼图、折线图。
年份
第一产业
第二产业
第三产业
1990
17
1995
44
2000
29
2004
2005
2006
2007
2008
(2)实训步骤
a)在EXCEL中输入该地三大产业情形大体数据,选中输入的数据,插入条形图,编辑条形图横纵轴坐标序列,横轴为各产业所占比率,纵轴为年份。
b)选中该地域2020年三大产业散布数据,插入饼状图。
c)选中所输入的数据,插入折线图。
(3)实训结果分析
如下图,取得该地域三大产业散布情形的条形图、饼图和折线图。
从折线图和条形图能够看出,该地域近二十年来产业结构发生了庞大的转变。
第一产业比重持续下降,第二产业持续增大,第三产业比重整体上也不断增大;其中,第二产业比重最大
。
第二、三产业比重的转变,反映了该地域产业结构在慢慢优化。
从饼图能够看出,2020年该地域的第二产业所占比最大,达到了48%,第三产业次之,说明了该地域的产业结构仍以第二产业为主导,第三产业水平还不够高,仍需转变进展方式,增进产业结构调整。
三、实训总结
1.通过本节实训练习,我学会了频数散布表和直方图数据分析大体技术和操作方式,学会了利用统计图表工具进行数据直观分析。
2.我把握了Excel柱形图、条形图、折线图、饼图、散点图、面积图、环形图等各类图形工具的利用方式和统计作用。
3.通过折线图能直观看出数据的进展趋势;直方图应用比较普遍,但可能造成数据丢失;饼图能够形象直观地看出各组成部份所占比例,便于比较等。
实训三
一、实训目的
把握Excel软件中假设查验方式(单样本t查验)及置信区间应用。
二、实训内容
在正常生产情形下,某厂生产的一种无缝钢管服从正态散布。
从某日生产的钢管中随机抽取10根,测得其内径别离为:
、、、、、、、、、(单位:
mm)
(一)区间估量
成立该批无缝钢管平均内径95%的置信区间。
(二)假设查验
假设该日无缝钢管的内径服从均值为54mm的正态散布。
试在5%的显著性水平下查验该日产品的生产是不是正常?
(三)用P值查验
对第
(二)题的假设查验采纳P值查验方式进行查验
三、实训步骤
(一)区间估量
(1)在EXCEL中输入10个样本数据,利用AVERAGE函数计算出其均值,再利用STDEV函数取得其标准差。
(2)查t散布表,取得显著性水平α=下自由度为9的t值
(3)依照公式
写出置信区间
(二)假设查验
(1)、提出原假设和备择假设。
(2)、依照
(一)取得样本均值和样本标准差,计算出查验统计量t。
(3)、用t和
相较得出结论。
(三)用P值查验
(1)进入EXCEL界面,插入函数f(x),在函数分类中点击“统计”,并在函数名单下选择“TDIST”,然后点击确信。
(2)在弹出的对话框的“X”栏中输入计算出的t的绝对值“”。
在“Deg_freedom”(自由度)栏中,输入自由度“9”。
在“Tails”栏中,输入“2”。
四、实训结果及分析
(一)区间估量:
由于样本数据为10,为小于30的小样本,且其整体方差
未知,那么用样本方差
代替整体方差
,故样本通过标准化的随机变量服从自由度为(n-1)的t散布。
由抽样结果计算取得,
依照α=查t散布表取得
那么平均内径的置信区间为
即(,),该批无缝钢管平均内径95%的置信区间为。
(二)假设查验
依题意成立如下原假设与备择假设:
H0:
u=54该日产品的生产是正常的
该日产品的生产不正常的
依照样本数据取得:
,
由于n<30为小样本,计算查验统计量为:
依照自由度n-1=10-1=9,查t散布表得:
由于
因此不拒绝原假设,样本提供的数据还不足以推翻原假设,即该日产品的生产正常。
(三)用P值查验
Excel计算的P值结果为,如下图。
由于P值=>,因此不拒绝原假设,样本提供的数据还不足以推翻原假设,即该日产品的生产正常。
五、实训总结
1.在进行区间估量时,应第一分析题目条件,看原整体是不是服从正态散布、整体方差是不是已知、用于构造估量量的样本是大样本仍是小样本等几种情形,不同的条件下样本数据服从不同的散布形态。
在写出置信区间后,注意结合题目分析其现实意义。
2.在进行假设查验时,一样要考察所抽取的样本是不是为大样本、是不是服从正态散布、整体方差是不是已知等几种情形。
不用的假设条件下,在对整体进行假设查验时,所采纳的查验步骤和查验统计量不同。
另外,在提出假设时,主义原假设和备择假设的选取。
3.在利用P值进行决策时,P值越小,说明观测到的数据与H0
之间不一致的程度就越大,查验的结果也就越显著。
不论是单侧查验,仍是双侧查验,用P值进行决策的原那么为:
若是P值<
,拒绝H0;若是P值>
,不拒绝H0。
实训四
一、目的要求
把握Excel软件中方差分析应用(单因素方差分析和双因素方差分析)
二、实训内容
(一)单因素方差分析
某城市东西南北5个地域发生交通事故的次数如下表所示。
由于是随机抽样,有一些地域的汽车密度高、发生事故多(如南部和西部),而有些地域汽车密度低、发生事故少(如东部)。
试以
=5%的显著水平查验各地域平均天天交通事故次数是不是相等?
表1某城市5个地域交通事故发生次数
东部
北部
中部
南部
西部
15
17
14
11
-
-
12
10
13
17
14
-
10
14
13
15
12
-
14
9
7
10
8
7
13
12
9
14
10
9
(二)双因素方差分析
某农科所实训在水溶液中种植西红柿,采纳了3种施肥方式和4种不同的水温。
3种施肥方式一开始就给可溶性的肥料;每两个月给1/2的溶液;每一个月给以1/4的溶液。
水温别离为4℃、10℃、16℃、20℃。
实验结果的产量如下表所示。
表2不同水温水平不同施肥方式下的西红柿产量
水温
施肥方式
一次施肥
二次施肥
四次施肥
冷(4℃)
凉(10℃)
温(16℃)
热(20℃)
20
16
9
8
19
15
10
7
21
14
11
6
问施肥的方式和水温对产量的阻碍是不是显著(
=5%)?
三、实训步骤
(一)单因素方差分析
在EXCEL中输入数据,点击数据分析,选择方差分析,在弹出的对话框中的“输入区域”选择样本数据所在的单元格,在“
”方框中输入“”,点击确信,取得方差分析结果。
(二)双因素方差分析
在EXCEL中输入数据,点击数据分析,选择无重复因素方差分析,在弹出的对话框中的“输入区域”选择样本数据所在的单元格,在“
”方框中输入“”,点击确信,取得方差分析结果,如以下图所示。
四、实训结果及分析
(一)单因素方差分析
1.提出假设:
各地域平均天天交通事故次数相等
H1:
ui(i=1,2,3,4,5)不完全相等各地域平均天天交通事故次数不相等
用Excel给出单因素方差分析的计算结果,如以下图:
依照方差分析表得出如下结论:
由于
,因此拒绝原假设,即
不成立,说明
之间的不同是显著的,即各地域平均天天交通事故次数不相等。
(二)双因素方差分析
第一对两个因素别离提出如下假设:
对行因素提出假设:
气温对产量没有阻碍
H1:
ui(i=1,2,3,4)不完全相等气温对产量有阻碍
对列因素提出假设:
施肥方式对产量没有显著阻碍
H1:
ui(i=1,2,3)不完全相等施肥方式对产量有显著阻碍
用Excel给出无重复双因素方差分析的计算结果,如以下图:
依照方差分析表得出如下结论:
由于
,因此拒绝原假设,说明
之间的不同是显著的,即气温对产量有阻碍。
由于
,因此不拒绝原假设,说明
之间的不同是不显著的,即施肥方式对产量没有显著阻碍。
五、实训总结
通过本章实训,我学会了用方差分析来查验整体均值是不是相等。
依照所涉及到的变量的多少,方差分析要紧有单因素方差分析和双因素方差分析。
单因素方差分析是研究一个分类的自变量与一个数值的因变量之间的关系,双因素方差分析那么是研究两个分类的自变量同因变量之间的关系。
关于双因素方差分析,当研究的两个因素之间无交互作历时,称为无交互作用的双因素方差分析或无重复双因素方差分析,当所研究的两个因素之间有交互作历时,称为有交互作用的双因素方差分析或可重复双因素方差分析。
实训五
一、实训目的
把握Excel软件中回归分析及相关分析应用
二、实训内容
零售商要了解每周的广告费X及消费额Y之间的关系,记录如表所示。
表1每周广告费X与消费额Y数据表
X
40
20
25
18
50
45
40
22
55
48
38
52
Y
385
400
395
365
475
440
490
420
560
525
480
510
(1)画出散点图;
(2)计算相关系数,并进行相关系数的显著性查验(
=5%);
(3)求出线性回归方程,并评判其拟合程度;
(4)请对回归系数作统计查验。
(
=5%)。
三、实训步骤
(1)画出散点图:
在Excel中输入表格数据,插入散点图,点击“设计”的“选择数据”,然后点击左栏添加,选中横纵坐标所在单元格,单击确信。
如下图:
(2)计算相关系数:
点击数据,选择数据分析,在弹出的对话框中下拉选中“相关系数”,点击确信,然后在弹出的对话框中,输入输入区域数据和输出区域单元格,点击确信,取得相关系数分析表。
(3)求出线性回归方程:
点击数据,选择数据分析,在弹出的对话框中下拉选中“回归”,点击确信,然后在弹出的对话框中,别离在X和Y值的输入区域输入X和Y值,选择输出区域单元格,点击确信,取得回归分析表。
(4)题同(3)题步骤。
四、实训结果及分析
(1)画出散点图:
如下图为每周广告费X与消费额Y的散点图。
(2)计算相关系数:
如图,用回归方式取得相关系数。
a)求出相关系数为:
b)依照Excel进行显著性查验:
提出假设:
查验统计量
由上得:
r=
由题知:
n=12解得
又由显著性水平
取得
取得结论:
因为
,因此拒绝原假设
。
(3)求出线性回归方程:
如图取得回归分析表,
从表中可取得,估量的截距项
,估量的斜率系数
,即估量出的样本回归函数为:
这说明广告费每增加一个单位,消费额将增加个单位。
从表中可取得标准误差为,数值较小,说明回归方程的拟合程度较好。
(4)对回归系数作统计查验:
提出原假设与备择假设为:
原假设:
备择假设:
显著性水平
,查t散布表得
由3题中的图可得:
的
说明拒绝
,即说明每周的广告费X对消费额Y有显著性阻碍。
又由表上取得SignificanceF=,相当于计算后所取得的P值,与显著性水平α比较,SignificanceF=<α=,因此拒绝原假设,说明X和Y之间存在显著的线性关系。
五、实训总结
1.现代意义的回归是关于一个变量对另一个或多个变量依存关系的研究,其目的是要依照已知的或固定的自变量的数值,去估量因变量的整体平均值。
回归函数分为整体回归函数和样本回归函数。
回归分析的母的是用样本回归函数去估量整体回归函数。
2.回归系数的查验可用t查验。
整个回归方程的查验,需要在方差分析的基础上作F查验。
利用估量的线性回归模型对因变量能够做点估测,也能够做区间内预测。
相关分析和回归分析的实际计算和图形的刻画能够应用Excel来完成。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 报告