统计学文档格式.docx
- 文档编号:19203881
- 上传时间:2023-01-04
- 格式:DOCX
- 页数:23
- 大小:62.96KB
统计学文档格式.docx
《统计学文档格式.docx》由会员分享,可在线阅读,更多相关《统计学文档格式.docx(23页珍藏版)》请在冰豆网上搜索。
3000
3500
150
800
950
品牌
1000
1600
3400
300
240
480
1020
男求和项:
2600
5000
10200
680
420
1320
2420
女
700
3700
120
465
815
2100
3200
600
330
930
1300
50
80
130
女求和项:
1200
8200
880
200
795
1875
平均月生活费(元)汇总
5900
3800
8700
18400
月平均衣物支出(元)汇总
1560
620
2115
4295
二、频数分布表的编制
(一)使用Excel数据透视表
根据教材P51页例3.3的原始资料资料(见实验一数据2—透视表数据)编制频数分布表
使用数据透视表编制一张如表3-4(P52)的频数分配表
参考教材P48-50
选择【数据】菜单中的【数据透视表和数据透视图】
在【向导—布局】对话框中,依次将“分类变量“(这里是饮料品牌)连续拖放两次:
一次拖至左边的“行”区域,一次拖至“数据”区域
计数项:
饮料类型
顾客性别
果汁
1
5
6
矿泉水
4
10
绿茶
7
11
其他
2
8
碳酸饮料
9
15
22
28
(二)使用FREQUENCY函数或直方图工具
根据教材P51页例3.3的原始资料资料(见实验一数据2—直方图与函数数据)编制频数分布表
使用Excel中的FREQUENCY函数或直方图工具编制一张频数分配表
参考教材P64
第1步.选择与接受区域相临近的单元格区域,作为频数分布表输出的区域
第2步.选择统计函数中的【FREQUENCY】函数
第3步.在对话框【Date-array】输入数据区域,在【Bins-array】输入接受区
第4步.同时按下“ctrl-shift-Enter”组合键,即得到频数分布.
需要对输出结果进行必要的编制
接收
频率
累积%
12.00%
32.00%
62.00%
84.00%
100.00%
三、茎叶图的制作
根据教材P61页例3.6的原始资料资料(见实验一数据3.sav)制作茎叶图
使用SPSS的制作茎叶图
选择【Analyze】下拉菜单,并选择【Descriptivestatistics-Explore】选项进入主对话框
在主对话框中将变量选入【Variables】,点击【Plots】,在对话框中选择【Stem-and-leaf】
(根据需要可选【Histogram】以给出直方图)。
点击【Continue】回到主对话框。
点击【OK】
:
销量Stem-and-LeafPlot
FrequencyStem&
Leaf
3.0014.134
1.0014.9
5.0015.02334
4.0015.5689
8.0016.00112334
8.0016.55567888
13.0017.0112222233444
14.0017.55556677888999
7.0018.0012234
13.0018.5667777888999
6.0019.001244
11.0019.55666667788
5.0020.01233
5.0020.56789
6.0021.001134
2.0021.58
1.0022.3
3.0022.568
4.0023.3344
1.00Extremes(>
=237)
Stemwidth:
10.00
Eachleaf:
1case(s)
四、箱线图的制作
根据教材P68页例3.7的原始资料资料(见实验一数据4.sav)制作箱线图
使用SPSS的制作多批数据箱线图
参考教材P69
实验二:
数据的描述统计
68
89
88
84
86
87
75
73
72
82
97
58
81
54
79
76
95
71
60
90
65
85
92
64
57
83
78
77
61
70
1.实验内容:
某班40名学生的考试成绩数据如下:
学校规定:
60分以下为不及格,60~70分为及格,70~80分为中,80~90分为良,90~100分为优.
2.要求:
使用Excel或SPSS软件完成如下内容:
(1)用FREQUENCY函数将该班学生分为不及格,及格,中,良,优五组,编制一张次数分配表;
(2)采用描述统计工具计算该未分组数据的描述统计的相关指标;
(选择分析工具库中的描述统计工具)
(3)使用分组数据计算相关的指标;
依据分组表计算:
均值,方差,标准差,标准误差,众位,中位数
(4)对(3)和(4)的结果进行比较分析,看结论是否一致。
3.实验过程:
参考实验指导过程
附:
(1)使用SPSS中的相关工具完成数据分组※;
对资料进行分组:
Transform-Recode-IntoDifferentVariable
(2)使用SPSS对分组后的数据计算描述统计的相关指标※
对已分组的资料进行频数分析
对频数进行加权Data-WeightCases
求分组数据的频数分析表和描述统计量
Analyze-DescriptiveStatistics-Frequencies
实验结果:
(分别选用SPSS工具和EXCEL的描述统计工具)
(1):
按成绩分组
人数
60以下
3
60-70
70-80
80-90
12
90以上
合计
Statistics
平均
76.79487
标准误差
1.71332
中位数
众数
标准差
10.69968
方差
114.4831
峰度
-0.43916
偏度
-0.26523
区域
43
最小值
最大值
求和
2995
观测数
39
最大
(1)
最小
(1)
组别
N
Valid
Missing
组别
Frequency
Percent
ValidPercent
CumulativePercent
7.5
60-70
15.0
22.5
70-80
37.5
60.0
80-90
30.0
90.0
10.0
100.0
Total
CJFZ
Mean
77.0000
Median
77.5926(a)
Mode
75.00
Std.Deviation
10.66987
Variance
113.84615
Range
40.00
Minimum
55.00
Maximum
95.00
aCalculatedfromgroupeddata.
CJFZ
65.00
85.00
实验三:
假设检验与方差分析
假设检验—实验内容与步骤
一、双样本等方差假设
实验内容:
甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:
cm)分别服从正态分布,并且有12=22。
为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。
在=0.05的显著性水平下,样本数据是否提供证据支持“两台机床加工的零件直径不一致”的看法?
(数据见假设检验数据1)
实验步骤:
参考实验指导
结果输出与分析:
t-检验:
双样本等方差假设
变量1
变量2
19.925
20.14285714
0.216428571
0.272857143
观测值
合并方差
0.242472527
假设平均差
df
13
tStat
-0.854848035
P(T<
=t)单尾
0.204056849
t单尾临界
1.770933383
=t)双尾
0.408113698
t双尾临界
2.160368652
H0:
U1-U2=0H1:
U1-U2≠0a=0.05n1=8n2=7
t=-0.854848035<
0,不能拒绝H0,没有证据表明两台机床加工的零件直径不一致
二、双样本异方差假设
“多吃谷物,将有助于减肥。
”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,一类为经常的谷类食用者(n1),一类为非经常谷类食用者(n2)。
然后测度每人午餐的大卡摄取量。
经过一段时间的实验,得到如右结果:
检验该假设(=0.05)(数据见假设检验数据2)
参考实验指导和教材P230例11
双样本异方差假设
583
629.25
2431.428571
3675.460526
20
33
-2.486888876
0.009059379
1.692360258
0.018118757
2.034515287
H0:
u1-u20H1:
u1-u2<
0a=0.05n1=15,n2=20
t=-2.486888876拒绝H0,多吃谷物将有助于减肥。
三、成对双样本均值假设
一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。
为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:
在=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?
(数据见假设检验数据3)
参考实验指导和教材P235例10.15
结果输出与分析:
成对双样本均值分析
训练前
训练后
101.25
91.4
63.40277778
50.48888889
泊松相关系数
0.963753015
8.5
1.941268615
0.042068932
1.833112923
0.084137865
2.262157158
u1–u2≤8.5H1:
u1–u2>8.5a=0.05df=10-1=9
T=1.941268615拒绝H0,该俱乐部的宣称可信。
方差分析—实验内容与步骤(EXCEL)
一、单因素方差分析(参考教材P276)
教材例10.1
①将数据输入工作表中
②选择菜单“工具”—“数据分析”,打开“数据分析”对话框
③选择其中的“方差分析:
单因素方差分析”,打开对话框
4正确填写相关信息后,点“确定”。
输出结果与分析:
SUMMARY
组
列1
343
49
116.6667
列2
288
48
184.8
列3
175
35
108.5
列4
295
59
162.5
方差分析
差异源
SS
MS
F
P-value
Fcrit
组间
1456.609
485.5362
3.406643
0.038765
3.12735
组内
2708
19
142.5263
4164.609
u1=u2=…=ui=…=ukH1:
u1(i=1,2,…,k)不全相等F>
Fa,所以拒绝原假设,
表明行业对投诉次数的影响是显著的。
二、双因素方差分析(无交互作用)(参考教材P285)
教材例10.3
参考单因素方差分析
方差分析:
无重复双因素分析
行1
1721
344.2
233.7
行2
1739
347.8
295.7
行3
1685
337
442.5
行4
1424
284.8
249.2
1356
339
1224.667
1321
330.25
1464.25
1357
339.25
822.9167
1273
318.25
1538.917
列5
1262
315.5
241.6667
行
13004.55
4334.85
18.10777
9.46E-05
3.490295
列
2011.7
502.925
2.100846
0.143665
3.259167
误差
2872.7
239.3917
17888.95
u1,u2,u3,u4全相等H1:
u1,u2,u3,u4不全相等,F<
Fa,所以不能拒绝原假设,
表明不能认为地区对销售量有显著影响。
三、双因素方差分析(有交互作用)(参考教材P290)
教材例10.5
①选择“工具”下拉菜单,并选择【数据分析】选项
②在分析工具中选择【方差分析:
可重复双因素分析】,然后选择【确定】
③当对话框出现时
在【输入区域】方框内键入数据区域(A1:
C11)
在【】方框内键入0.05(可根据需要确定)
在【每一样本的行数】方框内键入重复试验次数(5)
在【输出区域】中选择输出区域
选择【确定】
可重复双因素分析
路段1
路段2
高峰
127
105
232
25.4
21
23.2
1.3
2.5
7.066667
非高峰
173
19.4
15.2
17.3
5.3
6.7
10.23333
224
181
22.4
18.1
12.93333
13.43333
样本
174.05
44.06329
5.7E-06
4.493998
92.45
23.40506
0.000182
交互
0.05
0.012658
0.911819
内部
63.2
16
3.95
329.75
μ1=…μi=…=μk;
H1:
μi(i=1,2…k)不全相等,用于检验“时段”的P-value=0.0000<
a=0.05,拒绝原假设,表明不同时段的行车时段之间有显著差异;
μ1=…μj=…=μr;
μj(i=1,2…r)不全相等,用于检验“路段”的P-value=0.0002<
a=0.05,拒绝原假设,表明不同路段的行车时间之间有显著差异;
交互作用反映的是时段因素和路段因素联合产生的对行车的时间的附加效应,用于检验的P-value=0.9118>
a=0.05,因此不拒绝原假设,没有证据表明时段和路段的交互作用对行车时间有显著影响。
095722029姓名:
李臣实验成绩:
实验四:
相关与回归分析
某产品的产量和单位成本的关系如下:
月份
产量(千件)
单位成本(元/件)
69
要求:
(1)判断产量和单位成本之间的相关关系
(2)估计单位成本对产量的回归直线,并解释每个参数的实际含义
(3)当产量为6000件时,单位成本的理论值为多少?
(4)计算估计标准误差
(5)对线型关系进行假设检验(a=0.05)
(6)对回归系数进行假设检验(a=0.05)
参考给定的实验步骤
将原始数据输入到Excel工作表的B2:
C7单元格。
然后按下列步骤进行操作:
选择“工具”下拉菜单
(2):
选择“数据分析”选项
(3):
在分析工具中选择“回归”,然后选择“确定”
(4):
当对话框出现时
在“Y值输入区域”方框内键入B2:
B7
在“X值输入区域”方框内键入C2:
在“输出选项”中选择输出区域,选择D3
SUMMARYOUTPUT
回归统计
MultipleR
0.909091
RSquare
0.826446
Ad
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学