统计学名词解释及公式.docx
- 文档编号:8817390
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:34
- 大小:69.23KB
统计学名词解释及公式.docx
《统计学名词解释及公式.docx》由会员分享,可在线阅读,更多相关《统计学名词解释及公式.docx(34页珍藏版)》请在冰豆网上搜索。
统计学名词解释及公式
公司内部编号:
(GOOD・TMMT・MMUT・UUPTY・UUYY・DTTI・
第1章统计与统计数据
一、学习指导
统计学是处理和分析数据的方法和技术,它儿乎被应用到所有的学科检验领
域。
本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来
源,最后介绍统计中常用的一些基本概念。
本章各节的主要内容和学习要点如下
表所示。
章节
主要内容
学习要点
统计及其应用领域
什么是统计学
概念:
统计学,描述统计,推断统计。
统计的应用领域
统计在工商管理中的应用。
统计的其他应用领域。
数据的类型
分类数据、顺序数据、数值型数据
概念:
分类数据,顺序数据,数值型数据。
不同数据的特点。
观测数据和实验数据
概念:
观测数据,实验数据。
截面数据和时间序列数据
概念:
截面数据,时间序列数据。
数据来源
数据的间接来源
统计数据的间接来源。
二手数据的特点。
数据的直接来源
概念:
抽样调查,普査。
数据的间接来源。
数据的收集方法。
调查方案设计
调查方案的内容。
数据质量
概念。
抽样误差,非抽样误差。
统计数据的质量。
统计中的儿个基本概念
总体和样本
概念:
总体,样本。
参数和统计量
概念:
参数,统计量。
变量
概念:
变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。
二、主要术语
1.统计学:
收集、处理、分析、解释数据并从数据中得出结论的科学。
2.描述统计:
研究数据收集、处理和描述的统计学分支。
3.推断统计:
研究如何利用样本数据来推断总体特征的统计学分支。
4.分类数据:
只能归于某一类别的非数字型数据。
5.顺序数据:
只能归于某一有序类别的非数字型数据。
6.数值型数据:
按数字尺度测量的观察值。
7.观测数据:
通过调查或观测而收集到的数据。
8.实验数据:
在实验中控制实验对象而收集到的数据。
9.截面数据:
在相同或近似相同的时间点上收集的数据。
10.时间序列数据:
在不同时间上收集到的数据。
11.抽样调查:
从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果來推断总体特征的数据收集方法。
12.普查:
为特定目的而专门组织的全面调查。
13.总体:
包含所研究的全部个体(数据)的集合。
14.样本:
从总体中抽取的一部分元素的集合。
15.样本容量:
也称样本量,是构成样本的元素数目。
16.参数:
用来描述总体特征的概括性数字度量。
17.统计量:
用来描述样本特征的概括性数字度量。
18.变量:
说明现象某种特征的概念。
19.分类变量:
说明事物类别的一个名称。
20.顺序变量:
说明事物有序类别的一个名称。
21.数值型变量:
说明事物数字特征的一个名称。
22.离散型变量:
只能取可数值的变量。
23.连续型变量:
可以在一个或多个区间中取任何值的变量。
四、习题答案
1.
D
12.
c
23.
c
34.
A
45
A
2.
D
13.
B
24.
B
35.
A
46
B
3.
A
14.
A
25.
D
36.
A
47
C
4.
B
15.
C
26.
C
37.
D
48
A
5.
A
16.
D
27.
B
3&
B
49
C
6.
D
17.
C
28.
D
39.
B
50
D
7.
C
1&
A
29.
A
40.
C
51
A
8.
B
19.
C
30.
D
41.
C
52
C
9.
A
20.
D
31.
A
42.
D
53
D
10.
A
21.
A
32.
B
43.
C
54
A
11.
C、
22.
C
33.
C
44.
D
55
B
第2章数据的图表展示
一、学习指导
数据的图表展示是应用统计的基本技能。
本章首先介绍数据的预处理方法,
然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。
本章
各节的主要内容和学习要点如下表所示。
早
主要内容
学习要点
数据的预处理
数据审核
数据审核的目的。
原始数据和二手数据的审核内容。
数据排序
数据排序的目的。
分类数据和数值型数据的排序方法。
数据筛选
数据筛选的目的。
用Excel进行数据筛选。
数据透视表
数据透视表的用途。
用Excel进行数据透视。
品质数据的整
理与展示
分类数据的整理与图示
概念:
频数,频数分布,比例,百分比,比率。
用Excel制作分类数据的频数分布表。
分类数据的图示:
条形图,帕累托图,对比条形图,饼图。
顺序数据的整理与图示
概念:
累积频数,累积频率。
累积频数分布图。
数值型数据的整理与展示
数据分组
概念:
数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。
频数分布表的制作步骤。
用Excel制作频数分布表。
数值型数据的图示
直方图的绘制。
茎叶图的绘制。
箱线图的绘制。
直方图与条形图的区别。
茎叶图与直方图的区别。
线图的绘制。
散点图的绘制。
气泡图的绘制。
雷达图的绘制。
合理使用图表
鉴别图形优劣的准则
图形应包括的基本特征。
鉴别图形优劣的准则。
统计表的设计
统计表的结构。
统计表的设计。
二、主要术语
24.频数:
落在某一特定类别(或组)中的数据个数。
25.频数分布:
数据在各类别(或组)中的分配。
26•比例:
一个样本(或总体)中各个部分的数据与全部数据之比。
27.比率:
样本(或总体)中各不同类别数值之间的比值。
28.累积频数:
将各有序类别或组的频数逐级累加起来得到的频数。
29.数据分组:
根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。
30.组距分组:
将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。
31.组距:
一个组的上限与下限的差。
32.组中值:
每一组的下限和上限之间的中点值,即组中值=(下限值+上限
值)/2。
33.直方图:
用矩形的宽度和高度(即面积)來表示频数分布的图形。
34.茎叶图:
由“茎”和“叶”两部分组成的、反应原始数据分布的图形。
35.箱线图:
由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形。
四、习题答案
1.
C
8・
B
15.
c
22.D
29.
2.
A
9.
B
16.
B
23.D
30.
3.
B
10.
C
17.
D
24.B
31.
4.
C
11.
A
18.
D
25.D
32.
5.
D
12.
B
19.
C
26.B
33.
6.
B
13.
B
20.
B
27.B
34.
7.
C
14.
C
21.
C
28.D
35.
D
C
B
C
C
A
B
第3章数据的概括性度量
一、学习指导
数据分布的特征可以从三个方面进行描述:
一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分如的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。
本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。
本章各
节的主要内容和学习要点如下表所示。
早R
主要内容
学习要点
集中趋势的度量
众数
概念:
众数。
众数的特点。
中位数和分位数
概念:
中位数,四分位数。
中位数和四分位数的特点。
中位数和四分位数的计算。
平均数
概念:
平均数,简单平均数,加权平均数,儿何平均数。
简单平均数和加权平均数的计算。
平均数的性质。
儿何平均数的计算和应用场合。
众数、中位数和平均数的比较
众数、中位数和平均数在分布上的关系。
众数、中位数和平均数的特点及应用场合。
离散程度的度量
异众比率
概念:
异众比率。
异众比率的计算和应用场合。
四分位差
概念:
四分位差。
四分位差的计算和应用场合。
方差和标准差
概念:
极差,平均差,方差,标准差。
极差的计算和特点。
平均差的计算和特点。
样本方差和标准差的计算。
总体方差和标准差的计算。
相对位置的度量
概念:
标准分数。
标准分数的计算和应用。
经验法则。
切比雪夫不等式。
离散系数
概念:
离散系数。
离散系数的计算。
离散系数的用途。
偏态与峰态的度量
偏态及其测度
概念:
偏态,偏态系数。
偏态系数的计算。
偏态系数数值的意义。
峰态及其测度
概念:
峰态,峰态系数。
峰态系数的计算。
峰态系数数值的意义。
用Excel计算描述统计量。
Excel统计函数的应用。
二、主要术语和公式
(一)主要术语
1.众数:
一组数据中出现频数最多的变量值,用表示。
2.中位数:
一组数据排序后处于中间位置上的变量值,用M「表示。
3.四分位数:
一组数据排序后处于25%和75%位置上的值。
4.平均数:
一组数据相加后除以数据的个数而得到的结果。
5.儿何平均数:
卫个变量值乘积的〃次方根,用G”表示。
6.异众比率:
非众数组的频数占总频数的比率。
7.四分位差:
也称为内距或四分间距,上四分位数与下四分位数之差。
8.极差:
也称全距,一组数据的最大值与最小值之差。
9.平均差:
也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。
10.方差:
各变量值与其平均数离差平方的平均数。
11.标准差:
方差的平方根。
12.标准分数:
变量值与其平均数的离差除以标准差后的值。
13.离散系数:
也称为变异系数,一组数据的标准差与其相应的平均数之比。
14.偏态:
数据分布的不对称性。
15.偏态系数:
对数据分布不对称性的度量值。
16.峰态:
数据分布的平峰或尖峰程度。
17.峰态系数:
对数据分布峰态的度量值。
(二)主要公式
名称
公式
中位数
简单样本平均数
加权样本平均数
儿何平均数
异众比率
四分位差
极差
简单平均差
加权平均差
简单样本方差
简单样本标准方差
加权样本方差
加权样本标准差
标准分数
离散系数
未分组数据的偏态系数
分组数据的偏态系数
未分组数据的峰态系数
分组数据的峰态系数
四、习题答案
1.
A
19.
C
37.
A
55.
B
73.
D
2.
C
20.
A
38.
C
56.
A
74.
C
3.
B
21.
B
39.
B
57.
B
75.
A
4.
C
22.
C
40.
A
58.
D
76.
D
5.
D
23.
C
41.
A
59.
A
77.
D
6.
B
24.
C
42.
B
60.
B
78.
A
7.
D
25.
C
43.
B
61.
C
79.
A
8.
A
26.
D
44.
A
62.
D
80.
c
9.
A
27.
A
45.
B
63.
A
81.
D
10.
C
28.
A
46.
A
64.
C
82.
D
11.
B
29.
B
47.
C
65.
D
83.
A
12.
C
30.
B
48.
D
66.
D
84.
A
13.
A
31.
A
49.
B
67.
C
85.
A
14.
B
32.
A
50.
A
68.
B
86.
D
15.
A
33.
B
51.
C
69.
D
16.
B
34.
B
52.
D
70.
D
17.
A
35.
A
53.
B
71.
A
18.
B
36.
B
54.
D
72.
B
第4章抽样与参数估计
一、学习指导
参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根
据样本统计量来推断我们所关心的总体参数。
本章首先介绍抽样分布的有关知
识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参
数估计中样本容量的确定问题。
本章各节的主要内容和学习要点如下表所示。
早R
主要内容
学习要点
概率抽样方法
概念:
简单随机抽样,简单随机样本,重复抽样,不重复抽样,分层抽样,系统抽样,整群抽样。
用Excel抽取简单随机样本。
抽样与抽样分布
抽样分布
概念:
抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差的抽样分布。
中心极限定理。
样本均值抽样分布的特征。
样本均值的抽样分布与总体分布的关系。
样本比例抽样分布的形式和特征。
样本方差抽样分布的形式。
参数估计
估计量与估计值
概念:
估计量,估计值。
的一般问题
点估计与区间估计
概念:
点估计,区间估计,置信区间,置信水平。
置信区间构建的原理。
置信区间的解释。
评价估计量的标准
概念:
无偏性,有效性,一致性。
总体均值的区间估计
正态总体、方差己知,或非正态总体、大样本
正态总体、方差己知时的置信区间。
非正态总体、大样本时的置信区间。
用Excel计算给定&的正态分布的临界值。
正态总体、方差未知、小样本
正态总体、方差已知时的小样本置信区间。
正态总体、方差未知时的小样本置信区间。
用Excel计算给定a的t分布的临界值。
总体比例的区间估计
总体比例的区间估计
总体比例的置信区间。
总体方差的区间估计
总体方差的区间估计
总体方差的置信区间。
用Excel计算给定a的*分布的临界值。
样本容量的确定
估计总体均值时样本容量的确定
样本容量的计算方法。
估计总体比例时样本容量的确定
样本容量的计算方法。
二、主要术语和公式
(一)主要术语
36.简单随机抽样:
也称纯随机抽样,它是从含有N个元素的总体中,抽取”个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。
37.简单随机样本:
从含有N个元素的总体中,抽取〃个元素作为样本,使得总体
中每一个样本量为川的样本都有相同的机会(概率)被抽中。
38.重复抽样:
从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取”个元素为止。
39.不重复抽样:
一个元素被抽中后不再放回总体,而是从所剩元素中抽取第二个元素,直到抽取"个元素为止。
40.分层抽样:
也称分类抽样,它是在抽样之前先将总体的元素划分为若干层
(类),然后从各个层中抽取一定数量的元素组成一个样本。
41.系统抽样:
也称等距抽样或机械抽样,它是先将总体中的各元素按某种顺序排列,并按某种规则确定一个随机起点;然后,每隔一定的间隔抽取一个元素,直至抽取“个元素形成一个样本。
42.整群抽样:
先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,随后再对抽中的各个群中所包含的所有元素进行观察。
43.抽样分布:
在重复选取样本量为“的样本时,由样本统计量的所有可能取值形成的相对频数分布。
44•样本均值的抽样分彳j:
在重复选取样本量为兀的样本时,由样本均值的所有可能取值形成的相对频数分布。
45.样本比例抽样分布:
在重复选取样本量为"的样本时,由样本比例的所有可能取值形成的相对频数分布。
46.标准误差:
也称为标准误,它是样本统计量的抽样分布的标准差。
47.估计标准误差:
若计算标准误时所涉及的总体参数未知,可用样本统计量代替计算的标准误。
48.估计量:
用来估计总体参数的统计量的名称,用符号8表示。
49.估计值:
用来估计总体参数时计算出来的估计量的具体数值。
50.点估计:
用样本统计量6的某个取值直接作为总体参数&的估计值。
51.区间估计:
在点估计的基础上,给出总体参数估计的一个范围。
52.置信区间:
由样本统计量所构造的总体参数的估计区间。
53.置信水平:
也称为置信系数,它是将构造置信区间的步骤重复多次后,置信区间中包含总体参数真值的次数所占的比率。
(二)主要公式
名称
公式
总体均值的置信区间(正态总体,<7己知)
总体均值的置信区间(<7未知,大样本)
总体均值的置信区间(正态总体,"未知,小样本)
总体比例的置信区间
总体方差的置信区间
估计总体均值时的样本容量
估计总体比例时的样本容量
四、习题答案
87.
A
121.
B
155.
A
189.
C
223.
B
88.
B
122.
A
156.
B
190.
A
224.
A
89.
A
123.
B
157.
C
191.
B
225.
A
90.
B
124.
D
158.
C
192.
C
226.
D
91.
B
125.
B
159.
D
193.
A
227.
C
92.
C
126.
A
160.
B
194.
D
228.
B
93.
D
127.
C
161.
D
195.
A
229.
A
94.
C
128.
A
162.
D
196.
B
230.
A
95.
A
129.
B
163.
C
197.
C
231.
B
96.
C
130.
A
164.
C
198.
A
232.
B
97.
A
131.
C
165.
B
199.
A
233.
B
98.
A
132.
D
166.
C
200.
A
234.
C
99.
C
133.
C
167.
D
201.
A
235.
B
100.
A
134.
B
168.
D
202.
A
236.
B
101.
D
135.
D
169.
A
203.
C
237.
D
102.
B
136.
C
170.
B
204.
B
238.
A
103.
D
137.
A
171.
C
205.
B
239.
B
104.
B
138.
A
172.
A
206.
A
240.
B
105.
B
139.
D
173.
A
207.
C
241.
C
第5章假设检验
一、学习指导
假设检验是推断统计的另一项重要内容,它是利用样本信息判断假设是否成
立的一种统计方法。
本章首先介绍有关假设检验的一些基本问题,然后介绍一个
总体参数的检验方法。
本章各节的主要内容和学习要点如下表所。
早TJ
主要内容
学习要点
假设检验的基本问题
假设的陈述
概念:
假设,假设检验,原假设,备择假设,单侧检验,双侧检验。
针对具体的实际问题,建立合理的原假设和备择假设。
两类错误与显着性水平
概念:
第I类错误,第I【类错误,显着性水平。
两类错误的控制。
两类错误的关系。
检验统计量与拒绝域
概念:
检验统计量,标准化检验统计量,拒绝域,临界值。
统计量检验的原理。
利用统计量检验的决策准则。
利用P值进行决策
概念:
P值。
P值决策的原理,尸值的计算。
P值检验与统计量检验的异同。
P值决策的准则。
小结
假设检验的步骤。
假设检验结果的表述。
总体均值的检验
大样本的检验方法
总体方差/己知时,均值检验的统计量和程序。
总体方差□未知时,均值检验的统计量和程序。
用Excel计算P值。
小样本的检验方法
总体方差/己知时,均值检验的统计量和程序。
总体方差□未知时,均值检验的统计量和程序。
用Excel计算尸值。
总体比例的检验
总体比例的检验
检验的统计量。
检验的程序。
用Excel计算尸值。
总体方差的检验
总体方差的检验
检验的统计量。
检验的程序。
用Excel计算尸值。
二、主要术语和公式
(一)主要术语
18.假设:
对总体参数的具体数值所做的陈述。
19.假设检验:
先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
20.备择假设:
也称研究假设,是研究者想收集证据予以支持的假设,用厲或表示。
21.原假设:
也称零假设,是研究者想收集证据予以反对的假设,用乩)表示。
22.单侧检验:
也称单尾检验,是指备择假设具有特定的方向性,并含有符号
“〉”或“〈”的假设检验。
23.双侧检验:
也称双尾检验,是指备择假设没有特定的方向性,并含有符号“”的假设检验。
24.第【类错误:
当原假设为正确时拒绝原假设,犯第I类错误的概率记为
25.第II类错误:
当原假设为错误时没有拒绝原假设,犯第【I类错误的概率通常记为0。
26.显着性水平:
假设检验中发生第I类错误的概率,记为
27.检验统计量:
根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量。
28.拒绝域:
能够拒绝原假设的检验统计量的所有可能取值的集合。
29.临界值:
根据给定的显着性水平确定的拒绝域的边界值。
30.P值:
也称观察到的显着性水平,如果原假设是正确的,那么所得的样本结
果出现实际观测结果那么极端的概率。
(二)主要公式
名称
公式
总体均值检验的统计量(正态总体,<7已知)
总体均值检验的统计量("未知,大样本)
总体均值检验的统计量(正态总体,”未知,小样本)
总体比例检验的统计量
总体方差检验的统计量
四、习题答案
1.
A
34.
A
66.
D
99.
A
2.
D
35.
C
67.
D
100.
B
3.
C
36.
B
68.
A
101.
D
4.
A
37.
A
69.
C
102.
C
5.
B
38.
D
70.
D
103.
B
6.
C
39.
D
71.
A
104.
D
7.
A
40.
C
72.
C
105.
B
8.
B
41.
C
73.
B
106.
B
9.
A
42.
c
74.
A
107.
A
10.
B
43.
c
75.
A
108.
A
11.
A
44.
A
76.
B
109.
B
12.
C
45.
B
77.
C
110.
A
13.
A
46.
A
78.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 名词解释 公式