统计学第四版答案贾俊平Word格式.docx
- 文档编号:15164864
- 上传时间:2022-10-28
- 格式:DOCX
- 页数:20
- 大小:988.75KB
统计学第四版答案贾俊平Word格式.docx
《统计学第四版答案贾俊平Word格式.docx》由会员分享,可在线阅读,更多相关《统计学第四版答案贾俊平Word格式.docx(20页珍藏版)》请在冰豆网上搜索。
分类变量:
表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等
顺序变量:
如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度”等就是顺序变量。
数值变量:
可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。
定性数据和定量数据的图示方法各有哪些:
1、定性数据的图示:
条形图、帕累托图、饼图、环形图
2、定量数据的图示:
a、分组数据看分布:
直方图
b、未分组数据看分布:
茎叶图、箱线图、垂线图、误差图
c、两个变量间的关系:
散点图
d、比较多个样本的相似性:
雷达图和轮廓图
直方图与条形图有何区别:
1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距。
2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
3、条形图主要用于展示定性数据,而直方图则主要用于展示定量数据。
一组数据的分布特征可以从哪几个方面进行描述:
1、数据的水平,反映数据的集中程度
2、数据的差异,反映各数据的离散程度
3、分布的形状,反映数据分布的偏态和峰态
说明平均数、中位数和众数的特点及应用场合:
平均数也称为均值,它是一组数据相加后除以数据的个数而得到的结果。
平均数是度量数据水平的常用统计量,在参数估计以及假设检验中经常用到。
中位数是一组在数据排序后处于中间位置上的数值,用Me表示。
中位数是用中间位置上的值代表数据水平,其特点是不受极端值影响,在研究收入分配中很有用。
众数与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,其特点是不受极端值的影响,具有不惟一性,一组数据中可能会有一个人众数,也可能会有多个或没有。
为什么要计算离散系数:
极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。
它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。
因此,为消除变量值水平高低和数量单位不同对离散程度的测度值的影响,需要计算离散系数。
举例说明离散型随机变量和连续性随机变量:
离散型随机变量:
设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散型随机变量。
包括二项分布、泊松分布、超几何分布,如一定时间内某航空公司接到的订票电话数
连续型概率分布:
包括正态分布、均匀分布和指数分布。
叙述正态分布曲线的特点:
正态曲线的图形是关于x=u对称的钟形曲线,且峰值在x=u处。
正态分布的两个参数u和σ一旦确定,正态分布的具体形式也惟一确定,不同参数取值的正态分布构成一个完整的“正态分布族”。
当X的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相交。
④正态随机变量在特定区间上取值的概率由正态曲线下的面积给出,而且其曲线下的总面积等于1
解释中心极限定理的含义:
随着样本量n的增大(通常要求n>
=30),不论原来的总体是否服从正态分布,样本均值的概率分布都将趋于正态分布,其分布的期望值为总体均值u,方差为总体方差的1/n。
这一定理可表述为:
从均值为u、方差为σ^2的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n>
=30),样本均值的分布近似服从均值为u,方差为σ^2/n的正态分布。
说明区间估计的基本原理:
区间估计,是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。
与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出的一个概率度量。
简述评价估计量的标准:
无偏性:
它是指估计量抽样分布的期望值等于被估计的总体参数;
有效性:
它是指估计量的方差尽可能小;
一致性:
它是指随着样本量的增大,点估计量的值越来越接近被估计总体的参
数
解释置信水平的含义
:
置信水平,是指总体参数值落在样本统计值某一区内的概率;
而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。
简述样本量与置信水平、总体方差、估计误差的关系
样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大;
样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;
样本量与估计误差的平方成正比,即允许的估计误差的平方越大,所要求的样本量就越大。
解释原假设和备择假设:
原假设:
它通常是研究者想收集证据予以推翻的假设,用H0表示,原假设所表达的含义总是指参数没有变化或变量之间没有关系,等号“=”总放在原假设上。
备择假设:
通常指研究者想收集证据予以支持的假设,用H1或Ha表示。
备择假设所表达的含义是总体参数发生了变化或变量之间有某种关系。
备择假设的形式总是为H1:
u≠u0,H1:
u<
u0或u>
u0
第一类错误和第二类错误分别是指什么
它们发生的概率大小之间存在怎样的关系:
第Ⅰ类错误(弃真错误):
原假设为真时拒绝原假设时所犯的错误
第Ⅱ类错误(取伪错误):
原假设为假时未拒绝原假设
当样本容量n确定后,当α变小时,则检验的拒绝域变小,相应的接受域会变大,因此β值也就随之变大;
相反,若β变小,则α又会变大.
样本量的大小与显著性有怎样的关系:
显著性水平与样本的大小密切相关,相关量越大,检验统计量的值也就越大,显著性水平越小,就越有可能拒绝原假设。
相关分析主要解决哪些问题:
变量之间是否存在关系
如果存在关系,它们之间是什么样的关系
变量之间的关系强度如何
④样本所反映的变量之间的关系能否代表总体变量之间的关系
解释回归模型和估计的回归方程的含义:
回归模型是描述因变量y如何依赖于自变量x和误差项的方程。
回归方程是描述因变量y的期望值如何依赖于自变量x的方程。
估计的回归方程是利用最小二乘法,根据样本数据求出的回归方程的估计。
简述参数最小二乘估计的基本原理:
这一公式的x和y的n对观察值,用于描述其关系的直线有多条,用距离观测点最近的一条直线,用它来表示x与y之间的关系与实际数据的误差比其它任何直线都小。
根据这一思想确定直线中未知常数
和
的方法称为最小二乘法
什么是P值利用P值进行检验和利用统计量进行检验有什么不同
如果能把犯第Ⅰ类错误的真实概率算出来,就可以直接用这个概率做出决策。
而不需要管什么事先给定的显著性水平α,这个犯第Ⅰ类错误的真实概率就是P值。
不同:
统计量检验是根据事先确定的显著性水平α围成的拒绝域作出决策,不论检验统计量的值是大是小,只要把它落入拒绝域就拒绝原假设H。
否则就不拒绝H。
这样,无论统计量落在拒绝域的什么位置,你也只能说犯第一错误的概率为α,而用P值检验则能把犯第Ⅰ类错误的真实概率算出来。
获得数据的概率抽样方法有哪些
(1)简单随机抽样
简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。
它最直观地体现了抽样的基本原理,是最基本的概率抽样。
(2)系统抽样
系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。
(3)分层抽样
分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。
(4)整群抽样
整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。
(5)多阶段抽样
多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。
样本量的大小与显著性有怎样的关系
通常在做某种统计推断时,显著性水平要求越高,要达到该显著性水平的样本量越大。
样本量越大,检验统计量的值夜就越大,P值就越小,就越有可能拒绝原假设。
反之则相反
第1章
统计和统计数据
指出下面的变量类型。
(1)
年龄。
(2)
性别。
(3)
汽车产量。
(4)
员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)
购买商品时的支付方式(现金、信用卡、支票)。
详细答案:
(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他
们的消费支付方式是用信用卡。
这一研究的总体是什么样本是什么样本量是多少
“月收入”是分类变量、顺序变量还是数值变量
“消费支付方式”是分类变量、顺序变量还是数值变量
(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这一研究的总体是什么
“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量
(1)总体是“所有的网上购物者”。
某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
这种抽样方式是分层抽样、系统抽样还是整群抽样
样本量是多少
(1)分层抽样。
(2)100。
第3章 用统计量描述数据
教材习题答案
随机抽取25个网络用户,得到他们的年
19
15
29
25
24
23
21
38
22
18
30
20
16
27
34
41
31
17
龄数据如下(单位:
周岁):
计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析。
网民年龄的描述统计量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第四 答案 贾俊平