袁卫统计学第二版习题答案.docx
- 文档编号:7220616
- 上传时间:2023-01-22
- 格式:DOCX
- 页数:10
- 大小:23.86KB
袁卫统计学第二版习题答案.docx
《袁卫统计学第二版习题答案.docx》由会员分享,可在线阅读,更多相关《袁卫统计学第二版习题答案.docx(10页珍藏版)》请在冰豆网上搜索。
袁卫统计学第二版习题答案
袁卫统计学(第二版)习题答案
答案
属于顺序数据。
频数分布表如下:
服务质量等级评价的频数分布
服务质量等级
ABCDE合计
家庭数
1421321815100
频率%1421321815100
条形图
频数分布表如下:
40个企业按产品销售收入分组表按销售收入分组企业数频率向上累积 企业数频率100以下100~110110~1xx年龄的分布为右偏。
茎叶图如下:
A班数据个数树叶树茎树叶B班数据个数0359212112376049797665332110988777665555544433321006655xx年组身高的离散系数:
幼儿组身高的离散系数:
;;
于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
表给出了一些主要描述统计量,请读者自己分析。
方法A平均中位数众数标准偏差极差最小值最大值1651648162170方法B平均中位数众数标准偏差极差最小值最大值1291287125132方法C平均中位数众数标准偏差极差最小值最大值12612612116128方差或标准差;商业类股票;。
。
答案
设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师P(A)=4/12=1/3P(B)=4/12=1/3P(AB)=2/12=1/6
P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2
求这种零件的次品率,等于计算“任取一个零件为次品”的概率考虑逆事件
。
“任取一个零件为正品”,表示通过三道工序都合格。
据题意,有:
于是
设A表示“合格”,B表示“优秀”。
于B=AB,于是
=×=
设A=第1发命中。
B=命中碟靶。
求命中概率是一个全概率的计算问题。
再利用对立事件的概率即可求得脱靶的概率。
=×1+×= 脱靶的概率=1-=
或:
P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=×=设A=活到55岁,B=活到70岁。
所求概率为:
这是一个计算后验概率的问题。
设A=优质率达95%,P(A)=,P(
=优质率为80%,B=试验所生产的5件全部优质。
)=,所求概率为:
)=,P(B|A)=,P(B|
决策者会倾向于采用新的生产管理流程。
令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。
题意得:
P(A1)=,P(A2)=,P(A3)=;P(B|A1)=,P(B|A2)=,P(B|A3)=;因此,所求概率分别为:
=×+×+×=
据题意,在每个路口遇到红灯的概率是p=24/(24+36)=。
设途中遇到红灯的次数=X,因此,X~B(3,)。
其概率分布如下表:
xiP(X=xi)0123
期望值=,方差=,标准差=设被保险人死亡数=X,X~B(20000,)。
收入=20000×50=100万元。
要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。
所求概率为:
P(X≤10)=。
当被保险人死亡数超过20人时,保险公司就要亏本。
所求概率为:
P(X>20)=1-P(X≤20)=1-=支付保险金额的均值=50000×E(X)=50000×20000×=50支付保险金额的标准差=50000×σ(X)
=50000×(20000××)1/2=158074
可以。
当n很大而p很小时,二项分布可以利用泊松分布来近似计算。
本例中,λ=np=20000×=10,即有X~P(10)。
计算结果与二项分布所得结果几乎完全一致。
也可以。
尽管p很小,但于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。
本例中,np=20000×=10,np(1-p)=20000××()=,即有X~N(10,)。
相应的概率为:
P(X≤)=,P(X≤)=。
可见误差比较大。
【注】于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减作为正态分布对应的区间点,这就是所谓的“连续性校正”。
于p=,假如n=5000,则np=合格率为=或%。
=
(2)设所求值为K,满足电池寿命在xx年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元。
假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。
又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。
⑴描述的抽样分布。
特别说明服从怎样
的分布以及的均值和方差是什么?
证明你的回答;
⑵对于样本家庭来说平均每日消费大于213美元的概率是什么?
大于217美元的概率
呢?
在209美元和217美元之间的概率呢?
技术人员对奶粉装袋过程进行了质量检验。
每袋的平均重量标准为
克、标准
差为克。
监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。
现考虑这36袋奶粉所组成样本的平均重量。
描述
的抽样分布,并给出
和
的值,以及概率分布的形状;
,这是否意味着装袋过程出现问题了呢,
种不同的股票。
每一种
假设某一天技术人员观察到
为什么?
股票月收益率的均值为
,标准差
在本章的统计实践中,某投资者考虑将1000美元投资于
。
对于这五种股票的投资组合,投
资者每月的收益率是。
投资者的每月收益率的方差是,它是投资者所面临风险的一个度量。
⑴假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的风
险将会增加还是减少?
请解释;
⑵假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,
并与只投资5种股票的情形进行比较。
某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量
来定级的。
如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。
国际击剑管理组织希望这些夹克的最低级别不小于800牛顿。
为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算,即该样本中夹克级别的均值。
她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。
⑴如果该生产过程仍旧正常,则的样本分布为何?
⑵假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,
样本均值≤830牛顿的概率是多少?
⑶在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现
状有何看法?
⑷现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛
顿。
在这种情况下的抽样分布是什么?
当具有这种分布时,则≤830牛顿的概率是多少?
在任何生产过程中,产品质量的波动都是不可避免的。
产品质量的变化可被分成两类:
于特殊原因所引起的变化,以及于共同的原因所引起的变化。
一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。
剩余的变化只是简单的随机变化。
假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化。
通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变
动。
例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值描绘在下图中。
假设这个过程是在统计控制中的,则的标准差除以样本容量的平方根,
的分布将具有过程的均值
,标准差具有过程
。
下面的控制图中水平线表示过程均值,
两条线称为控制极限度,位于的上下3的位置。
假如落在界限的外面,则有充分的理说明目前存在变化的特殊原因,这个过程一定是失控的。
当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从
的近似的正态分布。
和
⑴假设则上下控制极限应距离多么远?
⑵假如这个过程是在控制中,则落在控制极限之外的概率是多少?
⑶假设抽取样本之前,过程均值移动到
确的)结论的概率是多少?
,则样本得出这个过程失控的。
若,则落在控制极限外面的概率是多少?
若呢?
参考练习。
为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。
警戒限一般被设定为。
假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的。
⑴假设肥皂加工过程是在控制中,则
⑵假设肥皂加工过程是在控制中,则你预料到画在控制图上的的这40个值中有多
少个点落在上控制极限以上?
⑶假设肥皂加工过程是在控制中,则的两个未来数值落在下警戒线以下的概率是多
少?
答案
⑴20,2; ⑵近似正态;⑶-;⑷。
⑴; ⑵; ⑶;⑷;⑸。
⑴; ⑵; ⑶;⑷。
⑴101,99⑵1 ;⑶不必。
趋向正态。
⑴正态分布,213,;⑵,,。
⑴406,,正态分布;⑵;⑶是,因为小概率出现了。
⑴增加;⑵减少。
⑴正态;⑵约等于0;⑶不正常;⑷正态,。
⑴;⑵;⑶。
⑴(,);⑵,。
⑴; ⑵1;⑶。
答案
;E=。
;E=;。
;(,);(,)。
。
。
;。
(1);36。
;。
2±;2±;2±;2±;2±。
,;±。
10%±%;10%±%。
。
48。
139。
57。
769。
答案
研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,
所以原假设与备择假设应为:
=“某一品种的小鸡因为同类相残而导致的死亡率”,
,。
第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但
检验结果却提供证据支持店方倾向于认为其重量少于60克;
第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
检验统计量
如果
,在大样本情形下近似服从标准正态分布;
,就拒绝
;
。
检验统计量=>,所以应该拒绝
=,拒绝=,不拒绝=,拒绝
。
。
。
。
。
。
。
=,拒绝=-,拒绝=,不拒绝=-,拒绝
=,拒绝。
检验结果如下:
t-检验:
双样本等方差假设
平均方差观测值合并方差假设平均差
dftStatP(T≤t)单尾t单尾临界P(T≤t)双尾
变量1
20
038-
变量2
20
t双尾临界
t-检验:
双样本异方差假设
平均方差观测值假设平均差
dftStatP(T≤t)单尾t单尾临界P(T≤t)双尾t双尾临界
变量1
xx年红利为Y,每股账面价值为X建立回归方程
估计参数为
参数的经济意义是每股账面价值增加1元时,当年红利将平均增加元。
序号6的公司每股账面价值为元,增加1元后为元,当年红利可能为:
(元)
数据散点图如下:
根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。
设投诉率为Y,航班正点率为X 建立回归方程 估计参数为
参数的经济意义是航班正点率每提高一个百分点,相应的投诉率下降。
航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为:
Excel回归输出的结果可以看出:
回归结果为
Excel的计算结果已知:
、,其绝对值均大于临界值明显影响。
对应的t统计量分别为、、
所以各个自变量都对Y有
F=,大于临界值
该回归分析中样本容量是14+1=15;计算RSS=66042-65965=77;
,说明模型在整体上是显著的。
ESS的自度为k-1=2,RSS的自度n-k=15-3=12;计算:
可决系数
修正的可决系数
检验X2和X3对Y是否有显著影响
(5)F统计量远比F临界值大,说明X2和X3联合起来对Y有显著影响,但并不能确定X2和X3各自对Y的贡献为多少。
用Excel输入Y和X数据,生成估计参数结果为
和的数据,用Y对X、、回归,
t=(-)() (-) ()
检验参数的显著性:
当取时,查t分布表得,与t统计量对比,除了截距项外,各回归系数对应的t统计量的绝对值均大于临界值,表明在这样的显著性水平下,回归系数显著不为0。
检验整个回归方程的显著性:
模型的
,说明可决时,查F分布表
,
因此总成本对产量的
系数较高,对样本数据拟合较好。
于F=,而当取得说明X、
、
,因为F=>,应拒绝
联合起来对Y确有显著影响。
计算总成本对产量的非线性相关系数:
因为非线性相关系数为
或R=
评价:
虽然经t检验各个系数均是显著的,但与临界值都十分接近,说明t检验只是勉强通过,其把握并不大。
如果取
,则查t分布表得
,
的显著性水平下都
这时各个参数对应的t统计量的绝对值均小于临界值,则在应接受
利用Excel输入X、y数据,用y对X回归,估计参数结果为
t值=
整理后得到:
答案
30×
×
=30×=
的原假设。
设按%的增长速度n年可翻一番 则有
所以n=log2/=
故能提前年达到翻一番的预定目标。
以1987年为基期,xx年与1987年相比该地区社会商品零售额共增长:
年平均增长速度为
==%
xx年的社会商品零售额应为
发展总速度
平均增长速度=
平均数
xx年一季度的计划任务:
(1)用每股收益与年份序号回归得
,
。
。
预测下一年(第11年)的每股收
益为元
(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长元。
是一个较为适合的投资方向。
移动平均法消除季节变动计算表年别xx年 xx年 xx年 xx年 季别一季度二季度三季度四季度一季度二季度三季度四季度一季度二季度三季度四季度一季度二季度三季度四季度鲜蛋销售量 1116xx年别xx年 xx年 xx年 xx年 季别一季度二季度三季度四季度一季度二季度三季度四季度一季度二季度三季度四季度一季度二季度三季度四季度时间序列号t12345678910111213141516鲜蛋销售量 1116xx年度xx年一季度二季度三季度四季度—xx年xx年xx年平均季节比率% ———4.00000根据上表计算的季节比率,按照公式xx年第一季度预测值:
xx年第二季度预测值:
xx年第三季度预测值:
xx年第四季度预测值:
(1)用原始资料法计算的各月季节比率为:
月份季节比率月份季节比率1月7月2月8月3月9月计算可得:
4月10月5月11月6月12月
平均法计算季节比率表:
年别月份1月2月3月4月5月6月7月8月9月10月11月12月平均xx年 xx年 xx年 xx年 平均 季节比率% 季节比率的图形如下:
(2)用移动平均法分析其长期趋势年月序号工业总产值(亿元)Jan-00Feb-00Mar-00Apr-00May-00Jun-00Jul-00Aug-00Sep-00Oct-00Nov-00Dec-00Jan-01Feb-01Mar-01Apr-01May-01Jun-01Jul-01Aug-01Sep-01Oct-01Nov-01Dec-01Jan-02Feb-02Mar-02Apr-02May-0212345678910111213141516171819xx年月Jan-83Feb-83Mar-83Apr-83May-83Jun-83Jul-83Aug-83序号12345678工业总产值(亿元) 527545长期趋势值 剔除长期趋势 Sep-83Oct-83Nov-83Dec-83Jan-84Feb-84Mar-84Apr-84May-84Jun-84Jul-84Aug-84Sep-84Oct-84Nov-84Dec-84Jan-85Feb-85Mar-85Apr-85May-85Jun-85Jul-85Aug-85Sep-85Oct-85Nov-85Dec-85Jan-86Feb-86Mar-86Apr-86May-86Jun-86Jul-86Aug-86Sep-86Oct-86Nov-86Dec-869101112131415161718192021222324252627282930313233343536373839404142434445464748 518 590 614 712678676703 719
剔除长期趋势后分析其季节变动情况表
年份月份1月2月3月4月5月6月7月8月9月10月11月12月1983年 1984年 1985年 1986年 季节比率%
运用分解法可得到循环因素如下图:
答案
;
。
略。
;
。
;
略。
。
;
;略。
;
⑴
⑶⑴
⑵ ⑶
;
;⑵
;⑷
;。
;
。
,
,
依据有关公式列表计算各企业的工业经济效益综合指数如下:
各企业经济效益综合指数一览表(标准比值法)
参评指标产品销售率资金利税率成本利润率增加值率劳动生产率资金周转率综合指数排 名A企业 5标准比值或个体指数(%)B企业C企业D企业 321E企业 4权数153015101020────依据有关公式列表计算各企业的工业经济效益综合指数如下表:
各企业经济效益综合指数一览表(改进的功效系数法)
参评指标产品销售率资金利税率成本利润率增加值率劳动生产率资金周转率综合指数排 名阈 值改进的功效系数权数满意值不允许值A企业B企业C企业D企业E企业 15 30 15 1072505400 10 20──── ──45213──────上面两种方法给出的综合评价结果的差异表现在D、E两个企业的综合经济效益排名不同。
原因在于两种方法的对比标准不同(以下具体说明)。
答案
生产法GDP=168760亿元;分配法GDP=168755亿元使用法GDP=154070亿元
国内生产净值=149755亿元国民总收入=165575亿元国民可支配总收入=167495亿元国民可支配净收入=148490亿元
消费率=%储蓄率=%投资率=%
国民财富总额为:
216765亿元
生产法GDP增长速度为%,紧缩价格指数为%;使用法GDP增长速度为%,紧缩价格指数为%。
答案
属于顺序数据。
频数分布表如下:
服务质量等级评价的频数分布
服务质量等级
ABCDE合计
家庭数
1421321815100
频率%1421321815100
条形图
频数分布表如下:
40个企业按产品销售收入分组表按销售收入分组企业数频率向上累积 企业数频率100以下100~110110~1xx年龄的分布为右偏。
茎叶图如下:
A班数据个数树叶树茎树叶B班数据个数0359212112376049797665332110988777665555544433321006655xx年组身高的离散系数:
幼儿组身高的离散系数:
;;
于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
表给出了一些主要描述统计量,请读者自己分析。
方法A平均中位数众数标准偏差极差最小值最大值1651648162170方法B平均中位数众数标准偏差极差最小值最大值1291287125132方法C平均中位数众数标准偏差极差最小值最大值12612612116128方差或标准差;商业类股票;。
。
答案
设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师P(A)=4/12=1/3P(B)=4/12=1/3P(AB)=2/12=1/6
P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2
求这种零件的次品率,等于计算“任取一个零件为次品”的概率考虑逆事件
。
“任取一个零件为正品”,表示通过三道工序都合格。
据题意,有:
于是
设A表示“合格”,B表示“优秀”。
于B=AB,于是
=×=
设A=第1发命中。
B=命中碟靶。
求命中概率是一个全概率的计算问题。
再利用对立事件的概率即可求得脱靶的概率。
=×1+×= 脱靶的概率=1-=
或:
P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=×=设A=活到55岁,B=活到70岁。
所求概率为:
这是一个计算后验概率的问题。
设A=优质率达95%,P(A)=,P(
=优质率为80%,B=试验所生产的5件全部优质。
)=,所求概率为:
)=,P(B|A)=,P(B|
决策者会倾向于采用新的生产管理流程。
令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。
题意得:
P(A1)=,P(A2)=,P(A3)=;P(B|A1)=,P(B|A2)=,P(B|A3)=;因此,所求概率分别为:
=×+×+×=
据题意,在每个路口遇到红灯的概率是p=24/(24+3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第二 习题 答案