正态分布与线性回归.docx
- 文档编号:12025762
- 上传时间:2023-04-16
- 格式:DOCX
- 页数:12
- 大小:145.84KB
正态分布与线性回归.docx
《正态分布与线性回归.docx》由会员分享,可在线阅读,更多相关《正态分布与线性回归.docx(12页珍藏版)》请在冰豆网上搜索。
正态分布与线性回归
正态分布、线性回归
一、知识梳理
1.正态分布的重要性
正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:
一方面,正态分布是自然界最常见的一种分布。
一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。
2.正态曲线及其性质
正态分布函数:
,x∈(-∞,+∞)
3.标准正态曲线
标准正态曲线N(0,1)是一种特殊的正态分布曲线,
,以及标准正态总体在任一区间(a,b)内取值概率
。
4.一般正态分布与标准正态分布的转化
由于一般的正态总体
其图像不一定关于y轴对称,对于任一正态总体
,其取值小于x的概率
。
只要会用它求正态总体
在某个特定区间的概率即可。
5.“小概率事件”和假设检验的基本思想
“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。
这种认识便是进行推断的出发点。
关于这一点我们要有以下两个方面的认识:
一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。
课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。
进行假设检验一般分三步:
第一步,提出统计假设。
课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布
;
第二步,确定一次试验中的取值a是否落入范围(μ-3σ,μ+3σ);
第三步,作出推断。
如果a∈(μ-3σ,μ+3σ),接受统计假设;如果
,由于这是小概率事件,就拒绝统计假设。
6.相关关系
研究两个变量间的相关关系是学习本节的目的。
对于相关关系我们可以从下三个方面加以认识:
⑴相关关系与函数关系不同。
函数关系中的两个变量间是一种确定性关系。
相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系。
⑵函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。
⑶函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。
7.回归分析
本节所研究的回归分析是回归分析中最简单,也是最基本的一种类型——一元线性回归分析。
对于线性回归分析,我们要注意以下几个方面:
⑴回归分析是对具有相关关系的两个变量进行统计分析的方法。
两个变量具有相关关系是回归分析的前提。
⑵散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。
⑶求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。
8.相关系数
有时散点图中的各点并不集中在一条直线的附近,仍可以按照求回归直线方程的步骤求得回归直线方程。
显然这种情形下求得的回归直线方程没有实际意义。
那么,在什么情况下求得的回归直线方程才能对相应的一组观测数据具有代表意义?
课本中不加证明地给出了相关系数的公式。
相关系数公式的作用在于,我们对一组数据之间的线性相关程度可作出定量的分析,而不是仅凭画出散点图,直觉地从散点图的形状粗浅地得出数据之间的线性相关程度。
9.线性相关性检验
相关性检验是一种假设检验,它给出了一个具体检验y与x之间线性相关与否的具体办法。
限于要求,中学阶段只要求掌握这种检验方法的操作步骤,而不要求对这种方法包含的原理进行深入研究。
其具体检验的步骤如下:
⑴在课本中的附表3中查出与显著性水平0.05与自由度n-2(n为观测值组数)相应的相关系数临界值
。
⑵根据公式
计算r的值。
⑶检验所得结果。
如果
,那么可以认为y与x之间的线性相关关系不显著,从而接受统计假设。
如果
,表明一个发生的概率不到5%的事件在一次试验中竟发生了。
这个小概率事件的发生使我们有理由认为y与x之间不具有线性相关关系的假设是不成立的,拒绝这一统计假设也就是表明可以认为y与x之间具有线性相关关系。
二、基础训练
1.如果随机变量ξ~N(μ,σ2),且Eξ=3,Dξ=1,则P(-1<ξ≤1=等于B
A.2Φ
(1)-1B.Φ(4)-Φ
(2)
C.Φ
(2)-Φ(4)D.Φ(-4)-Φ(-2)
2.随机变量ξ服从正态分布N(0,1),如果P(ξ<1)=0.8413,则P(-1<ξ<0)=.
三、例题剖析
【例1】将温度调节器放置在贮存着某种液体的容器内,调节器设定在d℃,液体的温度ξ(单位:
℃)是一个随机变量,且ξ~N(d,0.52).
(1)若d=90°,求ξ<89的概率;
(2)若要保持液体的温度至少为80℃的概率不低于0.99,问d至少是多少?
(其中若η~N(0,1),则Φ
(2)=P(η<2)=0.9772,Φ(-2.327)=P(η<-2.327)=0.01).
剖析:
(1)要求P(ξ<89)=F(89),
∵ξ~N(d,0.5)不是标准正态分布,而给出的是Φ
(2),Φ(-2.327),故需转化为标准正态分布的数值.
(2)转化为标准正态分布下的数值求概率p,再利用p≥0.99,解d.
解:
(1)P(ξ<89)=F(89)=Φ(
)=Φ(-2)=1-Φ
(2)=1-0.9772=0.0228.
(2)由已知d满足0.99≤P(ξ≥80),
即1-P(ξ<80)≥1-0.01,∴P(ξ<80)≤0.01.
∴Φ(
)≤0.01=Φ(-2.327).
∴
≤-2.327.
∴d≤81.1635.
故d至少为81.1635.
评述:
(1)若ξ~N(0,1),则η=
~N(0,1).
(2)标准正态分布的密度函数f(x)是偶函数,x<0时,f(x)为增函数,x>0时,f(x)为减函数.
【例2】一投资者在两个投资方案中选择一个,这两个投资方案的利润x(万元)分别服从正态分布N(8,32)和N(6,22),投资者要求利润超过5万元的概率尽量地大,那么他应选择哪一个方案?
解:
对第一个方案,有x~N(8,32),于是P(x>5)=1-P(x≤5)=1-F(5)=1-Φ(
)=1-Φ(-1)=1-[1-Φ
(1)]=Φ
(1)=0.8413.
对第二个方案,有x~N(6,22),于是P(x>5)=1-P(x≤5)=1-F(5)=1-Φ(
)=1-Φ(-0.5)=Φ(0.5)=0.6915.
相比之下,“利润超过5万元”的概率以第一个方案为好,可选第一个方案.
【例3】设
,且总体密度曲线的函数表达式为:
,x∈R。
⑴求μ,σ;⑵求
及
的值。
【例4】公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高ε~N(173,7)(单位:
cm),问车门应设计多高(精确到1cm)?
解:
设公共汽车门的设计高度为xcm,由题意,需使P(ξ≥x)<1%.
∵ξ~N(173,72),∴P(ξ≤x)=Φ(
)>0.99.
查表得
>2.33,∴x>189.31,即公共汽车门的高度应设计为190cm,可确保99%以上的成年男子头部不跟车门顶部碰撞.
同步练习正态分布、线性回归
1.已知从某批材料中任取一件时,取得的这件材料的强度ε~N(200,18),则取得的这件材料的强度不低于180的概率为()
A.0.9973B.0.8665C.0.8413D.0.8159
2.已知连续型随机变量x的概率密度函数是
其中常数A>0,则A的值为()
A.1B.bC.
D.b-a
3.某工厂某产品产量x(千件)与单位成本y(元)满足回归直线方程
,则以下说法中正确的是()
A.产量每增加1000件,单位成本下降1.82元
B.产量每减少1000件,单位成本上升1.82元
C.产量每增加1000件,单位成本上升1.82元
D.产量每减少1000件,单位成本下降1.82元
4.工人月工资(元)依劳动生产率(千元)变化的回归方程为
,下列判断正确的是()
A.劳动生产率为1000元时,工资为150元
B.劳动生产率提高1000元时,工资提高150元
C.劳动生产率提高1000元时,工资提高90元
D.劳动生产率为1000元时,工资为90元
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 正态分布 线性 回归