确定公因式的方法简述确定概率的方法.docx
- 文档编号:28597220
- 上传时间:2023-07-19
- 格式:DOCX
- 页数:49
- 大小:88.37KB
确定公因式的方法简述确定概率的方法.docx
《确定公因式的方法简述确定概率的方法.docx》由会员分享,可在线阅读,更多相关《确定公因式的方法简述确定概率的方法.docx(49页珍藏版)》请在冰豆网上搜索。
确定公因式的方法简述确定概率的方法
确定公因式的方法-简述确定概率的方法
概率的定义及其确定方法 §概率的定义及其确定方法 在本节,我们要给出概率的定义,这是概率论中最基本的概念。
本节中我们还将介绍几种确定概率的方法。
随机事件的发生有偶然性,但我们常常会觉察到随机事件发生的可能性是有大小之分的。
例如,购买彩票后可能中大奖,可能不中奖,但中大奖的可能性远比不中奖的可能性小。
既然各种事件发生的可能性有大有小,自然使人们想到用一个数字表示事件发生的可能性大小。
这个数字就称为事件的概率。
然而,对于给定的事件A,该用哪个数字作为它的概率呢?
这决定于所研究的随机现象或随机试验以及事件A的特殊性,不能一概而论。
在概率论的发展历史上,人们针对特定的随机试验提出过不同的概率的定义和确定概率的方法:
古典定义、几何定义和频率定义。
这些概率的定义和确定方法虽然有其合理性,但也只适合于特定的随机现象,有很大的局限性。
那么如何给出适合于一切随机现象的概率的最一般的定义呢?
1900年数学家希尔伯特提出要建立概率的公理化定义以解决这个问题,即以最少的几条本质特性出发去刻画概率的概念.1933年数学家柯尔莫哥洛夫首次提出了概率的公理化定义,这一公理化体系迅速得到举世公认,有了这个定义后,概率论才被正式承认为一个数学分支,并得到迅猛发展. 1.概率的公理化定义 定义设为样本空间,F为的某些子集组成的事件域.P(A)(AF)是定义在事件域F上的实值集函数,如果它满足:
(1)非负性公理对于任一AF,有P(A)0;
(2)正则性公理P()1; (3)可列可加性公理若A1,A2,„,An,„两两互不相容,则 P(UAn)P(An) n1n1 则称P(A)为事件A的概率,称三元总体(,F,P)为概率空间. 概率的公理化定义刻画了概率的本质,概率是集合的实值函数,若在 事件域上给出一个函数,只要这个函数满足上述三条公理就称为概率。
这个定义只涉及样本空间和事件域及概率的最本质的性质而与具体的随机现象无关。
对于具体的随机现象中的给定的事件,其概率如何合理地确定那要依据具体情况而定。
历史上出现的概率的频率定义、古典定义和几何定义都是特定的场合下有着各自的确定概率的方法。
在有了概率的公理化定义之后,把它们看作确定概率的方法是恰当的。
下面介绍这些确定概率的方法。
2.频率方法 设E为一随机试验,A为其中一事件,在相同条件下将E独立重复做n次,记n(A)为事件A发生的次数,比值fn(A)n(A)n 称为事件A在这n次试验中的频率。
容易验证频率满足概率的公理化定义中的三条公理。
一般地,如事件A发生的可能性愈大,那么在多次重复试验中,事件A发生愈频繁即频率fn(A)也愈大.反之,频率fn(A)愈大表明事件A发生的可能性愈大.因此事件频率的大小与事件发生的可能性大小有密切的联系.但是还不能把事件的频率就确定为概率,因为频率有“波动性”.长期实践表明,随着试验次数n的增加,频率fn(A)会稳定于某一个常数p,这个频率的稳定值是由事件本身决定的并且这样的稳定值满足概率的公理化定义中的三条公理,因能把这个稳定值确定为事件的概率是合理的. 这种确定概率的方法虽然有其合理性,但其缺点是明显的:
在现实世界里,人们无法把一个试验无限次地重复下去,因此我们无法精确地得到频率的稳定值.尽管有明显的缺点,但这种方法有其重大意义:
一方面,频率具有稳定性这一客观事实给概率提供经验背景.同时频率方法给我们提供了一个可以想象的具体值,并且在试验次数较大时,可用频率给出概率的近似值.例如,工业生产中,依据抽检的一些产品估计产品的废品率.另一方面,它提供了检验理论正确与否的准则.设想依据某一理论或假定算出了某事件A的概率为p,这一理论或假定是否与实际相符,我们并无把握,于是我们可诉诸试验,即进行大量重复试验以观察事件A的频率fn(A).若频率fn(A)与p接近,则可认为试验结果支持了有关理论或假定.若频率fn(A)与p相差较大, 则认为理论可能有误.例如,在抛硬币的试验中,假定正反面出现的可能性相等,则出现正面的概率与出现反面的概率都是,如果我们多次抛掷硬币,若正面出现的频率与相差甚远,那么正反面出现的可能性相等这个假定的正确性值得怀疑.下面是频率稳定性的几个实例. 3.古典方法 确定概率的古典方法是概率论历史上最早研究的情形,它简单、直观、不需做大量重复试验。
先看一个简单试验:
掷一个六面均匀的骰子,这个试验有6个基本结果,如果六个面是平等看待,那么可以认为每个面朝上的可能性相同,即每个点数出现的概率相等,这样的试验称为古典概型。
在古典概型中,事件的概率应该与事件包含的样本点个数成正比,事件的概率也就能容易地确定。
如果试验E具有下列性质 试验的基本结果只有有限个,即试验的样本空间为有限样本空间; 一切基本事科发生的可能性相等。
则称试验E为古典概型。
设试验E为古典概型,样本空间包含有n个样本点,A为试验E的一事件,且事件A包含k个样本点,则事件A的概率为P(A)kn 古典方法是概率论发展初期确定概率的常用方法,在古典方法中,为求一个事件A的概率,需求出试验的等可能的基本结果总数和事件A包含的基本结果数。
例将一硬币抛3次,假设每次抛掷中出现正面和反面的可能性相等,求恰好出现1次正面的概率。
解:
由于每次抛掷中出现正面和反面的可能性相等,因此该试验的等可能的基本结果有8个。
即样本空间取为 {HHH,HHT,HTH,THH,HTT,THT,TTH,TTT} 且各个基本结果具有等可能性,而事件A“恰好出现1次正面”包含1个样本点”HHH”,即A{HHH},所以所求的概率为 P(A)18 注意,此试验中若我们考虑的样本空间为{0,1,2,3},那么A“恰好出现1次正面”为的子事{1},但并不能由此得出A的概率为1,因为样本空间为{0,1,2,3}4 的各个基本事件不具有等可能性.因此用古典方法确定概率时一定要注意“基本事件的等可能性”. 当样本空间中样本点较多时,我们不必将样本点一一列举出来,而只需求出样本点总数n和事件A包含的样本点个数k,但要注意“等可能性”.下面介绍古典概型中几件常见的模型. 一、抽样模型(也叫取球模型) 抽样有两种方式:
不放回抽样与放回抽样 1.不放回抽样:
一个总体由两类元素(用A,B表示)组成,共有N元素,其中有M个A类元素,NM个B类元素,从中任取n个元素,我们常关注取出元素A类成B类元素的个数.求事件Am“取出的n个元素中有m个A类元素”的概率. nmnm解:
样本空间中样本点的总数为CN,事件Am包含的样本点个数为CMCNM.由于 n是随机抽取的,所以这CN个基本事件是等可能,故所求的概率是mnmCMCNMP(Am)nCN 若引入随机变量X:
取出的A类元素的个数,则可得X的概率分布为 mnmCNCNMP(Xm),max(0,nMN)mmin(n,M)nCN k为方便,我们约定:
Cm0,k0或km,那么上述概率分布可写为 mnmCMCNMP(Xm),m0,1,,nnCN 以上的概率分布称为超几何分布(后面章节会继续讨论这种分布),这种分布在抽样调查中是很重要的.比如N件产品中有M件不合格品,NM件合格品,从 中抽检n件产品.在实际问题中,N的值已知,而M的值未知,要根据抽查的n件产品中的次品件数去推断M的值,这属于统计问题.也有M的值已知,而N的值未知的情况,例如,从某一湖里,捕捉M尾鱼,将这些鱼作上某种标记,然后放回湖中,过一段时间后,再从湖中捕捉出n尾鱼,发现其中有m尾有标记,对该湖中鱼的总数N能作出什么结论?
这个问题在学习数理统计时再来讨论. 注:
1.对以上模型作稍微的改变:
一个袋有7个球,其中5个红球,2个白球.从中依次取3次球,每次取一个,取后不放回.试求下列事件的概率,
(1)A“前2次取到红球,最后1次取到白球”;
(2)B“取到2个红球,1个白球”; (3)C“第2次取到红球”. 解:
(1)P(A) 错解:
P(A)
(2)P(B)5424765215423C7542347657 1C52C24或P(B)37C7 在此问题中,两种做法都可得出正确答案,为什么?
54354225425157657 54255或P(C)767(3)P(C) 可以看出,第2次取到红球的概率与第1次取到红球的概率相等,同样地可算出第3次取到红球的的概率也是 释了“抓阄的公平性”. 2.以上模型可推广至N个元素由多类元素组成的情形,比如,一批产品共N件,其中有M1件一等品,M2件二等品,M3件三等品(M1M2M3N),从中任取n件产品,则取到m1件一等品,m2件二等品,m3件三等品(m1m2m3n)的概率为5.这就是“抽签与顺序无关”的原理,从概率论上解7 pm3m1m2CMCCMM123 Cn N 教材的例(彩票问题)就属这类问题. 若引入随机变量X,Y:
X,Y分别表示取出的一等品和二等品件数,则(X,Y)的概率分布属于多项超几何分布. 2.放回抽样:
一个总体由两类元素(用A,B表示)组成,共有N元素,其中有M个A类元素,NM个B类元素,从中依次取n次,每次取1个元素,取后放回.求事件Am“取出的n个元素中有m个A类元素”的概率. 解:
样本空间中样本点的总数为Nn,事件Am包含的样本点个数为mn个基本事件是等可能,故所求CnMm(NM)nm.由于是随机抽取的,所以这CN 的概率是mCnMm(NM)nm P(Am)nN 将上面结果变形为 mmP(Am)Cnp(1p)nm,其中pM,这是什么模型的概率问题(这是你们中学学过的)?
N MN若引入随机变量X:
X表示取出的A类元素的个数,则可得X的概率分布为mm,,n,pP(Xm)Cnp(1p)nm,m0,1 以上的概率分布称为二项分布(后面章节会继续讨论这种分布).二项分布的一种推广就是多项分布. 二、盒子模型(也叫放球模型) 设有n个球,每个球都等可能地放到N个盒子中的任一个,盒子的容量不限.
(1)设nN,求球放入不同盒子中的概率;
(2)求某指定的盒子为空盒的概率的概率; (3)求某指定的盒子有k个球的概率的概率 解:
(1)设A表示事件“球放入不同盒子中”,则 nPNP(A)nN
(2)设B表示事件“某指定的盒子为空盒”,则 (N1)n P(A)nN (3)设C表示事件“某指定的盒子有k个球”,则 kCn(N1)nk P(C)Nn 以上结果可变形为k(P(C)Cn1k1)
(1)nkNN 由变形后的结果会想到什么概率模型?
在盒子模型中,我们还会关注于各个盒子的球的数目或球的分布状况.我们看下面问题:
将6个球随机地放入5个盒子中,5个盒子分别编号1,2,3,4,5.则1号,2号,3号,4号,5号盒子中分别有2个球,2球,1个球,1个球,和0个球的球的概率为 211C62C4C2C1p56 思考:
6个球的分布状况是2,2,1,1,0(即有2个盒子各放2个球,3个盒子各放1个球,1个盒子没球)的概率是多少?
教材的例(生日问题)属盒子模型的问题. 三、补充问题:
重复组合问题及其应用 从n个不同元素中每次取一个,放回后取下一个,如此连续取r次所得的组合称为重复组合(不考虑次序).那么重复组合数是多少呢?
易见,这个问题等价于将r个不可分辨的球放入n个盒子(盒子是可分辨的)中,可区分的放球结果有多少种?
为求解此问题,我们先求每个盒子至少有1个球的不同放法的总数(此时要求rn).设想将r个球排成一行,相邻两球之间各有一个空格,共有r1个空格,在这r1个空格中任取n1个空格上插入“|”,每种插法一一对应于每个盒子都有 1球的一种放法,于是可得每个盒子都有球的放法共有Crn1。
再考虑原方问题的求解,设想先在每个盒子中各放1球,这样将r个不可分辨的球放入n个盒子中的不同放法总数等于将rn个不可分辨的球放入n个盒子时每个盒子至少有1个球的不同放法的总数,由此可知将r个不可分辨的球放入 n1rn个盒子中,可区分的放球结果有Cnr1种。
以上问题也等价于方程 x1x2xnr 共有多少个正整数解及多少个非负整数解的问题。
等价的问题有很多,请思考下面问题。
思考:
同时掷n个相同的骰子,可区分的结果共有多少种?
(xyz)n的展开式中共有多少项?
n元函数uf(x1,x2,,xn)的k阶偏导共有多少个?
例一个通信系统含有n个天线,顺序地排成一行,只要没有两个连续的天线都失效,这个系统就可以接收到信息,现已探明这n个天线里,恰有m个天线失效,问此系统仍然有效的概率有多大?
mm分析:
m个失效天线在n个天线中的排列位置共有Cn种,从而有Cn个等可能的 基本事件。
系统有效当且仅当相邻的两个失效天线之间都有有效天线,设想先把m个失效天线排成一行,然后把nm个有效天线安排在相邻的两个失效天线之间以及头、尾两端。
记x1,xm1分别表示头、尾两端的有效天线数,xi表示第i1个失效天线与第i个失效天线之间的有效天线数。
这样问题化为求方程 x1x2xmxm1nm 满足x10,xm10,xi1(i2,,m)的整数解的个数。
令y1x11,ym1xm11,yixi,上面问题等价于方程 y1y2ymym1nm2 m正整数解的个数问题。
由前面的讨论知,该问题的答案是Cnm1, 故所求结果为mCnm1p mCn 下面讨论一下游程问题,游程理论可以有很多方式应用于统计中,主要用于 随机性检验和齐次检验 在由两类元素构成的有序序列中,由同一类元素组成的最大的子序列称为一个游程。
例如,6个和4个排成序列,那么该序列有3个游程,2个游程,总游程数为5。
设n1个元素和n2个元素排成一序列,总游程数记为R,若总游程数过小则说明同类元素有聚集现象,若过大则说明有混杂现象。
为了从统计上要侦别是否有某种系统因素造成以上现象,为此需计算在这n个元素随机排成一列的假定条件下,游程数R取各个可能值的概率。
即计算P(Rm)。
n1n2首先可以看出这n个元素排成一列时,有Cn n1个可以区分的排列结果,在这n个元素随机排列的条件下,这Cn个结果是等概 的。
下面考虑事件(Rm)包含的基本结果数。
若m2k,则游程 k1数和游程数均为k,游程数为k的排列结果数为Cn k1,前面的游程可以是游程也可以是游程。
所以事件“总游程为2k”包Cn21 k1k1含了2Cn个基本结果。
故C1n121 k1k12CnCn2111P(R2k) 同样地可得Cn1n P(R2k1)k1kkk1CnCCC1n1n1n12121 Cn1n。
k注意以上计算结果中我们都约定:
Cm0,k0或km。
4.几何方法 古典概率适合的随机试验有两个特点:
试验只有有限个基本结果,即样本空间为有限样本空间,一切基本事件地位均等,即基本事件具有等可能性。
而在实际中,经常会遇到这样一类随机现象:
基本结果有无穷个且一切基本事件的地位均等。
例如,从1,2,3,4,5,6中任取一个数,考虑取到的数不小于4的概率,这是古典概率的问题,如把该问题改为;从区间中任取一个数,考虑取到的数不小于4的概率,这个试验的样本空间为区间,其基本事件有无穷个,且一切基本事件的地位均等,即基本事件具有“等可能性”。
容易想到这个试验中事件的概率与事件的长度成正比。
这便是几何概率。
如果试验E的基本结果有无穷个且其样本空间为度量有限的区间或区域,样本点在样本空间中均匀分布,这样的试验称为几何概型。
设试验E为几何概型,样本空间为,A为一事件,则事件A的概率为P(A)L(A)L() 其中L(A)表示A的度量。
例从区间中任取一个数,求取到的数不小于4的概率; 从区间中任取两个数,求取到的两数之和不小于8的概率.例 例 例 5.确定概率的主观方法盖革(1910)只由到时确定地震震中的概率方法 只由到时确定地震震中的概率方法 盖革,1910 符号:
λ=经度,φ=纬度,t=发震时刻,以时、分、秒计。
T=波的走时,以分、秒计。
*表示相伴的值是假定的,是要被校正的。
△是在地球表面上的角距离。
†只使用一次,表示观测值,当附在时间上时,表示到达一台站的观测到时。
数字下标和通用下标n表示台站数据,或者是假定值或者是绝对值。
下标0表示震中的函数。
为使用这一方法,我们必须首先假定一个近似的震中位置,这一假定值越接近最终位置,则校正值越小,定位结果会越准确,但最初假定值有几度的误差将可以计算出相当好的位置。
这一过程在很大程度上依赖于第一个初至波的走时,当然,它不是距离的线性函数。
如果我们以任意方便的方法假定了0、0和t0,并假定每个值中有误差,我们用0、0和t0表示,于是有式:
000000 t0t0t0 在这些等式中,左手边的量是要寻找的量,右手边的第一项是没有改变的假定量,它们受第二项的校正。
于是问题本身变成确定δ量。
为确定这些δ量,我们进行下述过程:
首先利用球面余弦定律计算从假定的震中到每个台站的距离:
cosnsin0sinncon0cosncos0(n)
(2) 在本讨论最后的制表工作中,这是用取对数的方法计算的,在余弦定律右边的两项用I和II表示,这两项要相加。
在这样得到 cosn之后,由自然余弦表得到相应的以角度测量的n。
现在我们有了从台站n到一个假定震中位置的近似角距离或者说弧距离,于是我们从一个走时表得到近似的走时。
根据我们的符号,这一走时称作Tn。
近似的走时加上近似的发震时刻便给出近似的到时,即 tnt0Tn (3) 如果在我们的假定位置中没有误差,在记录的时间中没有误差,而且观测中也没有误差的话,那么,*tn将是我们的观测到时†tn。
但实际上存在误差,所以在二者之间将有差值Fn,即 Fn=*tn-†tn (4) 由此可清楚地看到,如果没有0、0和t0这些误差,而且†tn是准确的,那么就不会存在Fn。
我们的下一步是建立Fn和假定由于Fn的存在而造成的误差之间的关系。
在此时我们假定,除了经度,关于震中位置和时间的其他数据都是正确的,并假定由于经度差造成了Fn,于是 tn Fn0 0 就是说,Fn将是一个时间校正值,等于每单位经度的时间校正值乘以经度校正的单位数。
在当前考虑经度变化的情况下,如果我们检查每度经度的走时变化率,并利用这一比值,以一个等于这一比值乘以实际经度校正值的量来校正我们的时间,那么将得到满意的Fn值。
现在,将刚才关于经度所说的话以同等效力独立地应 tn 用于纬度,于是有0。
另一方面,如果我们假定发震时刻*t0 0 有一个改变,则到时*tn也必定有一个类似的改变,因些到时随发震 tn 时刻的变化率总是为单位1。
然而,为了便于数字处理,将这一 t0tn 比值按其他比值那样对待,因此有第三个校正值t0,尽管该值 t0 只不过是t0。
由这一考虑得知,Fn实质上是以差分形式存在的,因为它可以等于前述的差分;因此,当项变得无限小时,Fn将趋于以0作为极限。
现在,由泰勒定理可以看到,如果Fn分别依赖于 tntntn ()0、()0和()t0,则Fn可等于它们之和。
在构成这00t0 一等式时,用偏微分符号代替比值中的,以指出对每一个量的对待犹如其他量均为常数,并在最后使用总和。
在我们下文列出的工作中将会看到,对于纬度和经度,我们严格遵循这一过程,对于时间我们也同样这样做,但事实上时间比值总是等于1,因此只是引入了无用的工作。
所以, tntntn Fn00t0 00t0 由式中建立的关系,给*tn的任何增量将会给予*Tn,否则走时将是一个随当天的小时改变的变量,因此在任何比值中可以用*Tn代替*tn。
所以,我们可以代入式, TnTn Fn00t0 00 以an、bn和cn代替式中的比值,并记住cn必须为1,我们立即得到 Fnan0bn0cnt0 TnTn 在式之后,我们代之以an,bn。
现在在这些比值 00 的分子和分母中引入n,并对所得到的分式进行因式分解,我们得到:
TnnTnn bnan n0 n0 和 现在,如果我们以时间秒计算*Tn,以弧分记n,则上式中的第一个比值将表示n中每弧分变化所造成的走时变化。
这可由走时表按下述过程计算出来:
对每个台站取给定距离n处对应于每度变化的时间差dsn,并除以60,得到对应1弧分的时间差。
s Tndn 这样, n60 (9) 在每种情况中的第二个比值显然是对假定震中的经度或纬度给一个增量所造成的距离n变化量除以该增量所得到的商,即0或0的每单位变化所造成的n的改变。
可按下述方式容易地得到这一比值:
对假定震中的经度赋予一个任意的增量0,例如1或更大些。
这一新点的坐标将是。
利用球面余弦定律),计算每个台站到那一点的距离。
称该距离为n。
于是,显然nnn,这是对0赋予增量后n产生的变化。
将这一总变化n除以赋予0的增量,得到的商便近似于0的每单位变化造成的n的变化,它正是所希望的比值n/0。
对每个台站的式, s n/0与dn/60的乘积将给出式中的系数an。
以类似的方式得到 n/0, 我们同样对0赋予1或更大的一个任意增量,计算从每个台站到新点的距离n,求出差值nn,并将该差值除以纬度增量0。
该结果又将是所希望的比值n/0,将其乘以内插因子dns/60,于是给出式中的第二个系数bn。
这一工作可利用从每个台站到假想震中的距离* n列表进行。
现在我们已经有了an和bn的实际数值,以及cn=1。
但n代表那些台站中的任何一个,于是,利用式,我们看到对每个台站有一个F值,即Fn。
这样,我们有多个误差方程,其方程个数等于使用其数据的台站个数。
现在,最小二乘法理论表明,所求未知数的最可能值是使各误差的平方和达到极小的那些值,设x是某个量,将其加到每个假设误差上将使得到的量的平方和,即(F1+x)2+(F2+x)2+…,达到极小。
于是,由微积分学得到,由于所考虑的函数趋向于极小值而不是极大值,所以x值将使该函数成为极小值,这将使函数的一阶导数等于零。
所以,取微分,令其等于零,再求解x,我们便得到一个校正量,它是必须加到每个台站误差上从而使平均误差达到极小。
现在,我们的一般化误差方程变为:
(Fnx)an0bn0cnt0 (10) 这对那些观测值几乎最一致的台站给
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 确定 公因式 方法 简述 概率