概率统计模型Word文件下载.docx
- 文档编号:14621744
- 上传时间:2022-10-23
- 格式:DOCX
- 页数:17
- 大小:231.17KB
概率统计模型Word文件下载.docx
《概率统计模型Word文件下载.docx》由会员分享,可在线阅读,更多相关《概率统计模型Word文件下载.docx(17页珍藏版)》请在冰豆网上搜索。
(2)开始时可能感到无从入手,不必担扰,随着学习过程逐渐展开,只要你是认真的,定会一步一步解脱困惑.
(3)尽早复习一下概率统计知识,熟悉不确定事物的处理勤动脑,勤思考与勤动手是学好数学建模课的关键,务求落实
六、重点难点辅导:
1、初等概率模型主要介绍了可靠性模型、传染病流行估计、常染色体遗传模型等三类
问题:
(1)可靠性模型
计算抓住一点:
元件串通则可靠度相乘;
元件并联则不可靠度相乘。
设某种机器的工作系统由N个部件组成,各部件之间是串联的,即只要有一个部件失
灵,整个系统就不能正常工作.为了提高系统的可靠性,在每个部件上都装有主要元件的备用件及自动投入装置(即当所使用元件损坏时,备用元件可自动替代之而开始工作)明显地,
可以把问题当作并联来处理,备用件越多,整个系统正常工作的可靠性就越大,•但是,备
用件过多势必导至整个系统的成本、重量和体积相应增大,工作精度也会降低•因此,配置
的最优化问题便被提出来了:
在某些限制性条件之下,如何确定各部件的备用件数量,使整
个系统的工作可靠性最大?
这就有了约束条件。
易见,问题的目标函数为非线性的,决策变量又取整数,故为非线性整数规划问题.
(2)传染病流行估计的数学模型
假定人群中有病人或更确切地说是带菌者,也有健康人,即可能感染者,任何两人之间的接
触是随机的,当健康人与病人接触时健康人是否被感染也是随机的•问题在于一旦掌握了随
机规律,那么如何去估计平均每天有多少健康人被感染,这种估计的准确性有多大?
•设人群只分病人和健康人两类,病人数和健康人数分别记为i和s,总数n不变,即
i+s=n
(1)
•人群中任何二人的接触是相互独立的,具有相同概率P,每人每天平均与m人接触;
当健康人与一病人接触时,健康人被感染的概率为入.
由假设2知道一个健康人每天接触的人数服从二项分布,且平均值是m则
m=(n-1)p
于是
n-1
r入m
P"
!
=,P=
nT
那么一健康人每天被感染的概率P2为
肖(4)
由于健康人被感染的人数也服从二项分布,其平均值卩为,
—sp=(n-i)p2
标准差二为
:
;
f』SP2(1-P2)十扣2(1-P2)(n—i)
注意,通常n…m,,n1,取(5.4)式右端展开式的前两项,有
平均值"
的相对误差的度量
(3)常染色体遗传模型
为了揭示生命的奥秘,现代人越来越重视遗传学的研究,特别是遗传特征的逐代传播,引起人们更多的重视•无论是人还是动植物都会将本身的特征遗传给下一代,这是因为后代继承了双亲的基因,形成了自己的基因对,而基因对则确定了后代所应具有的特征.以下仅
就常染色体遗传方式建立遗传数学模型,来分析逐代总体的基因型分布趋势,为有目的的遗
传控制提供依据。
问题分析
所谓常染色体遗传,是指后代从每个亲体的基因中各继承一个基因从而形成自己的基因型•如果所考虑的遗传特征是由两个基因A和B控制的,那么就有三种可能的基因型:
AA,
AB和BB.例如,金鱼草是由两个遗传基因决定它开花的颜色,AA型开红花,AB型的开粉
花,而BB型的开白花•这里的AA型和AB型表示了同一外部特征(红色),则人们认为基因A支配基因B,也说成基因B对于A是隐性的•当一个亲体的基因型为AB,另一个亲体的基因型为BB,那么后代便可从BB型中得到基因B,从AB型中得到A或B,且是等可能性地得到。
某植物园中一种植物的基因型为AA,AB和BB.现计划采用AA型植物与每种基
因型植物相结合的方案培育植物后代,试预测,若干年后,这种植物的任一代的三种基因型
分布情况。
模型假设
(1)按问题分析,后代从上一代亲体中继承基因A或B是等可能的,即有双亲体基因型的所有可能结合使其后代形成每种基因型的概率分布情况如表。
下一代基因型
(n代)
上一代父-母基因型(n-1代)
AA-AA
AA-AB
AA-BB
AB-AB
AB-BB
BB-BB
AA
1
1/2
1/4
AB
BB
♦以an,bn和Cn分别表示第n代植物中基因型为AA,AB和BB的植物总数的百分率,
x(n)表示第n代植物的基因型分布,即有
特别当n=0时,x(0^(a0,b0,c0)T表示植物基因型的初始分布,显然有a0b05=1.
其中
利用(14)进行递推,便可获得第n代基因型分布的数学模型
通过求解,得
或写为
an=1—
(2)nbo—
(2)七
心=
(2)出+(;
)叫0
Cn=0
由上式可见,当nr「时,有
anr1,bnr0,Cnr0
即当繁殖代数很大时,所培育出的植物基本上呈现的是AA型,AB型的极少,BB型不存在•
2、随机性决策模型
所谓行为决策理论,就是用行为科学的观点和方法,对决策活动进行描述,解释和预测
的一种理论。
它以人的决策行为作业基本要素,以自然科学的实证方法(精神物理学等)作为主要手
段,归纳出一套建立在经验证据基础上的理论观点,拓展了决策论的研究范围。
合理的决策必须具备三个条件:
1、目标合理;
2、决策结果满足预定目标的要求;
3、决策本身符合效率、满意、有限合理、经济性的原则。
所谓风险型决策是指在作出决策时,往往有某些随机性的因素影响,而决策者对于这些因素的了解不足,但是对各种因素发生的概率已知或者可估算出来,因此这种决策因存在一
定的风险•
1风险决策模型的基本要素
决策者一一进行决策的个人、委员会或某个组织•在问题比较重大和严肃时,通常应以
后者形式出现•
方案或策略一一参谋人员为决策者提供的各种可行计划和谋略•如渔民要决定出海打
鱼与否便是两个方案或称两个策略•
准则一一衡量所选方案正确性的标准•作为风险型决策,采用的比较多的准则是期望效
益值准则,也即根据每个方案的数学期望值作出判断•对收益讲,期望效益值越大的方案越
好;
反之对于损失来讲,期望效益值越小的方案越好
事件或状态一一不为决策者可控制的客观存在的且将发生的自然状态称为状态(事件),
如下小雨,下大雨和下暴雨即为三个事件或称三种状态,均为人所不可控因素
结果一一某事件(状态)发生带来的收益或损失值•
2风险决策方法
*利用树形图法表示决策过程具有直观简便的特点,将其称为决策树的方法•
充分利用灵敏度分析(即优化后分析)方法对决策结果作进一步的推广和分析•
决策树一般都是自上而下的来生成的。
选择分割的方法有好几种,但是目的都是一致的:
对目标类尝试进行最佳的分割。
从根到叶子节点都有一条路径,这条路径就是一条“规则”。
决策树可以是二叉的,也可以是多叉的。
对每个节点的衡量:
1)通过该节点的记录数
2)如果是叶子节点的话,分类的路径
3)对叶子节点正确分类的比例。
有些规则的效果可以比其他的一些规则要好。
决策树对于常规统计方法的优点。
构造好的决策树的关键在于如何选择好的逻辑判断或属性。
对于同样一组例子,可以
有很多决策树能符合这组例子。
人们研究出,一般情况下或具有较大概率地说,树越小则树的预测能力越强。
要构造尽可能小的决策树,关键在于选择恰当的逻辑判断或属性。
由于构
造最小的树是NP-难问题,因此只能采取用启发式策略选择好的逻辑判断或属性
天龙服装厂设计了一款新式女装准备推向全国。
如果直接大批量生产与销售,主观估
计成功与失败的概率各为0.5,其分别的获利为1200万元与-500万元,如取消生产销售计划,则损失设计与准备费用40万元。
为稳妥起见,可先小批量生产试销,试销的投入需45
万元。
据历史资料与专家估计,试销成功与失败的概率分别为0.6与0.4,又据过去情况,
大批生产销售为成功的例子中,试销成功的占84%大批生产销售失败的事例中,试销成功
的占36%试根据以上数据,通过建立决策树模型按期望值准则确定最优决策。
解答:
本题显然是要考核风险性决策模型的建立能力。
按照这类模型的建立思路,我
们有:
(一)问题分析与模型假设
1•问题涉及直接大批量生产与销售、取消生产销售计划和小批量试销售这样三个决策
方案的取舍,在每种方案下又分为成功或失败两种结果;
2.决策目标在表面上看是获利大小,实际上是要决定试销与否;
3.尚需注意后面几句话:
“大批生产销售为成功的例子中,试销成功的占84%大批生
产销售失败的事例中,试销成功的占36%'
这意味着要计算两个概率,其一是当试销成功
时,大批量销售成功与失败的概率;
其二是试销失败情况下,大批量销售成功与失败的概率,
这意味着要利用贝叶斯概率公式;
4.设定以下变量
A--试销成功,则A--试销失败;
B--大量销售成功,则B--大量销售失败。
(二)模型建立
1.先来计算两个概率,注意到
P(A/B)=0.84,P(B)=0.6,P(A/B)=0.36,代入贝叶
斯概率公式
PP(A/B)P(B)
P(A/B)P(B)+P(A/B)P(B)
-0.78,
0.84汇0.6
0.840.60.360.4
从而P(B/A)=0.22.即当试销成功时,大批量销售成功与失败的概率分别为0.78和0.22.
同理可以算出在试销失败情况下,大批量销售成功与失败的概率分别为0.22和0.78.
2.以试
销与否作为决策思路,从左至由画出决策树模型如下(见图-2):
这棵树即为所求的数学模型。
为了简单化,原题没有对求解等后续过程作要求。
我们不妨将模型求解出来。
(三)模型求解
,便得图-3
根据期望利润值最大准则对决策树进行计算(从右向左)决策树的优缺点:
优点:
1)可以生成可以理解的规则。
2)计算量相对来说不是很大。
3)可以处理连续和种类字段。
4)决策树可以清晰的显示哪些字段比较重要
缺点:
1)对连续性的字段比较难预测。
2)对有时间顺序的数据,需要很多预处理的工作。
3)当类别太多时,错误可能就会增加的比较快。
4)一般的算法分类的时候,只是根据一个字段来分类。
3、随机性存储模型
在随机性需求的情况下,要制订最优的存储策略必须知道一个时间段(如一天、一周、一个月等)内需
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 模型