数据模型与决策完整Word文档格式.docx
- 文档编号:18835620
- 上传时间:2023-01-01
- 格式:DOCX
- 页数:25
- 大小:319.07KB
数据模型与决策完整Word文档格式.docx
《数据模型与决策完整Word文档格式.docx》由会员分享,可在线阅读,更多相关《数据模型与决策完整Word文档格式.docx(25页珍藏版)》请在冰豆网上搜索。
他还要知道(估计)vanessa接受他的可能性。
bill通过斯隆学院职业服务中心收集到了前几届MBA学生打工的有关数据。
其中,根据去年vanessa公司提供给销售和贸易部门工作的学生的薪水,bill估计今年夏季为期12个星期的打工的MBA学生的薪水为14000美元。
收集到的去年提供给斯隆管理学院学生的所有夏季工作机会的有关薪水的数据如下:
每周薪水(美元)
夏季薪水总额(12周)
接受这个薪水的学生的百分比
1800
1400
1000
500
21600
16800
12000
6000
5%
25%
40%
如果没有更多的信息,可以假设vanessa接受bill的申请的可能性为50%。
不过,飞机上的经历使bill确信,这个可能性应该有60%。
bill的决策树
1、方案
方案一:
到VanessaParker的银行打工,11月中旬开始招聘,薪水14000美元;
方案二:
回JohnMason那里工作,10月底必须答复,薪水12000美元;
方案三:
参加斯隆管院的夏季工作计划,1月和2月招聘。
薪水有以下情况:
21000,16800,12000,6000,0。
2、涉及的数据:
可选的方案;
可能遇到的状况;
各方案在各种状况下的收益;
各状况出现的概率。
3、一些概念(术语):
决策点,状态点(事件点),决策树,期望收益,灵敏度分析,决策策略。
4、方法:
问题分析时建树(展开),决策时从树叶开始收拢(期望收益方法)。
5、利用电子表格。
决策点状态点
电子表格:
bill工作决策.xls
条件的修改和灵敏度分析:
由于数据的统计性质和可能忽略的因素。
在excel上操作。
bill的最优决策策略:
(每个决策点写一条)
●bill应该拒绝john的提供;
●如果vanessa提供bill一个机会,则接受,如果vanessa不提供给bill机会,则他应该参加斯隆学院的计划;
●该策略的期望收益是13032美元。
二、生物影像公司的发展战略(谈判的可能性)
1998年,为了开发、生产和开拓新的具有潜在收益的医疗诊断工具市场,jamesbates、scotttillman和michaelford创立了生物影像公司。
jamesandscott是麻省理工学院(MIT)新近毕业的学生,michael是马萨诸塞州综合医院的神经学教授。
作为在MIT研究生学业的一部分,scott已经发展出了一种新技术和一个软件,利用个人计算机来处理病人大脑的磁共振影像(MRI)扫描。
该软件利用计算机图形学的技巧,能够构造一个病人大脑的三维图像,用来定位大脑损伤或脑肿瘤的精确位置,估计它的体积和形状,甚至确定可能会被肿瘤影响的大脑的中心位置。
scott的工作扩展了由james早期开发的二维图像处理技术,这个二维技术软件包已经在马萨诸塞州综合医院的michael小组中获得广泛的应用,用来分析脑损伤对病人语言能力的影响程度。
过去的几年,这个软件已经被用来对脑损伤和脑肿瘤做比较精确的测定和诊断。
虽然还没有被充分的试验,scott的更加先进的三维图像软件,展示出比其他方法精确的多的诊断脑损伤能力。
虽然世界各地的科学家都开发了他们自己的MRI图像处理软件,scott的新的三维程序却非常不同,且比任何现有的MRI图像处理软件先进很多。
在james的提议下,三个人组建了一个生物影像公司(Bio-Imaging),旨在开发和生产一个医院和医生可以使用的商用软件包。
不久,他们就引起了MedtechCorporation的注意,Medtech是一个大的医学图像处理和软件开发公司,希望用15万美元购买他们的还未完成的软件包,并获得在世界范围内的开发和推向市场的权利。
scottandmichael授权james(三人中的“商人”)来考虑是否接受Medtech公司的提议。
如果他们拒绝这个提议,他们的计划是在未来6个月内继续开发他们自己的软件包。
这需要大约20万美元的投资,james认为这可以由合伙人的个人积蓄解决。
如果Bio-Imaging在开发完全运作的三维图像处理程序的努力获得成功,他们将要从两个发展战略中进行选择。
一个战略是半年后向国家健康协会(NIH)申请30万美元的小企业创新研究(SBIR)资助。
这个钱用来进一步的开发和向市场推出他们的产品。
另一个选择是从风险投资公司那里寻求进一步的项目投资资金。
事实上,风险投资公司NugrowthDevelopment已经跟他们有过多次接触,提出如果Bio-Imaging成功地研制出三维图像处理程序的原型,公司将提供100万美元给他们用于资金周转和开发市场。
条件是,三维图像处理原型程序完全运作起来之后,80%的利润归NugrowthDevelopment。
(NIH规则规定,得到NIH资助的公司不能再接受风险公司的钱)。
james知道是否能够获得SBIR的资助本质上是不确定性,他也知道Bio-Imaging是否能够成功开发三维图像软件本质上也是不确定性。
不过,他认为,如果他们打算接受NugrowthDevelopment提供的风险资金,那么产品的收益可能比他们自己开发市场要高。
如果Bio-Imaging在开发三维图像软件原型方面的努力没有获得成功,james认为他们还可以用二维图像软件去申请SBIR资助。
他认为,这种情况下,获得资助的可能性比较小。
另外,在申请资助前,需要对二维图像软件进行临床调精测试,大约需要10万美元的成本。
Bio-Imaging面临的决策问题是,是接受Medtech的提议,还是继续完成三维原型的开发。
如果他们开发成功,要决定是申请SBIR资助还是接受NugrowthDevelopment的风险投资。
如果三维图像软件原型的研制没有成功,要决定是否应该进一步对二维图像软件进行投资,并申请二维图像软件的SBIR资助,或者完全放弃。
其中,james也想知道NugrowthDevelopment公司资助的成本(未来利润的80%)是否对于资助额(100万美元)来说可能太高了。
1、方案
接受Medtech公司的提议,将技术卖给它;
继续开发,若成功,则接受NugrowthDevelopment公司的资助;
继续开发,若成功,则申请SBIR资助;
方案四:
继续开发,若不成功,也申请SBIR资助;
方案五:
继续开发,若不成功,则放弃。
2、数据
四个分布:
三维图像软件开发成功的概率60%;
成功后获得SBIR资助的概率为70%,若不成功获得SBIR的资助的概率为20%;
三维图像软件的市场状况的分布:
高利润20%,中等利润40%,低利润40%;
二维图像软件的市场状况分布:
高利润25%,低利润75%。
收益值:
在获得SBIR资助(全部用于产品的生产开发和市场开发)的情况下三维图像软件的收益分别为300,500,0;
二维图像软件的收益为150,0;
如果接受NugrowthDevelopment的资助,三维图像软件的收益分别为1000,300,0(的20%)。
卖给Medtech公司的收益为15。
成本:
开发三维软件20万,继续优化二维软件10万。
3、节点
4、利用电子表格:
生物影像公司决策.xls
5、另外的选择:
与Medtech公司进行谈判。
站在Medtech公司的立场思考,看看谈判的价码和可能性。
三、一个新型消费品产品的开发(情报的价值)
CarolineJanes是消费品公司的市场销售经理,她正在考虑是否生产一种称为“无泡沫”的新型自动洗碗机清洁剂。
为了使这个问题简单化,假设无泡沫产品的市场要么是疲软的,要么是坚挺的。
如果市场是坚挺的,那么公司将盈利1800万美元;
如果市场是疲软的,那么公司将亏损800万美元。
根据经验和直觉的综合考虑,caroline估计无泡沫产品的市场是坚挺的概率为30%。
在决定是否生产无泡沫产品之前,caroline可以对无泡沫产品的市场进行一项全国性的调查。
市场调查的费用是240万美元。
这种市场调查不可能完全准确地预测新产品的市场。
过去的这种调查结果表明,如果市场是疲软的,有10%的可能性调查结果说市场是坚挺的。
同样,如果市场是坚挺的,有20%的可能性调查结果说市场是疲软的。
caroline可以决定要么不生产无泡沫产品;
要么在决定是否生产之前,进行市场调查;
要么不进行市场调查就直接进行生产。
不生产;
不进行市场调查就进行生产;
进行市场调查,再决定是否进行生产。
市场状况的先验分布
市场状况
概率
收益(万美元)
坚挺
0.3
疲软
0.7
-800
市场调查的准确性:
当市场疲软时,90%调查结果也是疲软的;
当市场坚挺时,80%调查结果也是坚挺的。
市场调查的费用:
240万美元。
3、电子表格:
新型消费品的开发问题.xls
4、情报价值
第二章统计抽样
两个经常使用的分布:
二项分布和正态分布
典型例子:
i)维修工的配置问题(二项分布)
某单位有同类型的机器300台,每台机器的工作是相互独立的,发生故障的概率都是0.01,问应该配备几名维修工?
(设一台机器的故障一人就可以排除)。
又,是1人管20台机器好呢,还是3人管80台机器好?
记X是同一时刻发生故障的设备台数,则X服从B(300,0.01)。
问题变成求N使得,(发生故障的机器数不大于N的概率)
利用POISSON分布与二项分布的关系,可以求得N≥8.
ii)库存的确定:
若在提前期内的需求是正态的,并有200单位的均值和100的方差。
管理层希望有一个0.9的保证不会发生缺货。
试确定一个进货量。
由于需求是不确定的,可以是100,也可以是300,当我们进货量确定为300时,如果需求只有100,就会增加库存成本;
而如果进货量为100时,需求却是300,就会失去市场,产生缺货成本。
现在我们已知了需求量的分布为N(200,100),可以利用分布提供给我们的信息,帮助我们进行决策。
寻找一个进货量x,使得需求大于这个进货量的概率不超过0.1,利用标准正态分布表可以知道,0.1的单边分位点为1.282,于是进货量为212.82(1.282=(x-200)/10)。
在这个数量中,200单位是用来满足期望需求的。
外加的12.82则是用来以90%的机会满足超过均值的需求所必需的。
zα/2
概率和置信区间。
iii)已知分布时,可以知道样本落入某一个区间的概率,只要你给定一个区间,我就可以计算样本属于这个区间的比例(概率)。
另一个方向的重要的应用是,你给定一个概率,我就可以找到一个区间(这个区间很多),使得样本属于这个区间的概率等于你给定的概率。
上下分位点就是这方面应用的代表。
给定一个概率,例如,95%,就可以找到一个上分位点,使得样本小于这个分位点的概率等于95%(从而,样本大于这个分位点的概率为5%);
也可以找到一个下分位点,使得样本大于这个分位点的概率等于95%(从而小于这个分位点的概率等于5%);
还可以找到双分位点,使得样本的绝对值小于这个分位点的概率等于95%,等等。
由分位点的概念,导致了置信区间和假设检验的应用。
1、随机样本的统计
NEXNet公司
NEXNet公司是一个规模相对小的,却在美国大西洋中部地区的电信市场中非常具有竞争力的公司。
公司的管理者正在考虑将公司迁往波士顿地区,他们的目标是收入相对较高的群体。
公司的管理者一直在利用一个基于高的电话使用率的市场群体的增长和发展策略。
基于以往的经验,他们发现,在目前的电话应用中,他们能够在拥有下列特征的客户群体中盈利:
●家庭月平均电话费至少是75.00美元;
●月平均电话费低于45.00美元的家庭比例仅为15%;
●月平均电话费位于60-100美元之间的家庭比例至少是30%。
目标社区70个家庭在10月份的月电话费的样本数据(excel表)
基于样本数据要回答下列问题:
a)家庭电话费在10月份的分布图的估计;
b)10月份,电话费低于45美元的家庭的百分比;
c)10月份,电话费位于60-100美元之间的家庭的百分比;
d)10月份,家庭电话费分布的均值和标准差。
70个家庭10月份电话费的频率表(excel表),另外,可以利用分析工具中的直方图直接得到(不要有任何的图的选项)。
作直方图的两种方法。
概率的计算。
描述性统计。
●在这个地区,除了一批小的但很重要的客户分布在125—155美元之间之外,10月份电话费的分布图形的形状看起来像一个正态分布,峰值接近65美元。
●10月份,电话费低于45美元的家庭的百分比的估计是7%;
●10月份,电话费位于60-100美元的家庭的百分比的估计是64%;
●10月份,家庭电话费分布的均值估计是79.4美元,标准离差的估计是28.79。
结论:
表明这个地区有一定的电话应用特征,有利于开发这个地区的市场。
此外,还应该对电话费非常高的家庭市场作进一步的分析,例如,月电话费在115美元以上的家庭,以便采取特殊的营销活动。
2、中心极限定理
中心极限定理:
独立同分布随机变量的序列,X1,X2,…,Xn,…设均值和标准差分别为μ和σ,则
趋近于标准正态分布N(0,1)。
也就是说,对任何x,
(样本均值标准化的分布)。
中心极限定理的例证(掷100次硬币,出现正面的次数的和是一个随机变量,这个随机变量近似于正态分布,为了说明这一点,模拟这个和100次,看它的直方图)。
三种方法:
直接模拟、二项式分布和利用水晶球(只需把表示100次掷硬币的和的单元格定义为预测单元格)。
二项分布是0-1分布的和(独立同分布)。
3、大样本均值的置信区间
伯克希尔能源公司(BPC)是一个在马萨诸塞州伯克希尔县提供电力能源的电力公司。
BPC最近已经完成了各种激励计划以鼓励家庭在冬季节约能源。
sarah负责检测这些新的激励计划的效果。
sarah想要预测在伯克希尔县即将到来的一月,家庭电量消耗分布的均值μ和标准离差σ。
sarah在这个县随机地选取了100个家庭,她安排人员1月1日去这个县读取所有100个家庭的电表数值,然后1月31日再进行一次。
从而计算出1月份的电力消耗。
(excel表)
根据数据可以计算均值和方差(标准离差)
如果从这100个样本中随机选取10个,计算其均值,进行多次计算,每次当然会不一样,将这些不同的均值做一个直方图,可以发现近似于正态分布(中心极限定理)。
通过样本均值可以得到数学期望的一个估计,但在实际中,对于任何近似计算,都希望能够对于可能引起的误差有一个说明,那么,怎样说明利用样本均值近似数学期望的误差呢?
这又涉及到分布问题。
当总体的分布不是已知的时候,大数定理或中心极限定理又提供了帮助。
对于伯克希尔公司来说,通过样本计算出的用电均值3011有多大的可信度呢?
大样本均值的置信区间:
如果样本数n≥30,那么均值μ的95%的置信区间为(z.95=1.96)
这里s是样本标准离差。
这样计算的区间中,有95%的包含实际的数学期望μ。
伯克希尔公司问题中用电平均值的置信区间为
4、小样本均值的置信区间
t分布,与自由度有关,自由度即样本的个数,当样本数大于30的时候,t分布与正态分布几乎不能区别,当样本数小于30的时候(小样本),用t分布求置信区间。
差别就在于像1.96那样的数值是不同的。
在t分布时,这个数不仅与置信度有关,还与样本数(自由度)有关。
例如,对于95%的置信度,当样本数为20时,t.95=2.093,当样本数为16时,t.95=2.131。
5、总体比例的估计与置信区间(略)
二项分布和中心极限定理的应用
假设一个有线电视公司想要估计波士顿地区拥有两台或两台以上电视机的家庭比例。
该公司已经对波士顿地区200个家庭进行了问卷调查,发现200个家庭中有124个家庭拥有两台或以上电视机。
通过这个调查,可以估计在整个波士顿地区拥有两台或以上电视机的家庭的比例为124/200=0.62。
类似的问题,如,一批产品中,次品的比例,也是用这种抽样的方法进行估计的。
可是我们不仅希望得到这样一个估计,还希望对估计的正确性有一定的了解,这又涉及置信区间了。
设真正的次品率为p,抽样后估计的次品率为
,利用
可以得到p的一个置信区间为:
设n
≥5,n(1-
)≥5,则总体p的一个置信度为β%的置信区间为
其中c如下:
P(-c≤Z≤c)=β%
当β%=90%时,c=1.645
当β%=95%时,c=1.960
当β%=98%时,c=2.326
当β%=99%时,c=2.576
对有线电视的问题而言,200个样本计算出的波士顿地区拥有两台或以上电视的家庭的区间估计是:
取95%的置信度,
=124/200=0.62,n
≥5且n(1-
)≥5,置信区间如下
也就是说,我们有95%的可信度认为在波士顿地区,拥有两台或以上电视机的家庭的比例是位于0.553-0.687区间。
6、t检验
独立样本t检验:
某物质在处理前与处理后分别抽样分析其含脂率如下:
处理前:
0.190.180.210.300.410.120.27
处理后:
0.150.130.070.240.190.060.080.12
问处理前后的含脂率是否有显著变化?
(0.05置信水平,假设服从正态且方差等)
又例:
在某克山病区测得11例克山病患者与13名健康人的血磷值如下:
患者:
0.841.051.201.201.391.531.671.801.872.072.11
健康人:
.0.540.640.640.750.811.161.201.341.351.481.561.87.
第三章仿真模拟
1、模拟掷硬币(均匀的和不均匀的);
模拟掷骰子(if嵌套和vlookup);
2、有限离散分布的模拟:
均匀分布的利用,[01]区间的分段和vlookup函数的应用;
3、连续分布的模拟:
一般原理(分布函数的反函数,均匀分布);
正态的情况(norminv函数);
指数分布的推导;
三角分布的推导;
4、crystalball及其应用(用软件自带的教程,假设单元格、预测单元格和决策单元格);
用crystalball演示中心极限定理。
5、书上的案例(问题建模,模拟,数据的统计分析,决策);
一些其他的例子;
6、库存模拟。
科尼利水产的经营
克林特.科尼利是科尼利水产公司的董事长,他在马萨诸塞州的纽伯里波特地区经营着由50艘船组成的船队。
克林特的父亲40年前创建了这家公司,最近他把公司的业务交给了克林特。
克林特自从10年前获得MBA学位以后,一直忙于家族业务。
每年的每个工作日,每艘渔船每天早晨天一亮就出发了。
大多数工作日就是捕鱼,到了中午,完成鳕鱼的捕捞工作(3500磅)。
然后,渔船驶向不同的港口,可以售出每天捕捞的鳕鱼。
一些港口鳕鱼的价格是非常不确定的,即使在每一天中,价格的变化也是很大的,不同的港口鳕鱼的价格往往也不同。
同时,一些各港口对鳕鱼的需求量也是有限的。
因此,如果一艘渔船比其他渔船到达那个港口的时间相对晚了点,那么该艘渔船捕捞的鳕鱼将不能够卖完,剩下的鳕鱼只能倒入海中。
为了使科尼利水产公司的问题简单化,假设他只经营了一艘船,并且经营这艘船每天的费用是1万美元。
还假设这艘渔船总是能够完成它所能完成的捕捞量,即3500磅鳕鱼。
假设科尼利水产公司的渔船能够将捕捞的鳕鱼送到马萨诸塞州的格洛斯特鳕鱼港口或者罗基伍德港口。
格洛斯特港口是一个建设良好的鳕鱼市场的主要港口。
在格洛斯特港口,鳕鱼的价格是每磅3.25美元,并且这个价格在相当一段时间内一直很稳定。
罗基伍德港口鳕鱼的价格比格洛斯特港口的价格偏高一些,但是价格有很大的可变化性。
克林特估计罗基伍德港口鳕鱼的价格是一个正态分布,均值μ=3.65美元/磅,标准离差σ=0.20美元/磅。
在格洛斯特港口,有一个非常大的鳕鱼市场。
相比之下,罗基伍德港口要小很多。
有时,渔船在罗基伍德港口不能够销售完其捕捞的全部或部分鳕鱼。
基于相关的历史数据,克林特估计,当他的渔船到达罗基伍德港口时,在该港口他所面临的鳕鱼的需求量服从表所描述的离散概率分布。
(excel)
假设在罗基伍德港口,科尼利水产公司所面临的鳕鱼价格和需求量是相互独立的。
因此,在科尼利水产公司所面临的罗基伍德港口鳕鱼的日价格和需求量之间没有任何相关性。
给定任何一天的开始,克林特.科尼利面临的决策问题是应该选择那一个港口销售他每天的捕捞。
罗基伍德港口的鳕鱼的价格,只有等到渔船进靠港口后,等到同买主进行了讨价还价之后,才能知道。
一旦渔船进入某一个港口之后,他必须在那个港口销售掉他的所有捕捞,因为两个港口的距离太远,再转向另一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据模型 决策 完整