统计与决策袁卫Word格式.docx
- 文档编号:18985671
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:25
- 大小:59.87KB
统计与决策袁卫Word格式.docx
《统计与决策袁卫Word格式.docx》由会员分享,可在线阅读,更多相关《统计与决策袁卫Word格式.docx(25页珍藏版)》请在冰豆网上搜索。
首先我举一个财务会计方面的例子。
会计师事务所在对某公司进行审计的时候,并不是要对它的每一笔流水都进行核实,因为通常一个规模较大的公司,一年的经济往来会有几万、甚至几十万笔,如果对每一笔业务都做逐项核对,会花费大量的时间、精力、人力、物力。
他们所做的工作是选择一个抽样的方式,从有效的应收帐款账目中抽取一小部分进行核实。
但是,根据对这一小部分账目核实的结果,他们就能对这个公司整体的经济运行状况做出一个结论,即:
这个公司在财务方面是否合法,是否遵守规章制度,是否有财经方面的问题。
因此,从大量的数据中抽出一部分作为样本,并且通过对样本的分析和计算,就能够推断出总体,正是统计的科学性所在。
其次,看一下统计在营销方面的应用。
举一个在零售付款柜台上的例子。
现在,中国无论是大型超市、百货商场,还是小型零售商店,在收款时都用扫描仪对条型码进行扫描。
在扫描的同时,商品的所有信息就进入到计算机。
在很多大公司,特别是在国外,人们通常使用信用卡或银行借记卡支付,在刷卡的同时,一些个人信息也就进入了数据库。
这些消费者的个人信息和购买商品的信息,无论是对生产商、制造商还是对零售商,都非常有用。
例如,作为国际知名的数据供应商,A.C.Nielson和InformationResources,Inc.的主要工作就是花钱从零售商店或超市购买刚才提到的顾客购买商品时扫描的基础信息,进行加工后,再卖给制造商或者零售商。
一份关于啤酒这种商品的数据,大概可以卖到30多万美元。
由此可见,数据经过整理,就可以变成一种产品,一种商品,制造商和零售商购买后,就可以为他们的生产和服务做决策。
例如,大型超市在掌握了这个信息后,就能合理地安排超市的进货,甚至货架的摆放。
众所周知,沃尔玛作为世界知名的大型零售商,对自己客户的信息做了大量分析,由专门的分析人员运用数据挖掘技术,对所有客户信息进行分析,如:
客户中有多少客户购买什么样的商品,在什么时间购买,在购买某一种商品的同时是否还购买其他商品等。
所有这些信息,对像沃尔玛这样的零售商非常有用。
通过对大量数据进行分析,我们会发现经常买啤酒的顾客会买一些熟食作为下酒食品,假定通过分析发现这两种商品具有非常紧密的联系,零售商沃尔玛就会考虑两种设计:
一种设计是将啤酒专柜与熟食专柜放得非常近,好处是当顾客往购物车上装入一箱啤酒后,可以到不远的地方很方便地购买一些熟食;
另一种设计是将这两种商品放得远一点,中间摆放一些商品货架,顾客在买完啤酒再去购买熟食时,会路过这些货架,在四处观看的过程中,也许会发现他原本没有准备购买的东西,这样就增加了顾客购买商品的机会。
所以,现在很多大公司都对这样一些信息非常重视,会考虑什么样的客户会在什么时间购买什么样的商品,购买某种商品的客户群是什么等,并利用这样一些信息来做最好的安排,满足客户的需要。
这样的研究,对提高管理水平非常有效。
最近,我也在网上看到中国的一些商品信息。
目前,中国的数据分析公司已经对彩电、洗衣机、冰箱等家用电器的数据做了整理和分析,包括各个品牌的市场需求情况等,制造商和零售商可付费购买。
上述这些对统计的应用,在营销管理方面有着非常好的前景。
第三,在金融领域,金融部门也通过利用统计信息来指导他们的客户,包括他们自己进行投资。
例如,如果把个股信息和股票市场的均值进行比较,可以分析个股的价格是否被高估。
如果在Barron报告中,道琼斯30种股票的平均市盈率是24.7,而其中一支股票PhilipMorris的市盈率是9,假定这个信息的数据是准确的,投资者就会通过把这2个数据进行比较来做投资决策,因为按照一般的常识,购买市盈率低的股票,投资回报的周期就会比较短。
所以,如果有适当的统计知识,会应用这些统计知识。
所有公布的信息对于消费者、投资者和我们的客户都会有价值,它可以帮助我们选择,帮助我们做更好的投资。
在现在的保险领域里,就更离不开统计。
在保险业里有一种特殊的职业——精算师。
这一职业就是专门利用概率和统计知识分析风险、计算风险、尽量回避或减少在投资和保险业中的风险。
这里是2006年我国保费的一些情况。
首先,我们来看寿险和健康险。
保险可以分成寿险和非寿险两类。
在寿险里,精算师所做的统计分析有什么用呢?
在寿险中,所有健康险、医疗险和意外险,最重要的工作是怎样设计保单、怎样设计保费。
计算保费的根据是什么?
在寿险中,最基本的根据是生命表。
生命表,简单地说就是不同性别的人,在0岁到100岁之间每一个年龄的死亡率。
通过这个死亡率,就可以计算每个年龄不同性别人群的风险,进而计算合理的保费。
假如一个30岁的男性和一个60岁的男性都想购买一年30万保额的保险,大家想一想,两个人支付的保费是不是应该一样?
一定是不一样的。
那么谁应该多付一些保费呢?
是30岁的人还是60岁的人?
显然应该是60岁的人。
为什么呢?
就是因为60岁的死亡率比30岁的死亡率要高一些,换而言之,就是60岁比30岁的风险要大一些。
既然风险大,他就应该多支付保险,因为他想得到同样的保险补偿。
因此,要想科学地制定人寿保险的保单和保费,最基本的就是要有一个好的生命表。
简单地回顾一下我们国家的人寿保险。
众所周知,我国在解放以后的50年代有保险业务,但到了大跃进时期,似乎一切事务都要由国家承担风险,所以,中国人民保险公司在大跃进后就停滞下来。
直到文革结束以后,我国实施了改革开放政策,随着社会主义市场经济的建立,人们逐渐认识到,我们的国家、社会、企业、家庭,包括我们个人,实际上无时无刻不面临着风险。
国家有国家的风险,个人有个人的风险,家庭有家庭的风险,国家不可能把所有的风险全部承担下来。
因此,到了1982年,我国的保险业开始恢复。
恢复人寿保险的第一件事情就是制定保费,但由于保险业已经停滞了20年,我国实际上已没有自己的生命表。
为了计算保费,我们借用了台湾地区和其他国家的生命表。
我国是一个拥有十几亿人口的大国,国土面积达960万平方公里,南北东西城乡差异很大,而台湾作为我国的一个地区,用他的生命表来计算大陆寿险的保费,显然是不尽合理的。
随着保险事业的开展,我们不断积累了很多数据,到90年代初,就开始着手进行生命表的编制。
大概在1993—1994年,我国第一张生命表编制完成,并且在90年代开始使用。
又经过大概10年的时间,我国对这张生命表进行了完善,而且编制了第二张生命表。
在第二张生命表即将编制完成、准备使用时,社会上有一些人制造舆论,说“新的生命表已经编出来了,如果使用新的生命表,保险产品要涨价”,因而在那里煽动,“如果要购买保险,现在买是合适的,因为一旦要实行新的生命表,保费要涨了”。
这里,用我们的知识判断一下,如果其他条件不变,购买同样保额的保险,用10年后的生命表取代10年前的生命表进行计算,我们的保费应该是升还是降?
显然,应该降。
因为,随着社会经济的发展,随着医疗条件的改善,每个年龄组的死亡率都在不断下降,人均的预期寿命在不断上升,在这样的条件下,我们的保费不是应该升,而是应该降。
这也说明,如果有一些概率、统计、保险方面的知识,我们就不会被那些蛊惑人心的言论所左右。
事后,也有一些专家出来澄清这一事实,希望大家不要抢购,而应该根据自己的计划来购买保险。
在财产保险中,我们重点看一下航空意外保险。
大家在坐飞机前通常要做一件事就是购买一份航空意外保险。
过去曾经是20元钱保20万,现在是20元钱保40万。
利用我们的知识可以做一点基本分析:
如果暂时不考虑保险公司的利润和管理费用,保险的保费价格应该和什么有关系?
应该与航空的风险有关,风险越高,你所支付的保费就应该越多。
请大家计算一下,现在用20元钱购买40万的保额,这就意味着航空意外的风险应该是多少?
二万分之一。
中国民航的实际风险是多少?
这个数据大家可能不太在意。
我国在计算民航实际风险时,是以10年间所有的航班作为一个统计周期,即:
10年间我国共有多少万次航班,航空意外事故有几次。
目前,我国民航的平均风险是二百万分之一。
刚才已经计算过,我国航空意外保险保费设计的风险是二万分之一,而实际风险是二百万分之一,如果不考虑保险公司的利润和管理费用,那么保险公司在航空意外险上的利润就是100倍。
正是因为航空意外险有如此大的利润空间,在过去的几年里,我国航空意外险的保险市场非常混乱,出现了一些不规范、不合法的保险公司和中介公司,甚至卖出一些假保单。
因为我国民航的风险非常低,所以,他们一旦把保单卖出去,就可以净赚20元钱。
为此,我国保监会、保监局等部门整顿了航空保险市场。
从技术层面讲,一般国外的保险公司,其利润仅占所有保险产品的10%-20%,据此分析,我国的航空意外险应该降价,如果保额仍为40万元,保费不应该超过1元钱,这个比例比较合理,也能够保证保险公司正常的利润空间。
这就是我们利用概率统计进行分析的结果。
生产管理是概率统计方法应用得最为经典,也最为成功的领域。
在生产过程中被广泛应用的SPC管理(StatisticalProcessControl),简称为统计过程控制,是在上个世纪30年代,由美国的贝尔电话实验室首先创建的。
它是利用统计方法制作控制图,运用统计分析技术对生产过程进行实时监控,它的贡献是对整个工业企业的生产效率和产品质量的提高起了极大作用,是一个非常伟大的应用。
此外,还有大家同样熟悉的6西格玛管理,从上个世纪80年代后期到今天,一直在国际上的一些大公司,包括GC、摩托罗拉等世界级大公司广泛使用,并且取得了成功。
6西格玛管理运用了概率统计中关于正态分布标准差的理论,这是一种非常成功的管理模式,已成为现在国际化大公司进行管理的一种重要工具。
第三个重要应用是实验设计,它的作用是在生产之前,用统计方法进行实验设计,从而保障企业在生产过程中可以尽量少生产、甚至不生产不合格产品。
以上三个例子,都是利用统计进行生产管理的典型案例。
作为经济的宏观管理部门,包括政府管理部门,我们会应用到对经济的预测和分析,也会应用到经济计量模型,这里会涉及到一些统计的指标和概念,如:
通货膨胀率、物价指数和失业率等。
作为一个好的管理者,我们应该熟悉一些在生活和管理中用得最多的一些统计指标,了解其内涵、应用范围等。
如果想更深入地做一些研究,我们还会利用到回归分析和统计模型进行预测。
这种建立在比较准确的数据分析基础上的分析和预测,能使管理者的工作效率更高,工作做得更好。
统计不仅在生产和管理中被广泛应用,而且在生活中也有许多应用,比如:
体育。
首先,我们来看篮球比赛。
由于姚明加入了美国NBA,所以在NBA中我们的影响很大,NBA还专门建立了一个中文网站,网址为。
该网站中有两个关于统计数据的网页,分别是“数据”和“排名”。
2007年NBA的常规赛刚刚结束,目前正在进行季后赛。
在“数据”页面中,我们可以看到季后赛的得分情况,这就是NBA球员的技术统计,它是按照球员平均每场的投篮命中率和得分情况进行排序的。
目前排在第一位的是洛杉矶湖人队的科比布莱恩特,他平均每场得分为32.8分。
排在第二位的球员平均每场得分为32分。
中国非常优秀的球员姚明,在NBA季后赛中排在第8位,平均每场得分为25.1分。
在球员的技术统计数据中,还包括平均每场出场时间,投球数,命中数。
姚明平均每场投篮17.9个,平均命中7.9个,命中率是44%,罚球的命中率是88%。
这些观众和球迷都能看到的数据,对球队管理者更为有用。
NBA每一支球队的教练员和教练组,都会利用这些数据安排技战术,球队的老板和管理人员用更为具体的数据安排球员的奖金,甚至是出场费。
在国外,体育比赛的数据搜集得非常详细。
众所周知,美国哥伦比亚大学经济系非常知名,去年诺贝尔奖金获得者就是哥大经济系的教授,另外,该系的蒙黛尔教授、斯第格里西教授等也都曾获得过诺贝尔经济学奖。
有一位马丁教授,除了在哥大经济系做教授外,还兼任西班牙巴塞罗那足球队体育技术委员会的主席,其工作就是进行统计数据的收集和分析。
该委员会把巴塞罗那队的每一场比赛进行录像,把每一名队员的每一个动作作为数据输入到计算机里,用来做分析、做管理。
严格地说,他所做的工作是记录队员在球场比赛的每一个动作,包括成功、失误、助攻、射门的次数等,这些情况全部与队员的奖金挂钩,这就是一位经济学教授在巴塞罗那足球队所做的管理性的工作。
通过上述案例可以看出,对数据的搜集、整理和分析,不仅在管理和工作中非常有效,而且在生活中、在体育比赛中,甚至在娱乐中都被经常用到。
著名科学家爱因斯坦曾经说过,“数学定律不能百分之百确实地用在现实生活中间;
能够百分之百确实地用数学定律描述的,就不是现实生活。
”意思是说,我们的现实生活是纷纭复杂的,不能简单地用数学公式进行描述,如果需要做补充,统计的方法、概率的方法恰恰是能够从比较纷纭复杂的现实生活中发现规律的一种方法和一种有效工具。
它能够从杂乱无章、无规律可循的数据中间发现事务的内部规律,换而言之,统计方法就是要发现事务内部的、规律性的数量关系和数量变化。
请看下面一组统计数据。
第一,在正常情况下新生婴儿的男女性别比率是106:
100,其含义是,在大量的新生儿中,男孩和女孩的比例是106:
100。
现实生活中,新生婴儿并非是男孩和女孩一样多,而是平均每100个女孩就会有106个男孩,即:
新生婴儿中男孩比女孩要多,平均每206个新生婴儿中,男孩就比女孩多6个。
那么,人类是如何保持男女性别的平衡、保证人类的遗传、社会的和谐发展呢?
是什么原因使人类具有这样一个基本规律呢?
为什么在新生婴儿中是男孩比女孩多一些呢?
因为男性比女性的死亡率高,不仅在新生婴儿时期,在所有的年龄组中,男性的死亡率都比女性要高。
因而,在新生婴儿中男孩比女孩多一点,恰恰可以保证人类社会能够和谐地、可持续地发展。
虽然新生婴儿男孩略多一些,但是由于男性在每一个年龄组的死亡率都比女性要高一点,在中青年结婚生育的时候,男性与女性的人数就基本相等了,从而保证了在生育时期人口性别的平衡。
随着人们进入中年、进入老年,由于男性的死亡率仍然比女性高,就导致了真正长寿的女性要比男性多一些。
由于处在婴幼儿时期的男性比女性多一点,中青年时男女大体持平,年老时期的男性比女性要少,从人口的总规模来看,男女的人口总量又保持了另外的一个平衡,这就是人类社会几十万年、几百万年甚至更长时间遗传变异的结果,就形成了一个规律。
在我国尚未实行计划生育政策时,多数家庭都有4—5个孩子,也许有些家庭都是女孩,而有些家庭都是男孩。
如果到一些居委会去做统计,也许某一个居委会的女孩多、而另一个居委会的男孩多,可一旦我们进行大量数据的搜集整理,新生婴儿的男女性别比一定符合这个规律:
106:
这个规律在古今中外、每一个国家、每一个大洲都基本相同。
这是我们对大量数据进行分析发现的规律。
早在17世纪,英国伦敦的统计学者就发现了这个规律,这也应该作为统计学发展的源头之一。
第二个数据来自于生活中常做的一种游戏:
当随机地投掷一枚硬币时,出现正、反面的规律都应该是50%。
这也是经过大量实验得出的规律。
同样,如果我们随机地投掷一个骰子,其六面中每一面出现的可能性都是六分之一。
这些规律,对于现代人来说毋庸质疑,但在200—300年前,一些数学家和学者为研究这一规律进行了大量的投掷,最多可达2万多次。
在这个过程中,他们发现,投掷的次数越多,硬币正、反两面出现的比率就越接近50%。
第三,美国越战时期通过“抓阄”征兵时出现的两个数据:
73/183和110/183。
越南战争在60年代初期刚爆发时,美国的年轻人非常踊跃地报名参军,但几年后,随着越南战争被拖入一个没有尽头的泥潭,美国社会出现了反战情绪。
虽然战争还没有结束,但美国的年轻人已不再愿意去当兵。
美国政府迫于无奈,由国会通过了一个征兵法案。
因为美国的立国之本就是平等,该法案为了保证每一个年轻人拥有平等的当兵机会,采取了类似“抓阄”的方式,其做法与我国现在的体育彩票、福利彩票相似,即:
把一年中的每一天和闰年的2月29日分别写在纸条上,把这366个纸条分别装在蓝色小球中,再放到一个大的透明的玻璃罐中,像体育彩票和福利彩票摇奖一样进行摇号。
这项法案获得美国国会通过后,1969年在美国现场直播。
当把366个生日小球放入一个透明的大玻璃罐中搅拌均匀后,小球一个接一个地掉下来,并被按照掉下来的顺序排队。
如果某一个生日第一个掉下来,在征兵时,这一天出生的人就要第一批去当兵。
显然,生日摇得越靠前,被征兵的机会就越大,如果某一个生日被排在一年的一半以后,那么这一天出生的人去当兵的机会就比较小,因为美国不会把他所有的年轻人都派去当兵。
实际上,如果某一个生日被排到了183以后,即一年的一半以后,这一天出生的人就基本上不会去当兵。
当时征兵的范围是18至29岁的男性青年,只要身体健康,都要按照摇号的顺序去当兵。
为什么?
因为这是公平的、这是随机的、这是合理的。
电视直播后,统计学家立即对这个数据进行了分析,正如幻灯片上所讲,摇出的结果是,在前183个生日中,有73个是上半年、有110个是下半年,而并非为各50%左右。
因为国会在通过该法案的时候,就是要保证公平,保证每一个生日被抽中的机会是相等的,但实际上,上半年出生的人征兵的机会是73/183,而下半年出生的人去当兵的机会是110/183。
显然,下半年出生的人去当兵的机会要大一些。
统计学家对这个数据进行了假设检验,结果是这两个数据之间有显著的差异。
因此,统计学家立刻对国会提出质疑:
这一次征兵过程中的摇号不随机,对下半年出生的人不公平,他们去当兵的机会远远大于上半年出生的人,似乎对下半年出生的人存在着歧视。
国会为检验这个数据也请了学者,证明统计学家是正确的。
国会于是承认,“这一次的设计还不够科学,366个小球放到一个大玻璃罐中应该完全摇匀,但实际上还不够均匀,导致了在掉下来的前183个小球中,下半年的生日多一些。
明年我们会做得再好一些,今年就这样了。
”从这个例子中可以看出,统计在我们的日常生活和工作中,都可以被广泛地应用。
第四个是上个世纪50年代初期小儿麻痹症疫苗试验的数据。
一般情况下,新药和新疫苗在研究过程中,都要经过三个严格的试验阶段。
例子中的这组数据是在试验的最后一个阶段,服用疫苗和没有服用疫苗的孩子各有20万,服用疫苗的孩子中有56人得了小儿麻痹症,而没有服用疫苗的孩子中有138个孩子患病。
根据对这一数据进行统计计算和分析后,研究人员就可以得出这种疫苗是否有效的结论。
目前,所有新药都要经过这样严格的数据检验,包括中国正在着力开发的非典疫苗、艾滋病疫苗等,都在做这样的检验。
最后是一个关于广告费用、企业知名度和销售额的一组数据。
如果能够搜集到充分的数据,我们就可以描述出某一个公司、某一个企业通过做广告,为提高企业知名度和销售额所带来的变化。
通过发现他们之间的数量关系,就可以制定科学的广告策略。
从上述例子中可以看出,统计的方法,或者说是数据分析的方法,是在各个领域里进行科学研究的一个基本工具,既包括经济、管理、医疗、物理、天文等领域,也包括人文社会科学的一些领域,如法律、历史等。
在现在的法庭审判中,越来越多地依赖于数据分析,数据分析作为法庭审判中的证据,有非常好的应用。
因而,作为一种数据分析的方法,统计不仅渗透在几乎所有的学科领域里,而且在日常生活的每一个角落,都可以找到很好的数据分析、统计分析的应用。
统计的方法可以分成两大类,一类是描述统计,一类是推断统计。
在推断统计中,又可以分为参数估计和假设检验。
实际上,幻灯片中的框图已非常简单地勾画出完整的统计体系。
首先看描述统计。
在幻灯片的右边是一个柱形图,我们可以直观地看到数据变化的过程。
每个柱形下面分别标有Q1、Q2、Q3、Q4,这是英文和数字的缩写,大家很容易就可以猜到这可能是反映一个公司、一个企业甚至一个行业季度销售额或利润的变化,这里的Q代表季度。
假定这反映的是销售额的变化,我们从直观的柱形图中可以看到,这种商品或服务具有在前三个季度逐渐上升、在第四季度下降的规律或趋势。
我们会很快联想到饮料、游泳衣或某地区旅游业等情况,因为这些商品或服务都具有这样的规律。
因此,凡是看到这样的柱形图,如果我们有统计的知识,就可以很容易地联想到这背后反映的是一类什么样的事务,这就是描述统计。
简单地说,描述统计就是怎样有效地搜集数据、整理数据、显示数据,并且发现数据基本的、数量的特征。
在此图下边有两个数据,一个是平均数,用
表示;
一个是方差,用
表示。
这两个数据是统计的核心数据,分别表明数据的平均水平和数据之间的一个平均的差异水平,有了这两个数据——平均值和方差(也叫标准差),我们就可以比较清楚地把握数据的规律。
其次是推断统计。
推断统计的思路和原理就是幻灯片中右边的这张图,其目的是了解一个总体的数量特征,并对总体的数量特征做出科学的估计或推断。
通常情况下,这个总体非常大,有时是没有数量界限的一个无穷的总体,要对它的特点做出估计或了解,就很难对总体里每一个单位都进行调查。
我们能够做的是从总体中抽出一个样本,通常是一个很小的样本,通过对样本的分析或数据描述,就可以推断出总体的特征。
例如,美国在总统大选期间都要做民意测验。
美国总统大选的总体就是美国的全体选民,是18岁以上的美国成年人。
目前,美国的总人口已经超过3亿,选民在2亿左右。
如果通过对每一个选民都进行调查的方式进行总统大选预测,显然是不可能的,因为即使到了美国大选投票的那一天,一般也只会有60%—70%的选民去投票,而几千万甚至更多的选民不会去投票。
因此,美国一些大的新闻机构和调查公司就采取随机抽样的方式,从2亿的选民总体中抽取一个样本进行调查。
如果想研究全部2亿人,并做出一个科学的推断,估计的误差不超过2—3个百分点,即:
误差不超过2%或3%,那么,样本量应该是多少呢?
盖洛普——美国一个非常有名的调查机构,只调查1000—1500人,即:
从2亿的一个人口总体中,只调查其中的1000—1500人,显然,与总体相比,这个样本是很小的。
那么准确性如何呢?
盖洛普从1936年起至今,已有近70年的实践,在每四年一次的总统大选中,其平均误差在2%左右,历史上只有一次做了错误的推断和预测,其他都对了。
其他一些大的新闻机构,如:
美国的CNN、CBS、ABC等,其调查的样本量都是1000—1500。
这个例子告诉我们,只要方法科学,就可以做到抽取一个很小的样本,而得到非常精确的结果,这就是统计方法的科学性所在。
目前,在我们的许多调查中经常出现一个问题:
调查的样本量很大,可方法并不科学,有时调查了几千
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 决策