第四章统计描述下_精品文档.ppt
- 文档编号:2570454
- 上传时间:2022-11-01
- 格式:PPT
- 页数:105
- 大小:1.05MB
第四章统计描述下_精品文档.ppt
《第四章统计描述下_精品文档.ppt》由会员分享,可在线阅读,更多相关《第四章统计描述下_精品文档.ppt(105页珍藏版)》请在冰豆网上搜索。
问题:
萨姆说吉斯莫先生对,平均工资真的是300元吗?
吉斯莫先生:
这是我每周付出的酬金。
我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。
一名统计学家遇到一位数学家,统计学家调侃数学家说道:
“你们不是说若且,则吗!
那么想必你若是喜欢一个女孩,那么那个女孩喜欢的男孩你也会喜欢喽!
?
”数学家想了一下反问道:
“那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!
因为它们平均的温度不过是五十度而已!
”,统计学家与数学家,如果你的腳已經踩在爐子上,而頭卻在冰箱裡,統計學家會告訴你,平均而言,你相當舒服。
调侃统计学家,一、总体的集中趋势,平均指标的种类,种类,算数平均数调和平均数几何平均数众数中位数,数值平均数,位置平均数,基本形式:
例:
直接承担者,注意区分算术平均数与强度相对数,算术平均数,算数平均数中总体标志总量和总体单位总数有严格的相对应关系,总体标志总量必须是总体各单位标志值的总和,标志值和单位之间是一一对应的关系eg:
全国人均能源消费量指标强数相对数中分子分母之间不存在一一对应的关系eg:
全国人均能源生产量指标,式中:
为算术平均数;为总体单位总数;为第个单位的标志值。
算术平均数的计算方法,平均每人日销售额为:
算术平均数的计算方法,式中:
为算术平均数;为第组的次数;为组数;为第组的标志值或组中值。
算术平均数的计算方法,平均数水平高低受两个因素的影响:
变量x次数f,【例】某企业某日工人的日产量资料如下:
计算该企业该日全部工人的平均日产量。
算术平均数的计算方法,解:
算术平均数的计算方法,例.某商场食品部工人日销售资料如下,计算平均销售额,工人按日产量分组情况,据资料,以各组次数占总次数为权数,计算平均日产量。
采用公式,算术平均数的计算方法,交替标志平均数,交替标志又称是非标志,它是一个只有两种答案的标志.只有质的差异,不能直接计算平均数.将它的属性差异先数量化,然后在计算算术平均数,以反映其质量的一般水平方法:
1:
具有某属性的单位标志值;0:
不具有某种属性的单位标志值。
N:
全部总体单位数。
N1:
具有某种属性的总体单位数。
N2:
不具有某种属性的总体单位数。
具有某种属性的单位数所占的比重:
P=N1/N不具有某种属性的单位数所占的比重:
Q=N2/N其中:
P+Q=1交替标志平均数,是非标志的均值(成数),例:
某厂去年生产的产品中,合格率是98,计算该厂产品的平均合格率,【例】设X=(2,4,6,8),则其调和平均数可由定义计算如下:
再求算术平均数:
求各标志值的倒数:
,,再求倒数:
是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数,调和平均数harmean(harmonicmean),A.简单调和平均数,适用于总体资料未经分组整理、尚为原始资料的情况,式中:
为调和平均数;为变量值的个数;为第个变量值。
调和平均数的计算方法,例某集贸市场西红柿的价格,早市每千克1元,午市每千克0.50元,晚市每千克0.25元,若早、中、晚各买1元钱,计算平均价格。
用算术平均数计算:
早、中、晚各买1元钱,合计花3元。
早上用1元钱可买111千克,中午用1元钱可买2千克,晚上用1元钱可买4千克,合计共买西红柿7千克。
平均价格数:
用简单调和平均数计算:
B.加权调和平均数,适用于总体资料经过分组整理形成变量数列的情况,式中:
为第组的变量值;为第组的标志总量。
调和平均数的计算方法,例资料如上题,早上买西红柿为3元,中午买2元,晚上买1元,则其平均价格为:
计算该企业该日全部工人的平均日产量。
调和平均数的应用,即该企业该日全部工人的平均日产量为12.1375件。
调和平均数的应用,在统计中,调和平均数常常作为算术平均数的变形来使用,所以它的计算内容和算术平均数一样,是标志总量除以总体单位数,调和平均数的权数是算术平均数中的标志值乘以总体单位数所得到的标志总量,即尽管二者的计算方法不同,但实质是一样的.应用调和平均数应注意问题变量x的值不能为0。
变量不同:
算术平均数是x,调和平均数是1/x。
权数不同:
算术平均数是f,代表次数(单位数),调和平均数是xf或M,代表标志总量。
联系:
调和平均数作为算术平均数的变形使用:
调和平均数与算术平均数的比较,x、f为已知,若只知x和xf,而f未知,则不能使用加权算术平均方式,只能使用其变形即加权调和平均方式。
苹果单价购买量总金额品种(元)(公斤)(元)红富士236青香蕉1.859,式中:
为几何平均数;为变量值的个数;为第个变量值。
几何平均数的计算方法,【例】某流水生产线有前后衔接的五道工序。
某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平均合格率。
分析:
设最初投产100A个单位,则第一道工序的合格品为100A0.95;第二道工序的合格品为(100A0.95)0.92;第五道工序的合格品为(100A0.950.920.900.85)0.80;,因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为100A0.950.920.900.850.80;则该流水线产品总的合格率为:
即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。
思考,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。
几何平均数的计算方法,因各车间彼此独立作业,所以有第一车间的合格品为:
1000.95;第二车间的合格品为:
1000.92;第五车间的合格品为:
1000.80。
则该企业全部合格品应为各车间合格品的总和,即总合格品=1000.95+1000.80,几何平均数的计算方法,分析:
不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。
又因为,应采用加权算术平均数公式计算,即,式中:
为几何平均数;为第组的次数;为组数;为第组的标志值或组中值。
几何平均数的计算方法,【例】某金融机构以复利计息。
近12年来的年利率有4年为3,2年为5,2年为8,3年为10,1年为15。
求平均年利率。
设本金为V,则至各年末的本利和应为:
第1年末的本利和为:
第2年末的本利和为:
第12年末的本利和为:
分析:
则该笔本金12年总的本利率为:
即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。
解:
某地区20年来经济发展速度如下表所示,求20年中经济平均发展速度。
20年中的经济平均发展速度为:
算术平均数、调和平均数、几何平均数关系,若根据未分组资料计算平均数,应采用简单算术平均数;若掌握分组的次数分配资料,则应采用加权算术平均数;若在分组资料中,缺少权数f项,而代之以总量xf的形式出现,考虑采用调和平均数。
若各变量间存在相互联系而非独立情况,如各年发展速度之间、流水作用各车间合格率之间,采用几何平均数。
若为未分组资料,采用简单几何平均数;根据分组资料,采用加权几何平均数。
1.算术平均数、调和平均数、几何平均数适用条件:
2.三者数量关系:
众数和中位数,有时众数是一个合适的代表值,比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。
众数(不惟一性),无众数原始数据:
10591268,一个众数原始数据:
659855,多于一个众数原始数据:
252828364242,1、由单项数列来确定众数将数据资料进行分组,编制次数分布数列;通过观察找出次数出现最多的那个标志值即可。
众数的确定,某年级女生的身高分布情况,求出众数,(单项数列),已知某企业职工工资水平如下:
(单项数列),计算该企业工人工资的众数。
不同品牌饮料的频数分布情况如下表所示,这里的变量为饮料品牌众数为:
可口可乐,(单项数列),方法:
确定众数所在的组通过公式计算众数值公式为:
2、由组距数列来计算众数,U:
众数所在组的上限L:
众数所在组的下限i:
众数所在组的组距:
众数组与前一组次数之差:
众数组与后一组次数之差,(组距数列),某车间50名工人月产量的资料如下:
计算该车间工人月产量的众数。
现检测某厂生产的一批电子产品的耐用时间,得到资料如下表所示:
众数位于第三组L=800U=1000i=1000-800=200244-16183244-15787,(组距数列),代入公式得:
405060708090100,5040302010,AGF,BC,人数,成绩,xy,LU,Mo=L+x=U-y,O,ED,绘图求得众数:
即先画相邻三组次数分布直方图,然后连接相邻两组次数差的对角线,再以对角线的交点向x轴引一条垂线,它与X轴的交点即为众数.,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。
众数的原理及应用,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。
中位数的作用:
中位数的概念将被研究总体的各单位的标志值按大小顺序排列,处于中间位置的那个标志值就是中位数,用符号Me表示。
中位数的特点和作用代表整个总体各单位标志值的平均水平不受极端值的影响(缺乏敏感性),中位数,1.所给资料未分组(先按大小顺序排列)中位数位置:
当n为奇数时,中位数就是居于中间位置的那个标志值。
例19设有9个工人生产某种产品,其日产量件数按大小顺序排列为67778991014。
则中位数位次即处于第5位的那个标志值为中位数。
即Me=8件。
中位数的确定,例19设有10个工人生产某种产品,其日产量件数按大小顺序排列为6777899101418。
则其中位数位次:
中位数处在第5个标志值与第6个标志值之间中点的位置。
则Me=(8+9)/2=8.5,当n为偶数时,中位数是处于中间位置的那两个标志值的算术平均数。
2.所给的资料已分组
(1)根据单项数列确定中位数方法:
先计算单项数列得累积次数,确定中位数位置看其在数列累积次数得哪一组中,则该组对应的标志值即为中位数。
【例C】某企业某日工人的日产量资料如下:
计算该企业该日全部工人日产量的中位数。
中位数的位次:
中位数的确定,(单项数列),方法:
先确定中位数所在位置然后用公式计算中位数公式为:
该公式假定中位数组的频数在该组内均匀分布式中:
L:
中位数所在组下限U:
中位数所在组上限fm:
中位数所在组的次数i:
中位数所在组的组距Sm-1:
中位数所在组前面各组的累计次数Sm+1:
中位数所在组后面各组的累计次数,
(2)根据组距数列确定中位数,中位数的确定,(组距数列),【例D】某车间50名工人月产量的资料如下:
计算该车间工人月产量的中位数。
中位数的确定,(组距数列),共个单位,共个单位,共个单位,共个单位,L,U,中位数组,组距为d,共个单位,假定该组内的单位呈均匀分布,中位数下限公式为,第六节几种平均数关系,1.众数、中位数、平均数的特点和应用,众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用,算术平均数、众数、中位数数值关系,
(一)对称分布情况下,2.算术平均数、众数、中位数数值关系,
(二)偏态分布情况下,在一般的情况下,不论是右偏还是左偏,中位数总是位于众数和算术平均数之间,根据皮尔逊经验公式,三者具有如下的关系等式:
例子:
某厂上月产量的中位数为720,众数为640,则估计该厂的产量的算术平均数为?
右偏还是左偏?
假定某车间有两个小组工人的工资水平:
甲组:
500,600,700,800
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 统计 描述 精品 文档