调查资料的统计分析PPT资料.ppt
- 文档编号:15666800
- 上传时间:2022-11-11
- 格式:PPT
- 页数:137
- 大小:1.06MB
调查资料的统计分析PPT资料.ppt
《调查资料的统计分析PPT资料.ppt》由会员分享,可在线阅读,更多相关《调查资料的统计分析PPT资料.ppt(137页珍藏版)》请在冰豆网上搜索。
(见表见表2)2)频率分布表:
是不同类别在总体中的相频率分布表:
是不同类别在总体中的相对数量分布。
能十分方便不同总体和不同类对数量分布。
能十分方便不同总体和不同类别之间的比较。
因此这种分布表的应用更为别之间的比较。
因此这种分布表的应用更为普遍。
普遍。
例1年龄(岁)学生人数1721851910205213合计25年龄(岁)百分比1781820194020202112合计100(n=25)某班学生的年龄分布(频数)某班学生的年龄分布(频率)例2:
频数分布:
数分布:
一组数据中取不同值的个案的次数分布情况(数量)频率分布:
率分布:
一组数据中不同取值的频数相对于总数的比率分布情况。
通常以百分比的形式表达。
(相对数量)职业类别人数工人4干部6教师3商人5农民2合计20表表9-1某班学生父亲的职业分布某班学生父亲的职业分布职业类别百分比工人20干部30教师15商人25农民10合计100表表9-2某班学生父亲职业分布某班学生父亲职业分布例例:
调查某年级调查某年级150150名学生的年龄得到下列结果名学生的年龄得到下列结果:
频数分布作用:
作用:
F有助于明确未回答者的多少,同时也能显示不合格答案的多少;
F可以检验奇异值和极端值;
F根据频数分布可以划出各种统计图形。
二、单变量描述统计二、单变量描述统计单变量统计分析分两大方面单变量统计分析分两大方面,即即,描述统计描述统计和推论统计。
和推论统计。
描述统计的主要目的在于用最简单的概括描述统计的主要目的在于用最简单的概括性地反映出大量数据资料所容纳的基本信息。
性地反映出大量数据资料所容纳的基本信息。
它的基本方法包括:
集中量数分析和离散量集中量数分析和离散量数数分析等。
分析等。
推论统计的主要目的使用从样本调查中所推论统计的主要目的使用从样本调查中所得到的数据资料来推断总体的情况得到的数据资料来推断总体的情况,主要包括:
主要包括:
区间估计和假设检验区间估计和假设检验等。
等。
(一)集中趋势统计指标
(一)集中趋势统计指标均值均值/平均数(平均数(mean)众数(众数(mode)中位数(中位数(median)
(二)离散程度指标
(二)离散程度指标全距全距/极差(极差(range)方差(方差(variance)标准差(标准差(standarddeviation)
(一)集中趋势分析
(一)集中趋势分析集中趋势分析指的是用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况。
最常见的集中量数有:
(11)算术平均数)算术平均数(简称平均数简称平均数,也称为均值也称为均值)(22)众数)众数(33)中位数。
)中位数。
(11)平均数:
)平均数:
平均数是使用得最多的集中量数。
平均平均数是使用得最多的集中量数。
平均数是指总体各单位数值之和除以总体单位数是指总体各单位数值之和除以总体单位数目所得之商。
数目所得之商。
统计分析中习惯以统计分析中习惯以XX来表示。
其计算公式来表示。
其计算公式如下:
如下:
XXnn从原始数据计算平均数从原始数据计算平均数例:
例:
某班某班10名学生的年龄分别为名学生的年龄分别为20、21、19、19、19、20、20、21、22、18、20岁,求岁,求他们的平均年龄。
他们的平均年龄。
从单值分组资料计算平均数从单值分组资料计算平均数首先要将每一个变量值乘以对应的首先要将每一个变量值乘以对应的频数频数ff,得出各组的数值之和,然后将各,得出各组的数值之和,然后将各组的数值之和全部相加,最后除以单位组的数值之和全部相加,最后除以单位总数。
总数。
XfXfXfXffnfn青年人阅读小说书的数目书数f2-42365-746248-10594511-133123614-162153017-1911818总数17159按照公式,可知每名青年人一年来读过9.4本小说书。
练习:
100名工人的收入资料如下,计算他们的名工人的收入资料如下,计算他们的平均工资。
平均工资。
表表100名工人的收入分布名工人的收入分布收入人数30040050060030203020合计100从组距分组资料计算均值从组距分组资料计算均值在调查收入、年龄等方面情况时,常常得到组在调查收入、年龄等方面情况时,常常得到组距分组形式的资料,如我们知道各年龄段的人数,距分组形式的资料,如我们知道各年龄段的人数,若要计算平均年龄就需要计算出各组的组中值,然若要计算平均年龄就需要计算出各组的组中值,然后在按照单值分组资料计算平均数的公式计算。
后在按照单值分组资料计算平均数的公式计算。
组中值的计算公式为组中值的计算公式为:
v上限上限+下限下限v22例例:
调查某企业调查某企业100100名职工的收入得到如下资料名职工的收入得到如下资料,请计算平均收入。
请计算平均收入。
调查练习:
调查100名学生的成绩得到资料如下,名学生的成绩得到资料如下,求平均成绩。
求平均成绩。
表表3100名学生的成绩分布名学生的成绩分布成绩组中值人数4160618081100205030合计100注意注意:
开口组的组中值开口组的组中值前面缺下限的开前面缺下限的开邻组组距邻组组距口组的组中值口组的组中值2后面缺上限的开口后面缺上限的开口邻组组距邻组组距组的组中值组的组中值2平均数的作用F能反映总体分布的集中趋势;
F能反映总体现象的共性特征;
F是总体分布的重要数量特征值;
小故事:
骗人的“平均数”vMM:
吉斯莫先生有一个小工厂,生产超级小玩意儿。
:
vMM:
管理人员由吉斯莫先生、他的弟弟、六个亲戚:
管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。
工作人员由组成。
工作人员由55个领工和个领工和1010个工人组成。
工厂个工人组成。
工厂经营得很顺利,现在需要一个新工人。
经营得很顺利,现在需要一个新工人。
现在吉斯莫先生正在接见萨姆,谈工作问题。
v吉斯莫:
吉斯莫:
我们这里报酬不错。
平均薪金是每周我们这里报酬不错。
平均薪金是每周300300元。
你在学徒期间每周得元。
你在学徒期间每周得7575元,不过很快就可以加元,不过很快就可以加工资。
工资。
萨姆工作了几天之后,要求见厂长。
v萨姆;
萨姆;
你欺骗我!
我已经找其他工人核对过了,没你欺骗我!
我已经找其他工人核对过了,没有一个人的工资超过每周有一个人的工资超过每周100100元。
平均工资怎么可能元。
平均工资怎么可能是一周是一周300300元呢?
元呢?
v吉斯莫吉斯莫:
啊,萨姆,不要激动。
平均工资是:
平均工资是300300元。
元。
我要向你证明这一点。
这是我每周付出的酬金。
我得这是我每周付出的酬金。
我得24002400元,我元,我弟弟得弟弟得10001000元,我的六个亲戚每人得元,我的六个亲戚每人得250250元,五个领元,五个领工每人得工每人得200200元,元,1010个工人每人个工人每人100100元。
总共是每周元。
总共是每周69006900元,付给元,付给2323个人,对吧?
个人,对吧?
v萨姆:
萨姆:
对,对,对!
你是对的,平均工资是每周对,对,对!
你是对的,平均工资是每周300300元。
可你还是蒙骗了我。
v吉斯莫;
吉斯莫;
我不同意!
你实在是不明白。
我已经把工我不同意!
我已经把工资列了个表,并告诉了你,工资的中位数是资列了个表,并告诉了你,工资的中位数是200200元,元,可这不是平均工资,而是中等工资。
可这不是平均工资,而是中等工资。
每周每周100100元又是怎么回事呢?
元又是怎么回事呢?
那称为众数,是大多数人挣的工资。
老弟,你的问题是出在你不懂平均数、中老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。
位数和众数之间的区别。
好,现在我可懂了。
我好,现在我可懂了。
我我辞职!
我辞职!
(22)众数)众数众数是一组数据中出现次数最多众数是一组数据中出现次数最多(即频数最高即频数最高)的那个数值。
的那个数值。
众数与平均数一样也可用来概括反映总体的一众数与平均数一样也可用来概括反映总体的一般水平或典型情况。
般水平或典型情况。
众数的求法:
A、单值分组资料:
频数最大者所对应的标志值。
B、组距分组资料:
组中值法、摘补法。
单值分组资料单值分组资料先在频数栏中找出最大的频数,然后找先在频数栏中找出最大的频数,然后找到最大频数所对应的标志值,这一标志值即到最大频数所对应的标志值,这一标志值即为众数。
为众数。
众数是出现最频繁的数值,是分布中的高峰众数是出现最频繁的数值,是分布中的高峰。
无众数无众数数据:
10.34.98.911.76.37.7一个众数一个众数数据:
6.34.94.98.96.34.94.94.94.9一个以上的众数一个以上的众数数据:
21282828284143434343组距分组资料组距分组资料(组中值法组中值法)首先通过直接观察找出最高的频数,然首先通过直接观察找出最高的频数,然后根据最高的频数找到它所对应的组;
最后后根据最高的频数找到它所对应的组;
最后求出该组的组中值即为众数。
求出该组的组中值即为众数。
分类数据的众数某城市居民关注广告类型的频数分布广告类型人数比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其它广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100数据-分类数据M0商品广告例:
顺序数据的众数甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比()非常不满意不满意一般满意非常满意24108934530836311510合计300100数据:
顺序数据M0不满意众数(众数(ode)特点:
)特点:
不受极端值的影响;
可能没有众数或有几个众数(不唯一性);
主要用于分类数据,也可用于顺序数据或数主要用于分类数据,也可用于顺序数据或数值型数据。
值型数据。
确定众数根据所依据资料的不同会有两种情况确定众数根据所依据资料的不同会有两种情况、根据原始数据或单变量值分组资料确定众数。
、根据原始数据或单变量值分组资料确定众数。
如果被研究总体单位数如果被研究总体单位数30,在对变量值由小,在对变量值由小到大排序后,就很容易找到众数。
到大排序后,就很容易找到众数。
若对原始数据按单变量值进行分组,得到次数若对原始数据按单变量值进行分组,得到次数分布,那么次数最大的变量值即众数。
分布,那么次数最大的变量值即众数。
、根据组距分组资料确定众数。
对总体比较大,离散型变量数值表现较多连续对总体比较大,离散型变量数值表现较多连续型变量,按组距分组形成次数分布。
由组距分组资型变量,按组距分组形成次数分布。
由组距分组资料计算众数。
料计算众数。
(33)中位数)中位数把一组数据按值的大小顺序排列起
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 调查 资料 统计分析