统计学案例集.docx
- 文档编号:8835229
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:9
- 大小:48.12KB
统计学案例集.docx
《统计学案例集.docx》由会员分享,可在线阅读,更多相关《统计学案例集.docx(9页珍藏版)》请在冰豆网上搜索。
统计学案例集
统计学教学案例集
统计学精品课建设小组
2004年11月
一、调查目的、范围和对象
1.1调查目的
准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据。
1.2调查范围
全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。
1.3调查对象
全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。
包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6个月或预计居住6个月以上,都包括在内。
不包括住在军营内的现役军人、集体户及无固定住所的人口。
二、抽样方案设计的原则与特点
2.1设计原则
抽样设计按照科学、效率、便利的原则。
首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性。
其次抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小。
第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。
2.2需要考虑的具体问题、特殊要求及相应的处理方法
2.2.1城乡区分
城市与农村的电视观众的收视习惯与爱好有很大的区别。
理所当然地应分别研究,
以便于对比。
最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做的样本点数量较大,调查的地域较为分散,相应的费用也就较高。
另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。
这样做的优点是样本点相对集中,但数据处理较为复杂。
综合考虑各种因素,本方案采用第二种处理方式。
在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村。
2.2.2抽样方案的类型与抽样单元的确定
全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。
本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。
在这种情况下,选择区、县作为初级抽样单元最为适宜。
因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。
另外对区、县的分层也可分得更为精细。
本抽样方案采用分层五阶抽样。
各阶抽样单元确定为:
第一阶抽样:
区(地级市以上城市的市辖区)、县(包括县级市等);第二阶抽样:
街道、乡、镇;
第三阶抽样:
居委会、村委会;
第四阶抽样:
家庭户;
第五阶抽样:
个人。
为提高抽样效率,减少抽样误差,在第一阶抽样中对区、县采用按地域及类别分层。
在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而
第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。
2.2.3自我代表层的设立
根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理。
为方便起见,以下把这样的层称为自我代表层。
考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理。
另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理。
这样自我代表层共有8个,包括以下城市与地区:
北京市、天津市、上海市;广州市、成都市、长沙市、西安市;西藏自治区。
三、样本区、县的抽选方法
3.1全国区、县的调查总体
根据2001年的全国行政区划资料,全国(港澳台除外)共有787个市辖区,此外有5个地级市(湖州、东莞、中山、三亚、嘉峪关)不设市辖区,若将它们每个都视同一个市辖区,则共有792个区;全国共有1674个县(包括自治县及旗、自治旗、特区与林区等)、400个县级市,县级行政单位的总数为2074个,这中间包括福建省的金门县,不能进行调查,因此除金门县以外的所有2865个区、县(792个区及2073个县)构成此次调查的调查总体。
3.2区、县分层
为便于调查后的资料分类汇总及提高精度,应将全国区、县进行分层。
分层可以按多种标识进行,从理论而言,分层标识应选取与调查指标相关程度较高的那些变量。
在本次调查中也就是应选取与观众收视行为、习惯与爱好等密切相关的变量。
关于这方面已有一些相应的研究结果,例如观众的年龄、性别、文化程度、职业、居住地的生活习惯与气候等。
不过注意到我们不可能按观众的个体来分类,只能按观众居住的区、县来分类。
而对于区、县,许多表示人口特征(除人口总数)及经济文化发展指标(除所在省的人文发展指数及县的人均GPT的资料都无法得到,经过多方研究,我们对区县的分层按以下两种标识进行。
(1)地域我国幅员广大,各地经济、社会、文化与气候的地域差异极大,而所有这些因素都与电视观众的收视行为密切相关。
我们首先将所有县按所在省(自治区、直辖市)的地理位置分成3大层13个子层,[各省括号内的数字为它们的人文发展指数(HumanDevelopmentIndex,简称HDI),在全国的排位,参见附表]。
地域分层如表1:
所含省、自治区、直辖市
子层31:
内蒙古(21)、新疆(15)、宁夏(26)
第三大层
(西部地区)
子层32:
陕西(25)、甘肃(28)、青海(29)
子层33:
重庆(22)、四川(24)
子层34:
广西(19)、云南(27)、贵州(30)
子层30:
西藏(自我代表层)
需要说明的是以上划分的层,还考虑了其他一些因素,各省按联合国制定的标准计
算的人文发展指数仅是考虑因素之一。
例如,按人文发展指数,广西(第19位)实际
上可划在第二大层(中部地区),但考虑到国家西部大开发的范围将广西划入西部地区,我们的划分与它一致,这样便于资料的汇总发布。
又如海南,根据人文发展指数(第13
位)放在第一大层稍为勉强,但是根据它的地理位置以及它以旅游为主业,就观众行为而言,与广东、福建划在一子层内是合理的。
(2)区、县类别
同一大层的各市辖区与所隶属的城市的规模、在城市中的地理位置(市区或郊区)和居民成分构成(非农业人口占总人口的比例)有较大差异,各县也因经济文化发达程度有较大差异。
我们将各大层中所有的区、县除已划为自我代表层的以外,(如下称抽
样总体、分成以下5类,每类组成1个小层:
一类区,二类区,县级市,一类县,二类县。
全国抽样总体中所有区县共分成11x5=55个小层。
其中区的划分标准为区中非农业人口占总人口的比例,比例高于标准的为一类区,比例低于标准的为二类区;县的划分标准为人均国内生产总值,高的为一类县,低的为二类县。
区县划分类别的标准在三
大层中各不相同,具体标准如下:
区类别的划分标准:
东部地区与中部地区:
非农人口在总人口中的比例大于或等于80汹一类区,小于80%为二类区;西部地区:
非农人口在总人口中的比例大于或等于70%为一类区,小于
70%为二类区。
县类别的划分标准:
东部地区:
人均GDP在5000元以上为一类县;5000元以下为二类县。
中部地区:
人均GDF在4000元以上为一类县;4000元以下为二类县。
西部地区:
人均GDP在3000元以上为一类县;3000元以下为二类县。
3.3自我代表层的区、县情况
根据最新行政区划,自我代表层中的7个城市所辖的区、县构成情况如表1。
表2自我代表城市的辖区、县构成
城市
一类区
二类区
直辖市中的县及其它县级市
县
总计
北京市
8
5
5
-
18
天津市
7
7
4
-
18
上海市
9
7
3
-
19
广州市
5
5
2
-
12
成都市
5
2
4
8
19
长沙市
2
3
1
3
9
西安市
4
4
0
5
13
西藏自治区包括1个地级市(拉萨市,下辖一个城关区)、一个县级市(日喀则市)及71个县。
3.4抽样总体区县情况
按3.2划分标准,全国除自我代表层以外的抽样总体各小层的区、县数及人口在(抽样总体)总人口中的比例如表3与表4所示。
地域子层
一类区
二类区
县级市
一类县
二类县
合计
东部地区11
43
62
47
19
68
239
东部地区12
30
47
53
31
37
198
东部地区13
24
41
51
59
42
217
中部地区21
56
26
40
36
32
190
中部地区22
39
67
56
140
148
450
中部地区23
26
34
19
31
95
205
中部地区24
20
44
39
42
69
214
西部地区31
27
8
34
91
61
221
西部地区32
11
16
15
51
131
224
西部地区33
5
42
14
55
85
201
西部地区34
19
27
30
74
175
325
合计
300
414
398
629
943
2684
表4抽样总体各小层人口占总人口的比例(%)
地域子层
一类区
二类区
县级市
一类县
一类县
——、丿、厶
合计
东部地区11
1.3512
2.2766
3.1728
0.7672
3.6295
11.1972
东部地区12
0.6992
1.6487
3.8832
1.4105
2.2809
9.9226
东部地区13
0.5083
1.2187
3.4437
2.3497
1.7150
9.2354
中部地区21
1.0200
0.5023
1.7709
1.1035
1.0037
5.4004
中部地区22
0.9263
1.9128
2.7858
4.5291
6.3593
16.5133
中部地区23
0.5272
1.1800
1.0682
1.1637
4.9385
8.8776
中部地区24
0.6106
1.5928
2.5415
2.2757
3.2519
10.2726
西部地区31
0.4343
0.2219
0.7319
1.2265
1.3692
3.9838
西部地区32
0.2976
0.5513
0.4257
0.7233
3.0567
5.0546
西部地区33
0.1454
2.1132
0.9581
1.8715
3.8961
8.9843
西部地区34
0.3629
0.9478
1.3254
2.6499
5.2722
10.5582
合计
6.8831
14.1662
22.1072
20.0705
36.7730
100.0000
3.5区、县的抽样方法及样本量
抽样总体中各层(指小层,下同)内对区、县的抽样采用按人口的PPS系统
抽样,样本量一般为2;少数人口较多的小层样本量定为3。
样本量的具体分配见表5。
样本区、县总量为121个。
表5各小层的区县样本量的分配
地域子层
一类区
二类区
县级市
一类县
二类县
合计
东部地区11
2
3
3
2
2
12
东部地区12
2
2
3
2
2
11
东部地区13
2
2
3
2
2
11
中部地区21
2
2
2
2
2
10
中部地区22
2
2
3
3
3
13
中部地区23
2
2
2
2
3
11
中部地区24
2
2
2
2
2
10
西部地区31
2
2
2
2
2
10
西部地区32
2
2
2
2
3
11
西部地区33
2
2
2
2
3
11
西部地区34
2
2
2
2
3
11
合计
22
23
26
23
27
121
四、抽样总体中样本区、县内的抽样方法
4.1样本区内的抽样
每个一类样本区内采用街道(镇)、居委会、家庭户及个人的4阶抽样;每个二类样本区内采用街道(乡、镇)、居(村)委会、家庭户及个人的4阶抽样,样本量皆为90。
具体方法如下。
4.1.1对街道(乡、镇)的抽样
样本区内对街道(乡、镇)抽样采用按人口的PPS系统抽样,每个样本区抽3个街
道(乡、镇),其中一类区不抽乡
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 案例
![提示](https://static.bdocx.com/images/bang_tan.gif)