统计学案例集Word文档下载推荐.docx
- 文档编号:21971394
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:9
- 大小:48.12KB
统计学案例集Word文档下载推荐.docx
《统计学案例集Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《统计学案例集Word文档下载推荐.docx(9页珍藏版)》请在冰豆网上搜索。
2.2.2抽样方案的类型与抽样单元的确定
全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。
本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。
在这种情况下,选择区、县作为初级抽样单元最为适宜。
因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。
另外对区、县的分层也可分得更为精细。
本抽样方案采用分层五阶抽样。
各阶抽样单元确定为:
第一阶抽样:
区(地级市以上城市的市辖区)、县(包括县级市等);
第二阶抽样:
街道、乡、镇;
第三阶抽样:
居委会、村委会;
第四阶抽样:
家庭户;
第五阶抽样:
个人。
为提高抽样效率,减少抽样误差,在第一阶抽样中对区、县采用按地域及类别分层。
在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而
第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。
2.2.3自我代表层的设立
根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理。
为方便起见,以下把这样的层称为自我代表层。
考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理。
另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理。
这样自我代表层共有8个,包括以下城市与地区:
北京市、天津市、上海市;
广州市、成都市、长沙市、西安市;
西藏自治区。
三、样本区、县的抽选方法
3.1全国区、县的调查总体
根据2001年的全国行政区划资料,全国(港澳台除外)共有787个市辖区,此外有5个地级市(湖州、东莞、中山、三亚、嘉峪关)不设市辖区,若将它们每个都视同一个市辖区,则共有792个区;
全国共有1674个县(包括自治县及旗、自治旗、特区与林区等)、400个县级市,县级行政单位的总数为2074个,这中间包括福建省的金门县,不能进行调查,因此除金门县以外的所有2865个区、县(792个区及2073个县)构成此次调查的调查总体。
3.2区、县分层
为便于调查后的资料分类汇总及提高精度,应将全国区、县进行分层。
分层可以按多种标识进行,从理论而言,分层标识应选取与调查指标相关程度较高的那些变量。
在本次调查中也就是应选取与观众收视行为、习惯与爱好等密切相关的变量。
关于这方面已有一些相应的研究结果,例如观众的年龄、性别、文化程度、职业、居住地的生活习惯与气候等。
不过注意到我们不可能按观众的个体来分类,只能按观众居住的区、县来分类。
而对于区、县,许多表示人口特征(除人口总数)及经济文化发展指标(除所在省的人文发展指数及县的人均GPT的资料都无法得到,经过多方研究,我们对区县的分层按以下两种标识进行。
(1)地域我国幅员广大,各地经济、社会、文化与气候的地域差异极大,而所有这些因素都与电视观众的收视行为密切相关。
我们首先将所有县按所在省(自治区、直辖市)的地理位置分成3大层13个子层,[各省括号内的数字为它们的人文发展指数(HumanDevelopmentIndex,简称HDI),在全国的排位,参见附表]。
地域分层如表1:
所含省、自治区、直辖市
子层31:
内蒙古(21)、新疆(15)、宁夏(26)
第三大层
(西部地区)
子层32:
陕西(25)、甘肃(28)、青海(29)
子层33:
重庆(22)、四川(24)
子层34:
广西(19)、云南(27)、贵州(30)
子层30:
西藏(自我代表层)
需要说明的是以上划分的层,还考虑了其他一些因素,各省按联合国制定的标准计
算的人文发展指数仅是考虑因素之一。
例如,按人文发展指数,广西(第19位)实际
上可划在第二大层(中部地区),但考虑到国家西部大开发的范围将广西划入西部地区,我们的划分与它一致,这样便于资料的汇总发布。
又如海南,根据人文发展指数(第13
位)放在第一大层稍为勉强,但是根据它的地理位置以及它以旅游为主业,就观众行为而言,与广东、福建划在一子层内是合理的。
(2)区、县类别
同一大层的各市辖区与所隶属的城市的规模、在城市中的地理位置(市区或郊区)和居民成分构成(非农业人口占总人口的比例)有较大差异,各县也因经济文化发达程度有较大差异。
我们将各大层中所有的区、县除已划为自我代表层的以外,(如下称抽
样总体、分成以下5类,每类组成1个小层:
一类区,二类区,县级市,一类县,二类县。
全国抽样总体中所有区县共分成11x5=55个小层。
其中区的划分标准为区中非农业人口占总人口的比例,比例高于标准的为一类区,比例低于标准的为二类区;
县的划分标准为人均国内生产总值,高的为一类县,低的为二类县。
区县划分类别的标准在三
大层中各不相同,具体标准如下:
区类别的划分标准:
东部地区与中部地区:
非农人口在总人口中的比例大于或等于80汹一类区,小于80%为二类区;
西部地区:
非农人口在总人口中的比例大于或等于70%为一类区,小于
70%为二类区。
县类别的划分标准:
东部地区:
人均GDP在5000元以上为一类县;
5000元以下为二类县。
中部地区:
人均GDF在4000元以上为一类县;
4000元以下为二类县。
人均GDP在3000元以上为一类县;
3000元以下为二类县。
3.3自我代表层的区、县情况
根据最新行政区划,自我代表层中的7个城市所辖的区、县构成情况如表1。
表2自我代表城市的辖区、县构成
城市
一类区
二类区
直辖市中的县及其它县级市
县
总计
北京市
8
5
-
18
天津市
7
4
上海市
9
3
19
广州市
2
12
成都市
长沙市
1
西安市
13
西藏自治区包括1个地级市(拉萨市,下辖一个城关区)、一个县级市(日喀则市)及71个县。
3.4抽样总体区县情况
按3.2划分标准,全国除自我代表层以外的抽样总体各小层的区、县数及人口在(抽样总体)总人口中的比例如表3与表4所示。
地域子层
县级市
一类县
二类县
合计
东部地区11
43
62
47
68
239
东部地区12
30
53
31
37
198
东部地区13
24
41
51
59
42
217
中部地区21
56
26
40
36
32
190
中部地区22
39
67
140
148
450
中部地区23
34
95
205
中部地区24
20
44
69
214
西部地区31
27
91
61
221
西部地区32
11
16
15
131
224
西部地区33
14
55
85
201
西部地区34
74
175
325
300
414
398
629
943
2684
表4抽样总体各小层人口占总人口的比例(%)
——、丿、厶
1.3512
2.2766
3.1728
0.7672
3.6295
11.1972
0.6992
1.6487
3.8832
1.4105
2.2809
9.9226
0.5083
1.2187
3.4437
2.3497
1.7150
9.2354
1.0200
0.5023
1.7709
1.1035
1.0037
5.4004
0.9263
1.9128
2.7858
4.5291
6.3593
16.5133
0.5272
1.1800
1.0682
1.1637
4.9385
8.8776
0.6106
1.5928
2.5415
2.2757
3.2519
10.2726
0.4343
0.2219
0.7319
1.2265
1.3692
3.9838
0.2976
0.5513
0.4257
0.7233
3.0567
5.0546
0.1454
2.1132
0.9581
1.8715
3.8961
8.9843
0.3629
0.9478
1.3254
2.6499
5.2722
10.5582
6.8831
14.1662
22.1072
20.0705
36.7730
100.0000
3.5区、县的抽样方法及样本量
抽样总体中各层(指小层,下同)内对区、县的抽样采用按人口的PPS系统
抽样,样本量一般为2;
少数人口较多的小层样本量定为3。
样本量的具体分配见表5。
样本区、县总量为121个。
表5各小层的区县样本量的分配
10
22
23
121
四、抽样总体中样本区、县内的抽样方法
4.1样本区内的抽样
每个一类样本区内采用街道(镇)、居委会、家庭户及个人的4阶抽样;
每个二类样本区内采用街道(乡、镇)、居(村)委会、家庭户及个人的4阶抽样,样本量皆为90。
具体方法如下。
4.1.1对街道(乡、镇)的抽样
样本区内对街道(乡、镇)抽样采用按人口的PPS系统抽样,每个样本区抽3个街
道(乡、镇),其中一类区不抽乡
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 案例