新闻传播学量化研究方法3ppt课件PPT文件格式下载.pptx
- 文档编号:13199247
- 上传时间:2022-10-08
- 格式:PPTX
- 页数:41
- 大小:986.93KB
新闻传播学量化研究方法3ppt课件PPT文件格式下载.pptx
《新闻传播学量化研究方法3ppt课件PPT文件格式下载.pptx》由会员分享,可在线阅读,更多相关《新闻传播学量化研究方法3ppt课件PPT文件格式下载.pptx(41页珍藏版)》请在冰豆网上搜索。
通过科学的方法,从总体(population)中抽取样本(sample)完美的抽样应该使样本继承总体的主要特征,总体:
18个球大:
中:
小1:
2:
3红:
黄:
蓝1:
1:
1,样本:
6个球大:
1,抽样,5,t课件,抽样的几个基本概念,总体/总体量:
有待抽样的所有对象,e.g.全国的电视观众、所有的微博用户个体:
总体中的单个成员,e.g.电话号码为88888888的家庭、名为“李刚”的博友样本/样本规模:
被抽中的调查对象,e.g.研究腐女的小组抽中了100名深大女生抽烟框:
抽样的时候所使用的“花名册”,里面包括了总体的全部名单e.g.深大教务处提供的学生名单,新浪微博提供的用户名单样本的统计值:
根据样本计算出来的值,e.g.中国互联网信息中心CNNIC调查的6万个样本,平均上网时长为18.3个小时/周总体参数:
根据样本统计值推断出来的总体数值,e.g.CNNIC根据样本推算出中国网民平均每周上网时间为18.3%个小时置信度:
从样本统计值推算总体参数的时候,可能出现误差的概率,6,抽样误差:
从样本统计值推算总体参数的ppt时课件候,可能出现误差的范围,以CNNIC报告解读总体、个体、样本、抽样框等概念:
全国所有固定电话和移动电话所组成的电话号码名单,7,t课件,抽样的几个基本概念之样本统计值、总体参数,样本统计值:
根据样本中各单位的数值计算出来的(样本均值、样本比例、样本方差,等等)1936年文学文摘调查240万美国人罗斯福:
兰登43%:
57%总体参数:
根据总体中所有单位的数据计算出来的指标(总体均值、总体比例、总体方差,等等)它往往是未知的(除非在人口普查和总统大选中才会有确切值)所以,一般我们用样本统计值去推断总体参数这种推断,必然存在误差(即,抽样误差)如果抽样方法不科学,甚至有可能出现非常大的误差1936年美国总统大学,最终结果是罗斯福:
兰登62%:
38%,8,t课件,抽样的几个基本概念之置信度、抽样误差,抽样就是试图“用一滴水折射出太阳的光芒”在以小样本推断大总体的时候,必然存在误差幸运的是,我们可以根统计学上的正态分布钟形曲线,估计出误差范围以及出现此误差的相应概率,即置信度/置信水平/confidencelevel一般我们希望置信水平能够达到95%以上通俗而言,就是,如果对总体进行100次抽样,有95次以上得到的数据都是在这个范围内不同的置信度对应着不同的误差范围置信水平越高,误差范围越大,9,t课件,举例阐释上述概念之央视春晚收视率调查,10,t课件,自中央电视台春节联欢晚会播出后的20时30分起,截至24时零分,通过电话共成功访问了分布在全国各地406个区县的2034个家庭,其中1872个家庭收看了春节联欢晚会;
经数据加权后推算出,2009年除夕夜,在全国收看电视的家庭中,有95.6%的家庭收看了中央电视台春节联欢晚会。
在收看过晚会节目的家庭中,81.1%的受访者认为今年中央电视台春节联欢晚会办得“好”。
这项调查的总体是2009年除夕晚上所有的电视观众全国各地406个区县的2034个家庭是这项调查的样本这项调查使用的抽样框是全国各地家庭的电话号码“81.1%的受访者认为春晚办得好”是这项调查获得的样本统计值。
基于这个数据,我们可以进行推算出全国电视观众对春节晚会的评价,也就是总体参数值。
举例阐释上述概念之零点调查,11,t课件,零点公司在2009对北京、上海、广州、武汉、成都、沈阳、西安7个城市以及浙江绍兴诸暨、福建福州长乐、辽宁锦州北宁、河北石家庄辛集、湖南岳阳临湘、四川成都彭州、陕西咸阳兴平7个小城镇总计3038名16-60岁常住居民进行入户访问,进行了“居民生活质量指数调查”。
调查发现医疗改革问题是2009年度中国城镇居民关注的首要问题,提及率为34.8%1.01%。
近六成居民乐观期待新医改方案的功效,同时,也有近四成人认为新医改方案依然难以解决看病就医难的问题。
这项调查的总体是2009年全国的城镇居民。
7个城市和7个小城镇的3038名常住居民是这项调查的样本。
零点报告中出现的“1.01%”是这项调查的抽样误差。
“医疗改革问题是2009年度中国城镇居民关注的首要问题(提及率为34.8%)”是这项调查获得的样本统计值。
基于此,我们推算出全国城镇居民对医疗改革问题的关注度为34.8%1.01%,也就是总体参数值。
问卷调查中的误差,总误差,抽样误差,系统误差,不回应误差,反应偏差,故意曲解,应答者误差,管理误差,调查是一门“误差”的艺术,数据处理误差样本选择误差访员误差访员欺骗,无意地表示不实访员特征误解疲劳,12,t课件,如何控制误差?
访员故意误差,访员非故意误差,受访者故意误差,误差类型欺骗诱导被调查者访员特征误解疲劳撒谎,不回应,受访者非故意误差,误解猜测注意力减弱干扰疲劳,控制方法监督证实选择和训练访员实习和角色训练休息或调整确保匿名和保密、激励证实检查、“第三者”技巧确保匿名和保密、激励证实检查、“第三者”技巧周密设计的问卷直接性的问题周密设计的问卷给出“不知道”选项调整量表中的正反秩序,提示语,13,t课件,如何计算调查最终的回答率?
50个电话是忙音请问:
最终的回答率应该是多少?
假设你要通过电话调查网民对淘宝商城事件的看法你们共打出1000个不是空号的电话有800人接了电话其中,400人是网民且完成全部问卷(成功访问,I)50名虽然是网民但中途中止(中断数,P)100虽然是网民但拒绝访问(拒绝数,R)50名虽然是网民但总是不能过来接电话(未能接触,NC)200人虽然接听的电话,但不是网民(无效样本)身份150个电话没有人接听(可能是不在家,也可能这个住宅无人居住)不明,14,t课件,(U),如何计算调查最终的回答率?
15,t课件,课堂练习:
请罗列公式,计算出此次访问的最终回答率(responserate)以下几个选项,哪个回答率计算最准确1.回答率800(接受访问)/1000(样本总量)2.回答率400(成功访问)/1000(样本总量)3.回答率400(成功访问)/800(接受访问)-200(非网民)4.回答率400(成功访问)/(1000-150-50-200)5.回答率400(成功访问)+200(非网民)/1000(样本总量),如何计算调查最终的回答率?
尽管上述计算方法常见于调查报告中,却都不够准确根据APPOR的RR3计算公式,RR3=I/(I+P+R+NC+eU)其中I是成功数,P是访问中断数,R是拒绝数,NC是未能接触数eU是身份不明者中合格者之估计数,回答率,400+50+100+50+,400400+50+100+50400+50+100+50+200(150+50),16,t课件,抽样的一般程序,界定总体的范围,选择抽样方法,制定合适的抽样框,实施抽样,对样本进行调查,以CNNIC的网民调查为例,17,t课件,1.界定总体:
全中国6岁以上居民,2.选择抽样方法:
简单随机抽样,3.制定抽样框:
根据中国各地电话号码的规律制定随机生成电话号码的规则,4.实施抽样:
使用CATI(电脑辅助电话调查)系统随机拨打电话,共计6万样本,6.对样本实施调查:
使用CATI系统访问6万个样本,传播学研究可能用到的抽样方法总图谱,随机抽样(概率抽样)probabilitysampling抽样非随机抽样(非概率抽样)non-probabilitysampling,简单随机抽样,分层抽样,整群抽样,系统抽样,便利抽样,判断抽样,配额抽样,推荐抽样,随机抽样并非随意抽样它与非随机抽样的区别:
随机抽样中,总体的成员被选为样本的概率已知比如掷骰子,每一面出现几率是1/6,而非随机抽样中,总体的成员抽中的概率未知比如街头访问,抓到谁就是谁无规律可言,无概率可言,18,t课件,非随机抽样之便利抽样,conveniencesampling顾名思义,怎么方便怎么来常见于街头拦截访问实施地点多为交通要道、住宅区、商业区等人口稠密地带其利与弊都非常鲜明定量研究中基本不推荐使用,19,t课件,非随机抽样之判断抽样,),judgmentsampling在对总体的特征有较充分了解的基础上抽取那些最能代表总体的单位常用于小组座谈或深入访谈的抽样比如研究AV的小组基于对身边同学的了解认为哪一类同学更有可能看AV片(囧!
然后,按照这类同学的特征抽取十几个样本,分别做深入访谈或者集中做焦点小组,20,t课件,非随机抽样之推荐抽样,referralsampling又名“滚雪球”抽样最开始只有很少数的样本对他们实施调查之后请被访者推荐几个符合要求的样本依此类推,最后获得较大的样本量一般用于调查比较隐私的话题或者比较难接近的群体比如,研究在深韩国人的媒介使用的小组最初只认识少数韩国留学生通过他们推荐,慢慢辐射到更多的样本,21,t课件,quotasampling是最有技术含量的非随机抽样如果实施得当所得到的样本被随机抽样样本的质量更高根据总体的关键特征(如性别、年龄、教育程度、家庭收入、居住地等等)来确立各类被访者的配额然后“按图索骥”找到符合要求的人进行访问哪怕就是自己身边的人,只要符合条件就可以作为样本,22,t课件,你绝对想不到的!
美国民意调查机构只需要调查1000个民众就能准确预测总统选举结果而他们所使用的方法就是配额抽样,非随机抽样之配额抽样,23,t课件,配额抽样也有可能犯错,1948年美国总统大选,Gallup等多家调查公司使用配额抽样在选举前一个月公布“杜威将领先杜鲁门515”,并决定没有必要再进行进一步的调查而事实上,投票结果显示:
杜鲁门领先杜威4.4%错在哪里?
配额抽样只决定了各类人群的数量,而在这类中具体调查哪些,则由调查员自行决定。
因此,调查员较多地选择了那些素质更高更愿意合作的人(更可能是亲共和党/杜威人士)调查的结束得过早,杜鲁门后来居上(龟兔赛跑_);
调查忽略了“骑墙派”(主意未定,处于观望状态的人);
支持杜鲁门的人投票踊跃;
支持杜威的人投票率低。
美国民调机构从中吸取教训,从那以pp后t课件,在总统选举调查中基本没有出过错24误,课堂练习:
他们用了哪种非随机抽样方法?
25,t课件,央视索福瑞打通电话后问:
“请问您是哪个年龄段的人?
是20岁以下、21-35岁、36岁-50岁、还是50岁以上?
”如果被访者回答:
“我是50岁以上”,访问员就说:
“我们已经对和这个年龄段的人进行了足够的调查,不需要再进一步向您提问,谢谢您的合作。
”下课时间,在文科楼门口派发问卷某报要做70年代专题,记者把采访问卷从QQ上发给10名70年代的朋友,再由他们每人发给下10名研究翻墙的小组打算寻找大学文化以上的人进行深入访谈,随机抽样之简单随机抽样,26,t课件,抽签法(抓阄法):
虽然很直接,但操作性较差如果要在深大上万师生中抽样,就要做上万个签!
随机数表法:
首先给总体的成员分配一个序号然后在随机数表取任一起点然后按照一定的规则选取符合要求的数字计算机抽取:
SPSS等统计软件可自行产生随机数,完成抽样如何用SPSS产生随机数链接,使用随机数表进行简单随机抽样,课堂练习:
在学号130同学中抽样总体(N)30,要抽取样本(n)6人随机数表,几乎所有涉
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新闻 传播学 量化 研究 方法 ppt 课件