从一个社会热点问题看统计教学Word文件下载.docx
- 文档编号:22454220
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:7
- 大小:21.38KB
从一个社会热点问题看统计教学Word文件下载.docx
《从一个社会热点问题看统计教学Word文件下载.docx》由会员分享,可在线阅读,更多相关《从一个社会热点问题看统计教学Word文件下载.docx(7页珍藏版)》请在冰豆网上搜索。
实际上,该报告的调查和计算错误的可能性很小,但是仍然出现这样多质疑,说明统计应用可能存在一些问题。
本文无意评价该报告的好坏,只是针对当前统计应用越来越广泛,统计错用、滥用的现象也层出不穷,造成诸多的错误与误解的情况,从统计角度看统计应用中存在哪些问题?
对当前的统计教学和统计实践又有什么启发?
一、统计教学与实践中面临的问题
当前,统计概念、方法的大量使用有助于人们了解当前社会、经济中取得的成就和问题,但是也造成了一些混乱。
政府部门公布的各种统计数据与人们的实际生活感受经常无法对应,显得荒谬乃至可耻。
以这份报告为例,存在的主要统计问题有:
指标或变量定义不明确;
使用方法不合理;
相关关系和因果关系混淆;
样本容量和范围有缺陷。
(一)准确定义变量
统计分析依赖于数据。
数据收集的第一个准则是要清楚测量的是什么,即变量必须有一个明确的定义。
如果我们对问题考虑得不全面,那么就没有理由指望回答问题的人(响应者)能按照我们期望的回答问题。
比如该报告中提到了一个名词:
自有住房率。
该报告显示中国城市自有住房率达89.68%,这极易给人造成“城市里近九成人有自己房子”的错觉,可见指标或变量定义不明确会造成极大的困惑。
自有住房率本指私有住房占全部住房的比例,反映的是住房私有化的程度,而不是拥有私有住房的人在总人口中的比例。
自有住房率高,可能是私有房多,但也可能意味着保障房太少。
对普通中国人来说,自有住房率这个数据的意义不大,人们更关心的是,到底有多少人拥有自己的住房。
我们再用一个例子来说明定义变量的重要性。
假定在一次食品企业的市场调查中包含了这样的问题“在您的家庭中有多少个孩子?
”我们也许不加考虑地认为,“孩子”应定义为一个不满18岁并和他(她)的亲生父母一起生活的人。
但如果一个家庭中包含大于18岁的亲生子女、前妻或前夫的孩子、养子或养女、过继子女或者其他年轻的亲戚,那该怎么办呢?
对于不和亲生父母生活在一起的孩子怎么算呢?
对于父母离了婚而共同抚养的孩子怎么算呢?
这有很多种发生混淆的可能。
因此,在调查之前首先需要明确“孩子”的定义。
因此,在做研究之前,对变量必须要有一个清晰、详尽的定义。
(二)合理选择方法
即使数据准确误用无误的收集到了,但是统计方法的不合理运用也会导致结果无法取信于人。
典型的例子是平均值。
近年来,我们经常从媒体上看到或听到工资和收入“被增长”。
那么,对于工作、收入、资产等指标该不该用平均值?
什么时候可以使用平均值?
基础统计课都会介绍,对于服从正态分布或者近似正态分布的数据,其均值(即算术平均数)、中位数和众数相同或者非常接近。
此时比较简单的方法是用均值。
但是当数据呈现偏态分布时,均值、中位数和众数就不再相同或近似,偏斜程度越大,三个数值间差别越大。
在偏态分布时,一定要根据研究和表示统计的目的来选择代表数值。
事实上,工资和收入不服从偏态分布,这是因为虽然多数人收入中等或偏低,但是高收入的人总是存在的,甚至还存在收入上千万、上亿的特高收入的人。
偏态分布的中位数和均值间存在巨大的差异。
因而,国际上一直都用中位数反映一般收入。
公布收入的中位数不仅更能反映一般收入水平,而且数据的获得更容易,数据的质量也比均值要高。
如果计算收入均值,个别极端大值的漏填或少填对结果的准确性影响极大;
但如果计算收入中位数,个别大值的调整对中位数几乎没有影响。
在该报告中,城市家庭资产的中位数与平均值分别为40.5万元与247万元,二者鲜明的差距正体现了不同的统计方法造成结果的“天壤之别”。
从现实意义上来说,体现了中国贫富差距过大,已经成了当前的主要社会矛盾。
如果说人们原来只是根据社会表象笼统地认识两极分化引起的贫富差距,那么,足以让许多人羡慕的“平均工资”,就把这种差距数字化了。
也许,“平均值”是统计部门最省力的统计手段,也只有通过平均,才可以得出“增长”的可喜成绩。
但社会越不公平,“平均值”里的差距就越大,也就越刺痛低端人群的神经。
因此,洋洋得意的“平均工资”,实际上是触目惊心的两极分化。
因此,本文建议今后相关的调查研究只公布收入的中位数,不再对外公布均值,这样不仅更能反映老百姓真实的收入水平,也可避免不必要的质疑。
(三)相关关系和因果关系
选择合理的方法分析了准确的数据,我们往往希望得到一些合理的结论,比如得到因果关系。
但实际上,往往只能得到相关关系。
因此,在中国的统计分析中,我们常常看到因果和相关的偷换。
比如,2011年第一季度,中国gdp同比增长为9.7%,低于2010年第一季度的11.9%。
有学者分析说,这是汽车和住房市场调控产生的影响。
然而,经济增速与宏观调控仅具相关性,而缺乏可靠的因果关系。
尽管在很多科学研究中因果比相关更重要,但是,目前大多数统计方法仅适用于相关性研究。
两个因素之间即使无因果关系,仍可能会表现出虚假的相关性;
相反地,有因果关系也可能表现出虚假的独立性。
很多例子可以说明虚假相关性。
例如,张三和李四的手表时间具有很强的相关性,但是人为地改变张三的手表时间,不会引起李四的手表时间的变化。
又例如,小学生的阅读能力与鞋的尺寸有相关性,但是很明显它们没有因果关系,人为地改变鞋的尺寸,不会提高他们的阅读能力。
有因果关系的话,应该表现有相关性吗?
例如,打太极拳可以强壮身体,延长寿命,也就是说,打太极拳对身体健康有因果作用。
但是,打太极拳的人的寿命可能会与不打太极拳的人的寿命没有什么差异(或者反而打太极拳的人的寿命更短一些)。
这可能是因为打太极拳的人都是体弱多病的人,所以表现出虚假的相关性。
再比如,在铀矿工作的工人与其他人的寿命一样长(或更长),这并不能说明暴露于铀矿不会影响寿命,而可能是因为铀矿工人是经过挑选出来的身体健壮的人,假若当年他们不暴露于铀矿的话,寿命可能会更长一些。
因此,我们在下结论时需要谨慎,不要把相关结果误用为因果关系。
(四)抽样调查
统计分析中另一个常见问题,是抽样不合理而产生偏差。
如果不能保证足够的样本容量和很好的样本代表性,其结果自然不可信。
如果再通过媒体和各种报刊的引用,将极大地误导了社会和公众。
比如,国家统计局2009年公布数据称,在金融危机影响下,中国城镇和农村居民收入增速仍超过了gdp增速。
这个数据根本不靠谱,因为样本存在“选择性失明”。
在此次统计中,数以亿计的农民工、私企员工、个体工商户以及灵活就业者都被剔除了,而他们本应在公共政策和数据统计口径中出现。
该报告也存在取样问题。
该报告负责人称取样来自8000多个家庭,覆盖很广,可以代表全国。
可他一不小心又说漏了嘴,承认“抽样调查的样本里,非常有钱的人很多……这样一来,平均数就拉高了”。
从统计方法上来看,这8000多个家庭的样本不是中国家庭的随机样本,因而不能代表社会大多数。
那么什么是随机样本呢?
我们希望基于样本得出的结论能够适用于该样本所属的总体,显然,这依赖于获得一个“好”的样本,否则这是不可能实现的。
抽样调查中使用样本推断总体的基础和核心是随机性。
所谓随机性原则,就是每个总体单位被抽中的概率完全相等。
最典型的案例就是1936年美国总统大选前的民意调查。
《文摘》(literarydigest)从电话号码簿、汽车注册名单等抽取选民并邮寄了一千万份调查问卷,并回收了240万份调查问卷,结果表明兰登(alfredlandon)将以57%对43%战胜罗斯福(f.d.roosevelt)。
而兰登实际只得到38%的选票,《文摘》预测失败并因此破产。
盖洛普民意调查研究所(gallupinstitute)用很小的样本预测罗斯福可以得到54%的选票,并因此名气大振。
《文摘》的失败在于:
尽管样本容量比盖洛普大得多,但因样本并非随机选择,每个美国选民被抽中的概率不等,使得调查不但一文不值,反而误导了社会和民众。
我们再以烹调为例子来帮助你理解为什么一个好的样本如此重要。
当品尝汤时,如果锅里的汤被充分搅拌了,我们只需品尝一勺即可知道整锅汤的味道,可以窥一斑而知全豹。
这正如我们从总体中选择一个样本,从某种意义上来说,需要选择一个来自“搅拌均匀”的总体的样本。
如果总体能被搅拌均匀,那么一个包含1000个个体的样本,不管它是以整个国家为总体,还是以一个城市为总体,都可以告诉我们同样多的内容。
因此,对于该报告,如果要了解中国家庭的金融状况,首先要将全国所有家庭作为抽样框,这样才可能保证每一个家庭被抽中的概率相同。
显然我们一般是做不到的。
因此退而求其次,也要使得被调查的样本中的各种收入家庭分布的比例与总体比例尽量保持一致。
二、开展统计教学的启发
通过以上讨论,我们感到统计教学责任重大。
在统计教学中我们要认真思考,克服从教材、课堂教学到师资队伍都不同程度存在的问题。
(一)方法应用与方法应用条件并重
所有的统计方法都有应用的条件。
比如,在正态或近似正态分布条件下,均值和中位数(甚至众数)是相同或者近似的。
反过来也可以通过比较均值和中位数的差距判断分布形状。
但如果分布偏态,均值与中位数就有明显差距。
此时就不能再简单用均值反映数据的集中趋势或一般水平代表值。
但我们的应用统计教学缺少强调“应用条件”,缺少联系实际正反两个方面的案例分析,而过分强调统计方法的概念含义,以及数理计算,导致学生片面简单地理解统计方法,出现似乎反映集中趋势和一般水平的统计量只有均值,只会简单平均等现象。
在计算机广泛运用的今天,统计具体的运算与实现过程可以轻而易举的实现,因此统计教学应该相应地向统计方法选择与结论分析等方面倾斜,做到应用过程与应用条件并重。
(二)教师要紧跟统计前沿,加强数据分析
统计教师必须紧跟统计的最新发展。
了解尽可能多的统计实践的前沿有助于对初等内容的充分理解,也有助于认识原先一些“权威”课本的片面、不完全、甚至是错误的信息。
因此,面对当今统计的发展相当迅速的情况,高校教师不能故步自封,必须紧跟统计的最新发展,应该不断学习新的知识,特别是和数据及应用有关的模型和方法。
只有对统计实践的最新进展予以了解才有可能理解目前教学的意义,才可能充实和提高教学水平。
现在高校统计教师绝大多数是近十年或近二十年来大学毕业后留校的学生,多数没有实际工作经验。
如果统计教师在平时不够关注统计工作及统计数据的话,他们就很难在教学中联系统计的实际。
在我们国家城乡、东西部等巨大差异的国情中,联系实际应用统计方法反映和解决问题的能力不足。
因而,我们特别强调统计教学要联系中国的国情和实际,年轻的应用统计教师急需补上这一课。
(三)进行探究型教学
笔者根据教学经验提出了“一个中心、两个基本点”的教学指导思想,即以统计思想为中心。
要坚持培养学生热爱统计,而不是讨厌统计;
要坚持把学生当聪明人来教,而不是当傻瓜。
因为统计学作为一门应用的学科,是以现实世界待解决的问题为目标的,因此,如果统计研究不是服务于社会现实的需要,则其存在的意义也就不明显。
同理,统计教学也应紧密围绕社会现实,尤其对于一些缺乏实际经验的教师,更应该针对社会热点问题进行案例教学。
教师在教学中可以根据有启发性的问题为线索进行探究型教学,其模式为:
观察现象→发现问题→引出概念→探索方法和理论→回到现实。
教师缺乏实际工作经验的问题将永远存在,但是教师可以通过学习、积累案例加强自身对数据分析的感觉。
现实的例子容易引起学生的兴趣,有助于培养学生热爱统计、应用统计。
特别是在教材中要联系中国政府统计的实际,用正反两方面的案例引导学生思考,掌握扎实的基本功。
参考文献:
[1]刘超,吴喜之.统计教学面对的挑战[j].统计研究,2012,
(2):
105—108.
[2]刘超,吴喜之.传统统计面对的挑战[j].统计与信息论坛,2011,(12):
10—13.
[3]刘超.对统计公共课教育问题的思考[j].统计与信息论坛,2012,(4):
112.
ahotissueandstatisticalteaching
liuchaoa,b,yangkaoc
(beihanguniversitya.schoolofmathematicsandsystemsscience;
b.lmiboftheministryofeducation;
c.schoolofhumanitiesandsocialsciences,beijing100191,china)
abstract:
withtheincreasingapplicationofstatisticsindailylifeandsocialsurvey,thephenomenonofmisuseandabuseisnolongerrare,leadingtoalargenumberofmistakesandmisunderstanding.thispaper,accordingtoahotissueinrecentdays,analyzesthepossiblequestionsinstatisticsteachingandpractice,suchasobscurityofvariabledefinition,inappropriatenessofmethods,confusionofrelativenessandcausativerelation,andproposesseveralsuggestionsforbetterteaching,suchasemphasizingconditionsofmethodapplicationandinquiryteaching.
keywords:
hotissue;
abusesofstatistics;
statisticalteaching
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一个 社会 热点问题 统计 教学