统计学的基本概念doc 8页Word格式文档下载.docx
- 文档编号:17243739
- 上传时间:2022-11-29
- 格式:DOCX
- 页数:9
- 大小:27.12KB
统计学的基本概念doc 8页Word格式文档下载.docx
《统计学的基本概念doc 8页Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《统计学的基本概念doc 8页Word格式文档下载.docx(9页珍藏版)》请在冰豆网上搜索。
统计软件是实现统计计算的工具,现有很多种统计软件,我们这里使用的是SPSS。
1.2.2统计学的研究对象与学科分类
1、统计学的研究对象
统计工作是对客观现象的数量资料进行收集、整理、分析研究的工作过程。
统计学与统计工作之间存在理论与实践的关系。
因此,统计学的研究对象与统计工作的研究对象应该是同一的。
从研究对象看,它研究客观事物总体数量方面(数量特征和数量关系),其对象具有总体性、数量性和具体性的特点。
2、统计学的学科分类
统计学的学科分类一直是一个争论不休的问题(你有没有兴趣提出一个能够被普遍接受的观点?
了解统计学的发展历史可能有助于你的认识),从产生和发展以来有很多学术流派(有点像管理学里边的管理森林)。
统计学是一门方法论学科,统计学不是数学,也不是经济学,更不是其它什么实质性学科,但是统计学和很多学科在研究和应用方面有交叉之处。
这本讲义介绍的是应用统计学(什么是应用统计学?
)的一般基础知识。
从统计分析方法的角度来说,统计可以分为描述统计和推断统计。
描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。
描述统计可以认为是统计分析工作的第一步,为后继更深入的统计分析提供数据的概况,描述统计的结果一般来说比较简单明了,所提供的信息完全可以用于决策参考等应用。
推断统计是根据样本数据对总体进行参数估计、假设检验、预测或其他推断的统计方法。
推断统计是更进一步的统计分析工作,可以探索数据内在的规律,具有决策支持等更大的应用价值。
1.3统计学中几个基本概念
1、总体(或称为统计总体、全及总体、母体):
指统计研究所确定的客观对象,它是由具有共同性质的许多单位组成的整体。
总体具有同质性、大量性、客观性、差异性。
总体可以分为有限总体、无限总体。
2、个体(或称为总体单位、单位):
指组成总体的各个单位(或元素),是各项统计数字的原始承担者。
总体与个体在不同的研究目的下可以相互转换。
3、样本(或称为抽样总体、子样):
总体的一部分,是从总体中获得的一组数据。
在抽样之前,应将总体划分为抽样单位。
抽样单位既可以是一个简单的个体,也可以是一组个体。
对某一个特殊研究,抽样单位的名册称为抽样框。
4、数据和变量
下面是某个班级同学部分信息的记录表格。
表1.1010203班级同学部分信息表
学生姓名
性别
身高(厘米)
体重(公斤)
数学成绩(分)
外语口语水平
张大力
男
174
63
89
优
李丽
女
162
52
93
良
王静
159
51
中
赵虎
182
78
77
及格
张龙
179
75
81
不及格
王朝
169
74
70
…
大家对上面的表格一定不陌生,以前肯定见过很多类似这样的表格,实际上这就是一个简单的统计表(统计表是集中而有序地表现数据的表格,统计表有多种形式)。
表格中性别、身高、体重、数学成绩、外语口语水平等项目反映了学生在不同方面的特征或属性,在统计学里把它们称为变量。
之所以称之为变量,主要是因为在同一属性上,对不同学生的取值结果是不完全相同的,是有变化的,体现了变的思想。
可以说,变量的具体取值就是数据,换句话说,数据就是对客观事物或现象在某种特征或属性上按照某种计量尺度的度量结果。
注意数据不同于数值,而且现实世界里数据极其丰富,数据的形式也丰富多样(可以看看有关数据仓库和数据挖掘方面的文献资料),这里所看到的数据是一种最简单的形式,以后我们说的数据主要就指这种形式。
仔细观察表格,你会发现数据不完全一样。
从不同的角度可以对数据进行分类。
从计量尺度角度来看,数据可以分为:
(1)类别数据(或称为名义数据、定类数据)
例如:
学生的性别分为男、女,职业分为教师、医生、工人、农民等。
注意:
类别数据只能够用于分类。
有时候可以用数字或符号来表示分类数据,如,1表示男、2表示女,但是这里的1、2只有分类作用,可以判断是否相等,但是不能够比较大小或进行加减计算。
(2)顺序数据(或称为有序数据、定序数据)
外语口语水平的可以分为优、良、中、及格、不及格,产品质量可以分为优等品、合格品、次品。
顺序数据不仅能够用于分类,还可以进行排序,有时候也可以用数字或符号来表示顺序数据,如1表示优、2表示良、3表示中、4表示及格、5表示不及格。
这里的1、2、3、4、5不仅有分类作用,可以判断是否相等,还可以“比较大小”,进行排序,但是不能进行加减计算。
(3)区间数据(或称为间隔数据、定距数据)
区间数据最好的例子就是温度。
23oC,22oC,0oC,-12oC等等。
区间数据不仅能够用于分类,进行排序,还可以进行加减运算,比较大小。
(4)比率数据(或称为比例数据、定比数据)
比率数据具有区间数据的所有特点,并在此基础之上有一个“真正的零点”,数据0表示没有。
比率数据还可以进行比例计算。
距离、重量、钱等数据都是比率数据。
从时间角度来看,数据可以分为:
(1)截面数据(或称为静态数据):
在一个固定时间点观察到的一组数据。
2010年8月6日沪市100只股票的收盘价格。
(2)时间序列(或称为动态数据),在接连的时间点观察到的一组有序数据。
到2010年8月6日止,沪市中国联通股票连续30天的收盘价格。
特别需要说明的是,上述对数据的分类以及不同类型数据所具有的运算功能的叙述,只是简单的介绍,更详细的相关知识内容可以参考其他资料,而且,对变量也可以进行分类,在后续的学习过程中会有所说明,请大家注意积累和体会。
1.4统计数据的收集
数据是统计分析的原材料,要进行统计分析,首先要收集数据。
从数据的来源角度来看,统计数据可以分为间接数据(二手数据)和直接数据(一手数据)。
间接数据的获得有很多渠道,如统计部门和政府部门公布的有关资料、各类专业调查机构等提供的数据等等。
直接数据的获得渠道主要是统计调查。
特别需要注意的是,无论采用什么方式进行调查,都要尽量保证数据的真实性、准确性、系统性,而且在统计分析中,应该从分析的目的出发收集间接数据或直接数据。
1.4.1最常见的两种统计调查形式
1.4.1.1普查
普查是指一个国家或一个地区为详细地了解某项重要的国情、国力而专门组织的一次性、大规模的全面调查,其主要用来收集某些不能够或不适宜用定期的全面调查报表收集的信息资料,以搞清重要的国情、国力。
普查的主要特点有以下两个:
1、普查比任何其他调查方式、方法所取得的资料更全面、更系统;
2、普查主要调查在特定时点上的社会经济现象总体的数量,有时,也可以是反映一定时期的现象。
普查的主要作用为:
1、为制定长期计划、宏伟发展目标、重大决策提供全面、详细的信息和资料;
2、为搞好定期调查和开展抽样调查奠定基础。
普查的优缺点:
1、优点:
收集的信息资料比较全面、系统、准确可靠;
2、不足:
涉及面广、工作量大、时间较长,而且需要大量的人力和物力、组织工作较为繁重。
目前,我国所进行的普查主要有:
人口普查、农业普查、工业普查、第三产业普查、基本单位普查等。
1.4.1.2抽样调查
抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象做出估计和推断的一种调查方法。
显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。
抽样调查可以分为:
简单随机抽样、等距抽样、分层抽样、整群抽样。
(1)简单随机抽样(也叫纯随机抽样)。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:
每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
(2)等距抽样(也叫机械抽样或系统抽样)。
是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。
抽出的单位在总体中是均匀分布的,且抽取的样本可少于纯随机抽样。
等距抽样既可以用同调查项目相关的变量排队,也可以用同调查项目无关的变量排队。
等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式。
(3)类型抽样(也叫分层抽样)。
就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。
由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。
该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
(4)整群抽样。
就是从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查样本。
调查单位比较集中,调查工作的组织和进行比较方便。
但调查单位在总体中的分布不均匀,准确性要差些。
因此,在群间差异性不大或者不适宜单个地抽选调查样本的情况下,可采用这种方式。
1.4.2统计调查方法
实际中,为研究一些特定的社会经济问题,还需要进行一些特定的调查,如市场调查机构进行的市场调查等。
这些调查也是取得直接统计数据的重要手段。
特别是随着市场经济的发展,市场调查越来越被人们所重视,一些企业已逐步把市场调查作为取得企业所需生产和经营信息的重要手段。
在实际调查中,收集数据的具体方法主要有以下几种:
1.4.2.1访问调查
访问调查又称派员调查,它是调查者与被调查者通过面对面地交谈从而得到所需资料的调查方法。
访问调查的方式有标准式访问和非标准式访问两种。
标准式访问又称结构式访问,它是按照调查人员事先设计好的、有固定格式的标准化问卷,有顺序地依次提问,并由受访者作出回答;
非标准式访问又称非结构式访问,它事先不制作统一的问卷或表格,没有统一的提问顺序,调查人员只是给一个题目或提纲,由调查人员和受访者自由交谈,以获得所需的资料。
1.4.2.2邮寄调查
邮寄调查是通过邮寄或其他方式将调查问卷送至被调查者,由被调查者填写,然后将问卷寄回或投放到指定收集点的一种调查方法。
邮寄调查是一种标准化调查,其特点是调查人员和被调查者没有直接的语言交流,信息的传递完全依赖于问卷。
邮寄调查的问卷发放方式有邮寄、宣传媒介传送、专门场所分发三种。
邮寄调查的基本程序是:
在设计好问卷的基础上,先在小范围内进行预调查,以检查问卷设计中是否存在问题,以便纠正,然后选择一定的方式将问卷发放下去,进行正式的调查,再将问卷按预定的方式收回,并对问卷进行处理和分析。
1.4.2.3电话调查
电话调查是调查人员利用电话同受访者进行语言交流,从而获得信息的一种调查方式。
电话调查具有时效快、费用低等特点。
随着电话的普及,电话调查的应用也越来越广泛。
电话调查可以按照事先设计好的问卷进行,也可以针对某一专门问题进行电话采访。
用于电话调查的问题要明确、问题数量不宜过多。
1.4.2.4座谈会
座谈会也称为集体访谈法,它是将一组受访者集中在调查现场,让他们对调查的主题(如一种产品、一项服务或其他话题等)发表意见,从而获取调查资料的一种方法。
通过座谈会,研究人员可以从一组受访者那里获得所需的定性资料,这些受访者与研究主题有某种程度上的关系。
为获得此类资料,研究人员通过严格的甄别程序选取少数受访者,围绕研究主题以一种非正式的、比较自由的方式进行讨论。
这种方法适用于搜集与研究课题有密切关系的少数人员的倾向和意见。
参加座谈会的人数不宜太多,通常有6至10人,并且是有关调查问题的专家或有经验的人。
讨论方式主要取决于主持人的习惯和爱好。
通过小组讨论,能获取访问调查无法取得的资料。
而且,在彼此间交流的环境里,各个受访者之间相互影响、相互启发、相互补充,并在座谈过程中不断修正自己的观点,从而有利于取得较为广泛、深入的想法和意见。
座谈会的另一个优点是不会因为问卷过长遭到拒访。
当然,这要求主持人一般要受过心理学或行为科学方面的训练,具有很强的组织能力足以控制一群不同背景的陌生人,并尽可能多地引导受访者说出他们的真实意见或想法。
1.4.2.5个别深度访问
深度访问是一次只有一名受访者参加的特殊的定性研究。
“深访”这一术语也暗示着要不断深入受访者的思想当中,努力发掘他行为的真实动机的意思。
深访是一种无结构的个人访问,调查人员运用大量的追问技巧,尽可能让受访者自由发挥,表达他的想法和感受。
深度访问常用于动机研究,如消费者购买某种产品的动机等,以发掘受访者非表面化的深层意见。
这一方法最宜于研究较隐秘的问题,如个人隐私问题,或较敏感的问题,如政治性的问题。
对于一些不同人之间观点差异极大的问题,采用深度访问法比较合适。
座谈会和个别深访属于定性方法,它通常围绕一个特定的主题取得有关定性资料。
在此类研究中,从挑选的少数受访者中取得有关意见。
这种方法和定量方法是有区别的,定量方法是从总体中按随机方式抽取样本取得资料,其研究结果或结论可以进行推论。
而定性研究着重于问题的性质和未来趋势的把握,不是对研究总体数量特征的推断。
1.4.2.6网上调查
1.网上调查的优点
网上调查在20世纪90年代开始热门起来,发展也很迅速,其优点表现在以下几个方面:
(1)速度快。
由于省略了印制、邮寄和数据录入后过程,问卷的制作、发放及数据的回收速度均得以提高。
可以短时间内完成问卷并统计结果及报表。
(2)费用低。
印刷、邮寄、录入及调研员的费用都被节省下来,而调研费用的增加却很有限。
因此,进行大规模的调研较其他如邮寄或电话调研方法省下可观的费用。
(3)易获得连续性数据。
随着网上固定样本调研的出现,调研员能够通过跟踪受访者的态度、行为和时间进行纵向调研。
复杂的跟踪软件能够做到根据上一次的回答情况进行本次问卷的筛选,而且还能填补落选项目。
(4)调研内容设置灵活。
打一个电话却只提两三个问题在费用上是不值得的。
但在网上,调研内容可以很容易包含在市场、商贸或其他—般站点上。
例如,如果一个人上了银行主页,击活“信用卡”连接,在进入正式网页之前,他可以被询问几个有关被认为是最重要的信用卡特性问题。
(5)调研群体大。
网上可以接触很多人。
目前很难想象还有什么媒体可以提供那么大的调研群体,随着互联网的普及,计算机产品购买者或是互联网使用者,是使用互联网调研的理想对象。
利用互联网的企事业单位使用者也是不错的可发展的调研对象。
目前估计有40%的企事业单位已上网,这个群体还在日益扩大。
(6)可视性强。
网上调查还有一个独一无二的优点,即它们在视觉效果上能够吸引人,互联网的图文及超文本特征可以用来展示产品或介绍服务内容。
2.网上调查的缺点
(1)代表性问题。
网上调查在目前来说还有不少缺点。
最大的一点恐怕就是上网的人不能代表所有人口。
使用者多为男性,教育水平高、有相关技术,较年轻和较高收入的人。
不过,这种情形正有所改变,越来越多的人开始接触互联网。
(2)安全性问题。
现在很多使用者为私人信息的安全性担忧,加上媒体的报道及针对使用者的各种欺骗性文章,更使人忧心忡忡。
然而,考虑到对互联网的私人信息,诸如信用卡账号之类进行担保的商业目的,提高安全性仍是互联网有待解决的重要问题。
(3)无限制样本问题。
这是指网上的任何人都能填写问卷。
它完全是自我决定的,很有可能除了网虫外并不代表任何人。
如果同一个人重复填写问卷的话,问题就变得复杂了。
1.4.3统计调查方案设计
在统计调查工作正式开始之前,应当事先设计一个切实可行、周密细致的数据收集方案,以指导整个调查工作,使调查得以顺利地实施和完成。
数据收集方案又称调查方案,它是指导整个调查过程的纲领性文件,其内容主要包括以下几个方面:
(1)调查目的
在调查方案中首先明确本次调查的目的、任务和意义。
调查目的是调查所要达到的具体目标,它所回答的是“为什么调查”,要解决什么样的问题,具有什么样的社会经济意义等。
这些问题明确之后,我们才能确定向谁调查,调查什么以及采用什么方法进行调查。
(2)确定调查对象和调查单位
确定调查对象和调查单位就是要确定“向谁调查”,由谁来提供所需数据的问题。
所谓调查对象是根据调查的目的确定的调查研究总体。
所谓调查单位是指所要调查的具体单位,即构成调查单位中的每一个单位,它是调查项目和标志承担体和载体,是我们收集数据、分析数据的基本单位。
(3)调查项目和调查表
调查项目是调查的具体内容,它可以是调查单位的数量特征。
如一个人的年龄、收入,
一家企业的产量、产值等;
也可以是调查单位的某种属性或品质特性,如一个人的性别、职业,一家企业所属的行业类别等。
调查表又称问卷又称或询问表,是以问题的形式系统地记载调查内容的一种印件。
问卷可以是表格式、卡片式或簿记式。
设计问卷,是询问调查的关键。
完美的问卷必须具备两个功能,即能将问题传达给被问的人和使被问者乐于回答。
要完成这两个功能,问卷设计时应当遵循一定的原则和程序,运用一定的技巧。
(4)确定调查时间
统计调查时间包括两种涵义,即调查时间和调查期限。
调查时间是指调查资料所属的时间,在统计调查中,如果所调查的是时间现象,就要明确规定调查资料所反映的起始和截至时间。
调查期限是指进行调查工作的时限,包括搜集资料和报送资料工作所需的时间,应尽可能缩短。
(5)制定调查工作的组织设施计划
包括:
调查人员的选择、组织和培训;
调查表格、问卷、调查员平时的印刷、必备工具的准备等;
调查经费来源和开支预算等。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学的基本概念doc 8页 统计学 基本概念 doc
![提示](https://static.bdocx.com/images/bang_tan.gif)