第一章至第四章的教学辅导.docx
- 文档编号:24719999
- 上传时间:2023-05-31
- 格式:DOCX
- 页数:19
- 大小:44.21KB
第一章至第四章的教学辅导.docx
《第一章至第四章的教学辅导.docx》由会员分享,可在线阅读,更多相关《第一章至第四章的教学辅导.docx(19页珍藏版)》请在冰豆网上搜索。
第一章至第四章的教学辅导
第一章 统计学在社会研究中的应用
一、基本概念:
1、统计学
统计学是收集、分析、表述和解释数据的科学。
统计学的目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。
从统计学的定义中可以看出,统计学离不开统计数据,同时,统计学不是简单的分析一堆数据,而是要从中找出内在规律性。
例如,格兰特通过对大批出生婴儿性别的观察发现出生婴儿性别比为14:
13,不只是单纯的发现每一个儿童的性别,儿童通过对数据的分析找出其中的规律。
2、变量分类(按测度水平):
(1)定类变量
当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。
定类变量是最低层次的变量。
在社会调查中,定类变量有很多,如性别、婚姻状态、民族、地区、职业.等。
性别可以分为男、女两类,我们可以用1表示男性,用2表示女性。
民族可以分为汉族和少数民族,我们可以用1表示汉族,用2表示少数民族。
(2)定序变量
当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。
社会调查中,受教育程度是定序变量,可以分为文盲、小学、初中、高中、大专及以上等;人们对某种制度的态度可以分为非常同意、同意、中立、不同意、非常不同意等。
我们也可以用不同的数值1、2、3等表示不同的类别,但是这时候1、2、3等是包含大小的比较意义的,例如,用“1”表示文盲,用“2”表示小学,用“3”表示初中,用“4”表示高中,用“5”表示大专及以上。
此处,数字1、2等不仅仅表示文化程度的分类,还表示文化程度的高低,1还代表最低的文化程度,2表示的文化程度要高于1,5表示最高的文化程度。
(3)定距变量
当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。
定距变量具有测量单位,这些测量单位具有不变的相等区间的标准,使个体之间的比较更具客观性。
智商、温度等都是定距变量。
定距变量的变量值是用数值表示的,同一度量单位之间我们可以准确的计算出个体之间的差值。
例如,地区甲的温度是0°,地区乙的温度是8°,则甲的温度比乙的温度低8°,而在定类和定序变量中则不能这样。
在定距变量中,0的选取只是为了方便或习惯,0只表示一个数值,而不表示该现象不存在。
如地区乙的温度=0°,并不是说地区乙没有温度;一个人的智商=0,并不是说这个人没有智商。
(4)定比变量
除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。
定比变量是最高层次的变量。
在社会调查中,很多情况下我们使用的都是定比变量,例如身高、年龄、收入、一个地区的人口数、某产品的生产量等。
定比变量的变量值也是用数值表示,但是与定距变量相比,两者的唯一区别是,定比变量有绝对零点,即定比变量中的“0”是有实际意义的数值。
例如,一个人的身高是0米,则表示这个人不存在;一个人的收入是0元,则表示这个人没有收入。
同样,由于定比变量中有绝对零点,除可以进行“=”或“≠”、“>”或“<”比较外,它还可以进行“+”、“-”、“×”、“÷”运算。
例如,职工甲每月收入是7500元,职工乙每月收入是2500元,我们可以说职工甲比职工乙每月多收入5000元,也可以说职工甲每月的收入是职工乙的3倍。
3、变量的分类(按是否连续分)
(1)离散变量
如果一个变量的变量值是间断的,可以一一列举的,这种变量称为离散变量。
例如,某人兄弟姐妹数、结婚次数、工厂生产产品的数量等,其变量值的取值是0,1,2,3…。
离散变量的取值是有限个值,而且其取值都是以整数位断开的,是有最小计量单位的。
例如,某人的兄弟姐妹数,只能是1个、2个、3个等,而不能是1.3个、2.5个等。
(2)连续变量
如果一个变量的变量值是连续不断的,即可以取无数多个数值,这种变量称为连续变量。
例如,年龄、温度、灯泡的寿命等,它们的取值是连续不断的。
连续变量可以取无数多个值,其取值是连续不断,不可以一一列举的,而且,它们没有最小计量单位。
例如,年龄可以是1岁整,也可以是1.2岁、1.45岁、2.544岁等。
4、变量分类(按变量间关系)——自变量与因变量
两个变量之间,如果一个变量的变化能引起其他变量变化则称之为自变量,而将由于其他变量的变化而导致自身发生变化的变量称为因变量。
自变量与因变量之间的关系既有时间上的先后关系,即现因后果,同时还有因果关系,即因变量的变化是以自变量的变化为前提。
例如我们常说的“小树长高,我也长高”,但是不能说“我长高”是因变量,“小树长高”是自变量,两者只是有时间上的先后关系,而没有必然联系。
自变量与因变量之间还必须是例如,受教育程度增加,收入增加,这两者就是因果关系,受教育程度是自变量,收入是因变量。
5、总体、个体与样本
总体是构成它的所有个体的集合,个体则是构成总体的最基本的单位。
样本就是从总体中按照一定方式抽取的一部分个体的集合。
例如,要从某省所有育龄妇女中抽取1000人进行调查进行调查,那么,该省所有育龄妇女就是研究总体,其中每一位育龄妇女就是个体,而抽取出的1000名育龄妇女就构成为了该总体的一个样本。
6、抽样单位与抽样框
抽样单位就是一次直接的抽样所使用的基本单位。
抽样单位有时与构成总体的个体是相同的,有时是不同的。
例如对育龄妇女的调查,当直接抽取育龄妇女时,两者是相同的;当我们从总体中一次直接抽取户时,以抽中的户中的育龄妇女作为样本时,抽样单位(户)与个体(育龄妇女)就不相同了。
抽样框是指一次直接抽样时样本中所有抽样单位的名单。
例如,从某校中抽取200名学生进行就业观的调查,那么这所学校的所有学生的名单就是这次抽样的抽样框。
但是,当我们先抽取班级,以抽中班级中的所有学生作为样本时,这所学校所有班级的名单就是这次抽样的抽样框。
二、基本方法:
1、调查类型
(1)普查
普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全面调查。
例如,我们历年进行的人口普查、工业普查、农业普查、第三产业普查、经济普查、统计基本单位普查等。
(2)抽样调查
抽样调查是从总体中选取部分个体组成样本进行调查的一种方式,其目的在于根据样本的调查结果推断总体特征。
根据抽取样本的方法不同,抽样调查可以分为:
概率抽样和非概率抽样。
概率抽样就是按照随机原则进行的抽样,总体中每个个体都有一定的、非零的概率入选样本,并且入选样本的概率都是已知的或可以计算的。
包括:
简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样。
非概率抽样是根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样。
主要包括:
判断抽样、偶遇抽样、滚雪球抽样、定额抽样。
2、调查法
(1)问卷法
问卷法是调查者根据一定的目的和要求,采用事先设计好的问卷,向被调查者了解情况,征询意见的一种方法。
问卷法广泛应用于社会学、人口学、教育学、管理学、心理学等领域中。
(2)访谈法
访谈法是指由调查员直接对被调查员进行访问和交谈,并记录调查结果的方法。
访谈法是以口头语言为中介、调查者与被调查者面对面的交谈和互动的过程。
(3)观察法
观察法是指研究者深入到所要研究对象的生活背景中,在实际参与研究对象的日常生活的过程中直接记录研究对象的有关资料的方法。
(4)典型组讨论
典型组讨论是由8~12个具有某些共同特征或经历的人,在一个经过专门培训主持人的引导下、围绕着某一专门话题进行互动小组讨论的一种定性调查方式。
目前有些
地方使用的电话典型组、网络典型组、视频典型组都是典型组讨论的方式之一。
3、数据分析法
(1)归纳法与演绎法
归纳法与演绎法是社会研究的两种基本推理方式。
归纳法是从特殊到一般,也就是从一组具体的观察结果推导出一般性的规律或法则;演绎法则与归纳法正好相反,是从一般到特殊,也就是研究者从想要检验的一般性理论开始,然后去观察、收集资料,通过这些资料来检验这个理论。
(2)假设检验与理论解释
假设检验是首先观察一种现象或事件,利用归纳法对观察现象的结果归纳得出一般性理论,然后再利用演绎法将前面得出的理论推导出假设,最后再用具体的材料来检验这种理论。
如果理论被证实,我们就可以做出理论解释;如果理论没能被证实,我们得重新回过头来修改原来的理论,并进行新的一轮检验。
理论解释,就是用相关的理论去解释某种现象,以使人们更好的理解某种特定的社会现象。
三、其它重点难点问题——社会研究过程
系统、完整的社会研究通常遵循着比较固定的过程,一般包括五个主要过程:
提出问题、形成假设、收集数据、分析数据、检验假设。
1、提出问题:
是社会研究的第一步,研究者应首先明确要做什么,或者说进行研究的目的是什么。
2、形成假设:
研究问题往往是无法直接检验的,而是要把研究问题形成假设才可以进行检验。
也就是对两个变量间关系进行尝试性回答。
3、收集数据:
是社会研究的关键步骤。
4、分析数据:
对收集的原始数据进行系统的审核、整理、归类、统计和分析。
5、检验假设:
完成对数据的统计分析后,我们要开始进行最后一步——根据对数据的分析来检验我们之前的假设和理论。
第二章 利用SPSS进行数据分析
一、基本概念
1、SPSS软件
SPSS是Statistics Package for Social Science的缩写,即社会科学统计软件包。
SPSS软件起源于20世纪60年代的美国斯坦福大学。
随着几十年来计算机和软件的发展,目前的SPSS for Windows已成为世界最优秀的统计软件之一,是社会科学中定量数据分析中适用最广泛的软件之一。
SPSS for Windows有三个基本的窗口:
数据编辑窗口、语句窗口和结果输出窗口。
SPSS软件可以导入txt、excel等格式的数据,可以绘制条形图、直方图、圆形图、散点图等统计图,可以进行描述分析,如频数表分析、交叉表分析、计算均值、方差、中位数、Z值等统计指标,还可以进行复杂的统计分析,如方差分析、相关分析、回归分析、时间序列分析、聚类分析、因子分析等。
2、变量属性
SPSS中变量有三种基本类型:
数值型、字符型、日期型。
(1)数值型变量
数值型变量是SPSS中最常用的变量类型。
数值型变量包括标准数值型、逗号数值型、圆点数值型、科学计数法型、美元数值型、自定义型。
(2)字符型变量
字符型变量也是SPSS中比较常用的数据类型,默认长度为8。
例如姓名、地点等都可以定义为字符型变量,字符型变量不能参与运算。
(3)日期型变量
日期型变量可以用来表示日期,也可以表示时间,例如调查时间、出生日期等都可以定义为日期型变量。
二、基本方法
1、SPSS中数据的录入
SPSS数据编辑窗口中可以在Date View窗口中可以直接录入原始数据。
数据录入时先单击鼠标左键,选中要录入的单元格,然后开始录入数据。
数据可以逐行录入,在录完一个数据后,按Tab键,便自动跳到该个案的下一个变量。
数据也可以逐列录入,在录完一个数据后,按Enter键,便自动跳到下一个个案的该变量。
在录入过程中,需要插入个案时,将鼠标移动到要插入个案的下一个个案的行头,右击鼠标,然后选择“Insert”,这样就可以在当前个案之前插入一个空白行;或者在选中插入个案的下一个个案的行头后,点击Edit—>Insert cases,同样可以在之前插入一个空白行,同样,删除个案时,将鼠标移动到要删除个案的行头处,右击鼠标,选择“Cut”就可以删除个案;或者选中后,使用键盘上的“Delete”键直接删除。
变量的插入与删除方法类似于个案的插入与删除,此处不再重复。
SPSS中复制或移动数据很简单,类似于Excel中的操作。
首先选中要复制或移动的源数据块,其次右击鼠标,若要复制就点击“Copy”,若要移动则点击“Cut”,最后将鼠标移到目标单元的左上角,右击鼠标,从弹出的菜单中选择“Paste”选项即可,这样就把源数据复制或移动到目标单元中了。
2、数据文件的调入
将Excel中的数据文件调入到SPSS中进行分析是最常用的。
具体步骤是:
File—>Open—>Data…,出现对话框,然后将“Files of type”中文件类型更改为“Excel(*.xls,*.xlsx,*.xlsm)”,然后选出要调入的文件,此时又会出现新的对话框,点击“Continue”即可,Excel数据文件就能调入到SPSS中。
调入时需要注意以下几点:
(1)工作表第一行必须是变量名,而且变量名必须以字母开头;
(2)数据从Excel工作表的第一列、第二行开始录入;
(3)Excel工作表图表、标签、文本文件等任何不属于数据的内容在调入SPSS之前必须删除掉。
3、SPSS中变量计算
当数据文件建立后,变量的计算通过菜单操作完成,具体操作为Transform—>Compute Variable…,这时出现对话框。
需要在Target Variable框中输入要计算的新变量的变量名,这时Target & Label按钮被激活,可以通过它来定义变量属性,新变量的默认类型是数值型。
下一步就是在Numeric Variable框中进行计算求新变量,把左侧需要使用的变量导入该栏,利用下面软键盘中的运算符号进行连接,点击“OK”按钮就可以求出新变量。
4、SPSS中变量赋值
在统计分析中,对变量进行重新赋值或者重新编码的具体操作为Transform—>Recode into same variable…/Recode into different variable…,其中,Recode into same variable是指在原来变量上变换数值,而Recode into different variable则是按赋值要求生成一个新变量。
会出现两种情况的对话框。
两对话框基本相同,不同的是,into same variable对话框中没有“Output Variable”对话框,因为它不用生成新的变量。
into different variable的具体步骤是:
首先从对话框左边的框中选中要赋值的变量,点击箭头后它进入右边的空白框中。
然后在“Output variable”下面的Name和Label中填写要新生成的变量的名称和标签,点击“change”按钮,则中间Numeric Variable—>Output Variable框中的新旧变量名配对。
然后,我们点击“Old and New Value…”按钮,进行变量的重新赋值。
单击后会出现新的对话框,左侧为原来变量值,为新的赋值。
我们在左侧“Old Value”下面填写原来的赋值,然后再“New Value”下面填写新的赋值,点击“Add”,新旧变量值配对就会出现在空白框中。
都完成后点击“Continue”按钮即可,这时会再回到之前对话框,点击“OK”即可。
第三章 数据的组织与展示
一、基本概念
(1)频数
频数就是某个类别或某个小组中的数据个数,也称次数。
例如根据测试成绩,将学生分为优、良、及格、不及格四个组,如果18个同学为优,那么这组的频数就是18。
(2)频率或比例
频率就是一个总体(或者样本中),某一类别或某一小组中数据个数(即频数)占总数据个数的比重,也称为比例。
例如根据测试成绩,将100个学生分为优、良、及格、不及格四个组,如果四个组人数分别为18、52、21、9,那么四个组的频率分别为0.18、0.52、0.21、0.09。
比例通常用于反应总体的构成情况,一个数据中各部分比例之和为1。
(3)百分比
百分比就是一个总体中某一类别或某一小组中数据个数(频数)占总体数据的比重乘以100,各个小组百分比之和为100,即频率乘以100。
它是将对比的基数抽象为100而计算出来的,用%号表示,数值表示每100个分母中包含多少个分子。
上面例子中,优、良、及格、不及格四个组的百分比分别为18%、52%、21%、9%。
(4)比率
比率就是各个不同类别或小组的数值之间的比值。
例如,上面例子中,优与良的比率为18/52≈0.35。
2、累积频数
累积频数就是将各类别或组的频数逐级累加起来,这样可以很清楚的看出某一类别或组以上或以下的频数之和。
3、统计图
(1)条形图:
用宽度相同的条形的高度或者长短来表示数据多少的图形。
条形图既可以横置也可以纵置,纵置时也可以称为柱形图。
(2)饼图:
用圆形以及圆内扇形的角度来表示数值大小的统计图,也称为圆形图。
(3)环形图:
是一个“空心圆”,它用环上的一段来表示总体或样本中各部分数据。
(4)直方图:
就是用矩形的宽度和高度来表示频数分布的图形。
(5)折线图:
以直方图为基础,把直方图顶部的中点用直线一次连接起来,然后把原有的直方图抹掉就是折线图,也称为频数多边形图。
(6)线图:
在平面直角坐标系中用折线表示数量随着时间的变化趋势和特征。
二、基本方法
1、数据整理
(1)数据审核
数据的审核是指从数据的完整性、准确性、适用性及时效性等方面对数据进行检查,保障数据质量,为之后进一步的分析打下基础。
即审核数据是否完整、是否真实正确、是否符合研究需要、是否之后。
(2)数据筛选
数据筛选是指将不符合要求的数据或者有明显错误的数据剔除掉,或者将某些不符合研究需要的数据剔除掉,只留下符合需要的数据。
数据经过筛选后使其结果符合研究需要,为以后研究打下良好基础。
(3)数据排序
数据排序是指按照一定顺序对数据进行排列,为数据分组、分析数据提供方便。
有时候数据排序本身就是分析的目的之一,例如我们对全国各省按照平均预期寿命进行排序,这样各省既可以看出自己的排序,又可以了解与其他省在生活水平、医疗水平等方面的差异。
2、数据分组
数据分组就是根据研究需要,按照某种标准将原始数据分为不同的组,分组后的数据叫做分组数据。
包括单变量分组和组距分组,其中组距分组又包括等距分组和不等距分组两类。
具体分组步骤为:
(1)对数据进行排序(使用计算机分组时不用排序);
(2)确定分组,规律为:
K=1+lgn/lg2(其中n为数据总个数);(3)确定组距。
3、统计图绘制
(1)条形图的绘制
在绘制条形图时,如果将类别放在纵轴,即条形图横置,称为条形图;如果将类别放在横轴,即纵置,称为柱形图。
绘制条形图是既可以绘制成二维平面图,也可以绘制成三维立体图。
(2)饼图的绘制
条形图主要是显示各类别中数据多少,而饼图则主要是显示总体中各类别的比例,即总体的构成问题,这对于研究结构性问题非常有用。
因而,在绘制饼图时,总体中各类别所占百分比就用圆内扇形的角度表示,既可以显示各类别的频数,同时也可以显示各类别占总体的比例,更加直观形象。
(3)环形图的绘制
环形图也更形象的展示出各部分占总体的比例,即总体的构成问题。
环形图既可以用频数表示,也可以用各部分占总体的百分比显示。
(4)直方图的定义
在平面直角坐标系中,我们用横轴表示数据分组,用纵轴表示频数或频率,各个组的频数与频率形成一个小矩形,就是直方图。
(5)折线图的定义
折线图的两个终点要与横轴相交,具体绘制时,将第一个矩形顶部中点与竖边中点用直线连接并延长使其与横轴相交,同样,最后一个矩形顶部中点与竖边中点连接并延长到与横轴相交。
这样折线下围成的面积与原来直方图的相等,保证两者表示的频数分布是一致的。
当分组数据所分的组数越多时,组距就越小,这时绘制的折线图就会越来越光滑,逐渐形成一条平滑的曲线,这就是频数分布曲线。
(6)线图的绘制
绘制线图时一般将时间放在横轴,将指标数据放在纵轴。
一般情况下,纵轴数据应从0开始,如果数据与0差距很大,可以采取折断的符号将纵轴断开。
图形的长宽比例要适合,一般情况下使横轴略大于纵轴,绘成长方形。
三、其他重点难点
1、等距分组与不等距分组
在分组时,如果各组组距相等,则称为等距分组;如果各组组距不相等,则称为不等距分组。
在分析人口时,我们可以将年龄换分为0~4岁、5~9岁、10~14岁等等,每组为5岁,这就是等距分组。
但有时候将人口分为婴幼儿组(0~6岁),少年儿童组(7~17岁),中青年组(18~59岁),老年人组(60岁及以上),该分类中各组组距不相等,这就是不等距分组。
2、直方图与条形图的区别
条形图与直方图都是用矩形表示,外表有些相似,但是两者是不同的。
区别为:
(1)适用范围不同,条形图适用于所有类型数据,而直方图只适用于数值型数据。
(2)条形图中条形的宽度是固定的,是用条形的长度(或高度)表示各类别频数的多少;而直方图则是用矩形的面积表示各类别频数的多少,矩形的宽度和高度均有意义,宽度表示组距,高度表示每一组的频数或频率,而且宽度是不固定的,只有等距分组时宽度是固定的。
(3)条形图中各条形是分开排列的,而直方图中由于分组数据是连续的,因而直方图的矩形通常是紧密排列的。
第四章 中心趋势测量
一、基本概念
1、众数
众数是一组数据中出现频数最多的数值,用Mo表示。
例如,一个城市有多种产业,但如果以旅游业为最多,那么旅游业就是众数,这个城市也被称为旅游城市。
2、中位数
中位数是中心趋势的一种测量,是将一组数据排序后,处于中间位置的变量值,用Me表示。
中位数处于中间位置,前后每部分均包括50%的数据,而且前面部分小于中位数、后面部分大于中位数。
例如,在职工收入水平差异比较大的单位,要了解职工收入的一般水平,用职工收入分布的中位数作为收入水平的代表值要比用算术平均数更恰当,因为它排除了极端数据的影响。
3、四分位数
四分位数是将一组数据排序后,找出将该组数据等分为四等份的三个点,每份包括25%的数据,这三个点上的数据就是四分位数。
第二个四分位数就是中位数,它前面包括50%数据,后面也包括50%数据,因而,平时所说的四分位数主要是指第一个四分位数和第三个四分位数。
通常,我们将第一个四分位数称为下四分位数(QL),将第三个四分位数称为上四分位数(QU)。
4、均值
均值是集中趋势最主要的测量值,它是将全部数据进行加总然后除以数据总个数,也称为算数平均数。
均值包含一组数据中所有数值,它是先将所有数值进行加总,然后进行平均,在均值中所有数值都有所体现。
因而,我们说均值是集中趋势最主要的测量值。
二、基本方法
1、众数的计算
(1)众数的计算比较简单,就是找出频数最大的即可。
例如“甲城居民对交通满意度调查”,调查者在甲城市随机抽取统计500人调查,调查结果发现,选择“非常不满意”的有50人,“不满意”的有98人,选择“一般”的有204人,选择“满意”的有110人,选择“非常满意”的有38人。
从调查结果可以看出,选择“一般”的居民最多,为204人,占总数的40.8%,因而众数为“一般”这一变量值,即Mo=“一般”。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 第四 教学辅导