SPSS北大社会学系讲义分解.docx
- 文档编号:10031059
- 上传时间:2023-02-08
- 格式:DOCX
- 页数:11
- 大小:27.81KB
SPSS北大社会学系讲义分解.docx
《SPSS北大社会学系讲义分解.docx》由会员分享,可在线阅读,更多相关《SPSS北大社会学系讲义分解.docx(11页珍藏版)》请在冰豆网上搜索。
SPSS北大社会学系讲义分解
SPSS北大社会学系讲义分解
北京大学社会学系数据分析课程讲义刘爱玉2004年 SPSS数据分析技术课程提纲 教材:
自编讲义 阮桂海主编,2000,《SPSS实用教程》电子工业出版社课程内容 第一讲 SPSS基本知识及数据录入一.概述 二.SPSS的基本模块三.SPSS的基本窗口四.SPSS文件类型五.问卷及编码六.什么是数据 七.数据录入——问卷资料转变为原始数据文件WORD中录入 在EXCEL中录入数据在SPSS中录入Epidat录入 数据文件的编辑与管理 第二讲 SPSS命令文件的编写一·SPSS的命令文件Datalist Variablelabel的命令格式valuelabel的命令格式 程序中的缺少值 第三讲用Frequencies做数据汇总一.数据汇总使用的数据类型二·频次统计及统计量的计算Statistics——统计量画图 第四讲 描述性统计一.Descriptives应用实例统计量分析二.Explore分析 第五讲 数据变换 一.Recode命令对数据重新编码二.用Compute命令创建新变量三.COUNT命令 四.用If命令做条件变换和逻辑校 第六讲交叉汇总与关联分析一.交叉汇总表的一般形式及其特点二.交互表的检验——两个变量之间是否相关三.两个变量之间相关的强度定类——定类 北京大学社会学系数据分析课程讲义刘爱玉2004年 定序——定序定类——定距定距——定距 四.运用CRPSSTABS做交互表及对变量之间的关系进行测量 第七讲 引进其他变量后的交互分析一.因果分析——explanationmodel二.阐明分析——Interpretationanalysis三.条件分析——conditionalanalysis 第八讲描述子总体均值的差异一.Means过程运行二.OneSampleT-Test 第九讲均值比较分析一.独立样本T检验二.成对样本T-TEST三.注意事项 第十讲方差分析ANOVA一.实例二.解释 第十一讲相关分析一.BivariateCorrelate 二.Partialcorrelation偏相关三.距离分析 第十二讲 简单线性相关一.回归分析对变量的要求二.一元线性回归模型及其含义三.在对话框中做一元线性回归模型 第十三讲SPSS统计图形一.Bar条形图 二.Line线图——年龄与收入三.Area面积图四.Pie饼图五.High-LOW高低图六.Pareto帕雷托图七.Control控制图八.Boxplot箱图 九.ErrorBar误差条图十.Scatter散点图十一.Histogram直方图十二·P-P:
P-P概率图十三·Q-Q:
Q-Q概率图十四·Sequence序列图 十五·TimeSeries时间序列图 第十四讲 非参数检验 北京大学社会学系数据分析课程讲义刘爱玉2004年 SPSS数据分析技术 第一讲 SPSS基本知识及数据录入一.概述 SPSS是美国SPSS公司开发的社会科学统计软件,SPSS最初的几个版本都是在DOS系统下运行,虽然功能比较强,但在用户界面、输入、输出环境等方面并不十分理想。
80年代末,Microsoft推出Windows后,SPSS迅速向Windows移植。
90年代以来,于MSWindows的普及,SPSS公司于1992、1993、1994年相继推出了在Windows操作系统下的,版本,随着Windows95与以上版本的32位操作系统的出现,1997年以来又相继推出了,,及版本。
版本的界面与版本相比没有什么变化,只是增加了一些统计功能和方法。
与其他版本相比,版本的用户界面更为友好,使用更加方便,统计功能更为强大。
它的基本特点有四个:
[1]大多数操作是通过菜单、图表按钮、对话框完成,操作简单方便; [2]命令语句、子命令、选择项大部分通过对话框来进行,无需记忆大量的命令、过程与选择项; [3]可以与其他数据转换接口,其他软件生成的数据,可以转化为SPSS数据[4]与其他Windows兼容,输出结果可以复制到WORD,以便进一步编辑。
二.SPSS的启动及基本模块 BSPSS版一共十个模块组成SPSSBaseAdvancedModelsRegressionModelsTablesTrendsCategoriesConjointExactTests MissingValueAnalysisMaps 三.SPSS的基本窗口打开SPSS 北京大学社会学系数据分析课程讲义刘爱玉2004年 基本窗口-DataEditor File 文件管理菜单,完成对数据文件的建立、读取、存储、打印等操作。
Edit 文件编辑菜单,完成对数据文件的重新编辑、检索、拷贝、剪贴与替 换等操作。
View 浏览编辑,完成文本或数据内容的状态栏、工具栏、字体、网格线以 及数值标签等功能的操作。
Data 数据管理,数据的选择、排序菜单,包括对数据行的增加、合并、 变量值的选择等 Transform数据变换菜单,创建新变量、重新编码、计算同值的次数等。
Analyze统计过程菜单,完成各种统计分析。
Graphs 统计图表,完成统计图表的建立与编辑 北京大学社会学系数据分析课程讲义刘爱玉2004年 Utilities实用程序,有关命令解释、字体选择、文件信息、定义输出标题和窗 口设计等。
Windows窗口控制,可进行窗口的排列、选择和显示操作Help 帮助文件,帮助文件的调用、选择和显示等操作。
SPSS的其他窗口 在SPSS的主窗口中还有两个窗口,一个是数据管理窗口,其标题名称是“Newdata”,且默认为激活状态。
数据管理器是一种典型的电子表格形式,用户可通过定义变量名、格式化数据类型后输入原始数值,并可根据需要对数据进行增删、剪贴、修改、存储等操作。
另一个是结果输出窗口,标题名称是“!
Output1”,启动时为非活动窗口,只有当完成一项处理后,才在该窗口显示处理过程提示和计算结果。
当进行某项具体的统计方法操作时,可点击对话框的“Paste”钮激活命令编辑窗口,其标题名称是“!
Syntax1”,或选Window菜单的!
Syntax1项也可激活命令编辑窗口。
用户可利用该窗口进行SPSS命令的输入、编辑和运行,这对熟悉DOS版本的SPSS用户是十分方便的。
上述三个窗口在实际操作时,经常因为内容很多,一个窗口中无法看到全部内容。
有两种方法可帮助用户看到全部内容:
1、使用窗口的滚动条 每个窗口的右侧有一个垂直滚动条,用鼠标点击滚动条上下两头的箭号钮或用鼠标按住滚动条中的方块上下拖动,可使窗口中的内容前后翻滚;底边有一个水平滚动条,用鼠标点击滚动条左右两头的箭号钮或用鼠标按住滚动条中的方块左右拖动,可使窗口中的内容左右移动。
如此,用户便可看清所有内容。
2、改变窗口的大小 一般情况下,鼠标指针是一个朝左上方的箭头,当把鼠标指针指向窗口边界时,鼠标指针变成双向箭头形。
这时,若按住鼠标左键移动,可改变窗口的大小,同样可看清窗口内容。
SPSS的退出 完成SPSS的统计分析后,退出该系统的方法是:
选File菜单的Exit项,回答系统提出的有关是否需要存储原始数据、计算结果和SPSS命令之后,即退到Windows的程序管理器中。
SPSS的求助系统 SPSS提供了丰富且详尽的在线帮助。
主要有下列几种方式:
1、主窗口的Help菜单:
在软件运行的任何时候,点击Help菜单选相关的子菜单,可得到所需的各种帮助。
2、主窗口的Utilities菜单:
在Utilities菜单中,有Commandindex...子菜单,它提供有关SPSS各项统计分析技术能解决什么问题的信息。
3、各种对话框中的Help钮:
在具体操作过程中,当弹出某一对话框时,一般总有Help钮,点击该钮,用户可得到这一对话框选项内容的详细帮助。
4、结果输出窗口中的Grossary钮:
当用户在浏览计算结果时,可点击结果输出窗的Grossary钮,它显示各种专用统计术语的解释信息以便用户理解。
5、命令编辑窗口中的Syntax钮:
激活命令编辑窗,可见一Syntax钮,点击该钮,可得到与用户正在编辑的命令相关的命令语法提示。
北京大学社会学系数据分析课程讲义刘爱玉2004年 四.SPSS文件类型 1.原始数据文件及其类型*.Dat生成方法 DOS中的EDITWORD中的·TXTEXCEL中的·XLSDBASE中的·DBF 以上形式的数据文件在SPSS中可以直接调用打开一个已有的数据文件的方式如下:
北京大学社会学系数据分析课程讲义刘爱玉2004年 2.数据文件 *·SAV *·SAS 数据文件可以根据原始数据的转换获得3.图形文件 *·CHT4.命令文件 *·SPS 5.结果文件 *·SPO 五.问卷及编码 1.多选择题的处理2.多位题 3.缺失值,以9结尾,如年龄,编码为99,如答案正好是9,以0替补 北京大学社会学系数据分析课程讲义刘爱玉2004年 4.不适用,以8结尾,8,98,998,如答案正好是8,以0替补。
如有四个可选项的多选题而不适用,则为8888。
六.什么是数据 数据是一个矩阵,行是一个case在多维空间下的位置,列是不同空间的维度用来分析用行收集到的资料。
数据分析:
用微观的方法分析宏观的资料,分析平均人、平均的体系;这个分析都是在平均的基础上,这种推断是不能还原到个案的,分析的过程是不断抛弃个人影响的过程。
数据的计算机表示法:
变量------问卷中的每一个问题,在dBASE中称为字段 变量名---变量名以字母为首,后面跟A---Z,0-----9字符,变量名不能带扩展名,如A1·1。
变量值----变量的答案七.数据录入——问卷资料转变为原始数据文件WORD中录入,存成·TXT1.方法:
打开WORD文档,录入数据 固定格式:
这种数据要根据已经确定的栏目位置对号入座地录入数据,在对问卷进行编码时,指定了各个项目的数值与栏位,给数据指定栏目位置时,前后数据一般不留空格,这样可以提高数据录入的速度,缺点是前后的数据不太容易区分。
如:
栏位 1234567890123456789012300001226150000002231400 自格式P22:
按照问卷编码方案将某个个案数据直接录入,中间可以没有任何空格和其他符号,也可以在输入时在不同的变量之间以空挡、逗号、分号等把变量分开,不同个案之间的数据要对齐,数据录入完成以后,存成*·TXT文件2.把·TXT文件转变为*·SAV文件 SPSS——File--------ReadTextData-----------点选*·TXT-------对话框,即TextImportWizard-------Fixedwide------No------下一步--------Thefirstcasebeginsonwhichline----------划线即可-------下一步完成 SPSS——File--------ReadTextData-----------点选*·TXT-------对话框,即TextImportWizard-------Delimite-------下一步--------SPACE-------下一步--------完成 如果特殊数据、负数、小数点多时,则不用这种方法,可以用EXCEL录入。
在EXCEL中录入数据打开EXCEL表 不用补0,可以录入汉字,速度较慢,一般在小样本时用比较好。
第一行录入变量,第二行开始录入数据 文件保存类型:
*·XLS转变为为*·SAV文件:
SPSS--------File--------Open---------Data----------点选文件类型*·XLS-------点选BOOK-------OK------存成SPSS的*·SAV文件即可 北京大学社会学系数据分析课程讲义刘爱玉2004年 用EXCEL录入的优点:
[1]可以进行各种计算,如数学与三角函数[2]可以进行位置计算,还可以直接COPY[3]可以用EXCEL做辅助分析,进行数据变换[4]可以作表,非常方便 在SPSS中录入 直接在SPSSWIN中录入数据 方法:
SPSS——FILE——NEWDATA——点选DataView——录入数据——存成*·SAV,适合于较小的样本 在DataView中录入的数据还没有在各个数据之间区分意义,可以在VariableView中对录入数据的意义进行界定,这个工作也可以在问卷数据录入前做,也可以在数据录入后做。
点击VariableView,对变量进行定义。
定义变量有10种功能选项, [1]Name:
变量栏名,在这个栏目中输入变量名,如V1、V2、agesex或其他名称。
定义变量名注意:
A.变量名以字母为首,后面跟A---Z,0-----9字符,?
!
/‘’等不能作为变量名,变量名也不能带扩展名,如A1·1。
B.有些关键词不能作为变量的名字,如ANDORNOTEQLTLEGTGENENETOBY——crosstabsWITHALLTHRUP---PercentageSPSS中不区别大小写字符 可以用中文做变量名,但最好不用,因为涉及一个兼容性问题。
北京大学社会学系数据分析课程讲义刘爱玉2004年 [2]Type:
变量类型,有8种类型可供选择 Numeric:
数值型变量,系统默认值为数值型,系统默认长度为8,小数位数为2 Comma:
带逗号的数值型变量,即整数部分每3位数加一逗号,其余定义方式同数值 型。
输入:
1,287,300,显示:
1,287,300 Dot:
带圆点的数值型变量,3位加点数值型,无论数值大小,均以整数形式显示,每3 位加一小点,可定义小数位置,但都显示0,且小数点用逗号表示。
如显示为,00. Scientificnotion:
科学记数法输入:
,输出:
Date:
日期型变量,有27种表示方法。
点date即可以看到Dollar:
货币型变量,有12种表示方法 Customcurrency:
自定义型变量,是一种用户利用Edit菜单的Options功能定义的。
String:
字符型变量 一般最常用的是数字型变量与字符型变量。
日期型变量格式:
dd—mmm—yyyy日日-月月月-年年年年 mm/dd/yyyy 月月/日日/年年年年qQyyyy 季度Q年年年年mMmyy 月份年年wWWKyy 周数WK年年hh:
mm:
ss 时时分分秒秒 SPSS中存储的实际上是该时间与1582年10月14日零点相差的秒数,如1582年10月15日存储的就是60×60×24=86400,在我们把变量类型变换为数值型时可以看到这种数字。
如定date的类型为mm/dd/yyyy,输入10/15/1582,当我 北京大学社会学系数据分析课程讲义刘爱玉2004年 们把日期型数据转变为数值型数据时,看到数据变为86400。
货币型变量格式 格式总长度小数位数$#20$##30$###40$###·##72$#,###60$#,###·##90$###,###,###,###160$###,###,###,###·#192#要求:
能够辨别数值型、字符型与日期型变量就可以。
[3]width:
宽度,指的是运算宽度,默认值为8,运算宽度实际上只会改变输出结果的显示宽度,数据的存储结果与运算的精度不受宽度的影响。
[4]Decimals:
小数位数,根据每个变量数据的大小,定义小数的位数[5]Label:
变量标签,给相应的变量以文字说明[6]values:
数值标签, value1value男add最后点OK [7]missingvalues缺失值,有三种选项 北京大学社会学系数据分析课程讲义刘爱玉2004年 Nomissingvalues没有缺失值 Discretemissingvalues定义1—3个单一数为缺失值 Rangeplusoptionaldiscretevalues定义指定范围为缺失值,同时指定另外一个不在这一范围内的单一数为缺失值 缺失值的意义是指某一项值数值缺失,软件在进行统计时不将其考虑进去。
用户自己把特定的数据界定为缺失值,则为用户缺失值user-missing.如可以把把被调查者拒绝回答或者问题不合适而没有回答的情况界定为用户缺失值9 系统缺失值systemmissing主要是指计算机默认的缺失方式,如果在录入数据时空缺了某些数据,计算机就把其界定为缺失值,这是的数据标记为‘·’,而用户界定的缺失值则不会在数据显示时出现‘·’。
[8]columns:
定义数据管理器纵列的长度[9]字符排列方向:
有三种选择left左对齐right右对齐center居中 [10]measure:
数据量度选择,有三种:
scale连续型变量,是测量的最高层次。
ordinal定序型变量Nominal定类型变量 将变量定义完毕,点击数据编辑窗口,定义的变量会自动地出现在窗口中。
如何定义,进行操作演示 数据录入和变量定义完毕,可以将其存成*·sav文件,然后就可以用这些数据进行统计分析 北京大学社会学系数据分析课程讲义刘爱玉2004年 Epidat录入 php/http:
/下载软件Epidat 建立数据描述文件——建立数据文件——数据录入——数据输出*·qes *·rec dbase;excel;txt;data屏幕设计 逻辑校验*·chk1.打开Epidat [1]Definedata——点选newqesfile——建立一个空的untitled1文件,qes是qustionaire的缩写 北京大学社会学系数据分析课程讲义刘爱玉2004年 [2]把空文件untitled1文件存成一个你想要的文件名 方法:
file菜单——saveas——出来一个对话框——把untitled1改成 [3]在空白的EpiEditor中录入——相当于变量名、变量标签、变量值的界定录入原则:
A.必须有一个变量的名字,如V1,Sex,occupation等B.对变量进行描述,如V1“个案号”“出生年月”等C.对变量录入的定义说明:
Shift+#——#号键 北京大学社会学系数据分析课程讲义刘爱玉2004年 北京大学社会学系数据分析课程讲义刘爱玉2004年 变量有几个码,就打几个#键V1sex#1:
M2:
F V2Income#### [4]录入完成以后存盘。
File------saveas----------或Ctrl+S[5]看一下录入变量的格式 找previewthedataform(左边工具栏第三个),或按一下Ctral+T键。
在屏幕上你可以看到变量的格式,这相当于预览,在里面的空白处录入东西没 有用。
北京大学社会学系数据分析课程讲义刘爱玉2004年 2.Makedatafile Makedatafile——Makedatafile——默认Enternameof·qes Enternameofdatafile(当然也可以改成自己喜欢的路径,但·qes与·rec不能改)点OK——生成first·rec文件first·qes是数据描述文件,first·rec为建立了数据文件rec为record的缩写3.AddChecks 经常出现Checks无法进入,碰到这种情况,点File——Closeall,把所有打开的文档关闭即可) 对录入数据的方式进行某种专门的规定,如果没有可修改的,则直接录入数据 修改检查A.Valuelabel——赋值B.Range/legal——规定变量值的范围C.Jumps——跳答1>write如果是回答1的,跳到职业:
录入1>S2D.Mustenter——一定要录入某个值E.RepeatNo——一般选择NO,把以前录入的某个值在出现类似情况时进行 复制。
修改完成以后或逻辑校验完成以后的数据存成fiest·chk4.EnterData 北京大学社会学系数据分析课程讲义刘爱玉2004年 对话框——找first·rec——录入完毕——点File-----closeform 5.Document6.Exportdata存成SPSS等 7.打开SPSS-----all------点黑-------RUN 点数据窗口--------可以看到已经转换好的数据FILE-------SAVEAS存成SPSS的SAV文件。
数据文件的编辑与管理 数据录入完成以后,对数据进行编辑与管理非常重要,这可以为分析打下基础。
编辑与管理主要的操作有:
1.增加新的变量 激活待增加新变量区的那个变量,Data-------InsertVariable,系统会自动为 北京大学社会学系数据分析课程讲义刘爱玉2004年 用户插入一个新的变量var00001,用户可以根据需要对其进行定义并录入数据。
2.增加新的个案 如果要在第29个个案之前增加一个新的个案,可先激活第29个个案的任一单元格,然后点击Data菜单中的Insertcase,系统会自动为用户增加一个新的观察行,默认为第29个个案,原来的第29个个案观察值变为第30个观察值,然后可以录入数据。
北京大学社会学系数据分析课程讲义刘爱玉2004年 2.删除一个变量列 点选要删除的列,点Edit菜单中的CUT或按Delete键3.删除一个个案 点选要删除的那个个案,点Edit菜单中的CUT或按Delete键4.查找个案 如果数据量很答,查找某一个观察值就很有必要,如果想查找第10个观察值,则点击Data中的GoToCase,出现对话框casenumber10------OK即可 5.数据的排序 Ascending升排序Descending降排序 可以对某一个变量为基准进行排序5.数据的行列对换 点击Data菜单中Transpose,出现对话框 对话框左侧是需要转换的变量,全部点击进入对话框右侧——OK 转换后的数据行列
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 北大 社会学系 讲义 分解