SPSS北大社会学系讲义分解Word格式.docx
- 文档编号:22060105
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:34
- 大小:780.76KB
SPSS北大社会学系讲义分解Word格式.docx
《SPSS北大社会学系讲义分解Word格式.docx》由会员分享,可在线阅读,更多相关《SPSS北大社会学系讲义分解Word格式.docx(34页珍藏版)》请在冰豆网上搜索。
一.交叉汇总表的一般形式及其特点
二.交互表的检验——两个变量之间是否相关
三.两个变量之间相关的强度
(一)定类——定类
(二)定序——定序
(三)定类——定距
(四)定距——定距
四.运用CRPSSTABS做交互表及对变量之间的关系进行测量
第七讲引进其他变量后的交互分析
一.因果分析——explanationmodel
二.阐明分析——Interpretationanalysis
三.条件分析——conditionalanalysis
第八讲描述子总体均值的差异(Means过程的应用)
一.Means过程运行
二.OneSampleT-Test
第九讲均值比较分析(T——Test过程)
一.独立样本T检验
二.成对样本T-TEST
三.注意事项
第十讲方差分析ANOVA
一.实例
二.解释
第十一讲相关分析(Correlate过程分析)
一.BivariateCorrelate
二.Partialcorrelation偏相关(也叫净相关)
三.距离分析(Distance)
第十二讲简单线性相关(一元线性回归分析)
一.回归分析对变量的要求(假设条件)
二.一元线性回归模型及其含义
三.在对话框中做一元线性回归模型
第十三讲SPSS统计图形
一.Bar条形图
二.Line线图——年龄与收入
三.Area面积图
四.Pie饼图
五.High-LOW高低图
六.Pareto帕雷托图
七.Control控制图
八.Boxplot箱图
九.ErrorBar误差条图
十.Scatter散点图
十一.Histogram直方图
十二·
P-P:
P-P概率图
十三·
Q-Q:
Q-Q概率图
十四·
Sequence序列图
十五·
TimeSeries时间序列图
第十四讲非参数检验
SPSS数据分析技术
SPSS(statisticalpackageforthesocialscience)是美国SPSS公司开发的社会科学统计软件,SPSS最初的几个版本都是在DOS系统下运行,虽然功能比较强,但在用户界面、输入、输出环境等方面并不十分理想。
80年代末,Microsoft推出Windows后,SPSS迅速向Windows移植。
90年代以来,由于MSWindows的普及,SPSS公司于1992、1993、1994年相继推出了在Windows操作系统下的5.0,6.06.1版本,随着Windows95与WindowsNT3.5以上版本的32位操作系统的出现,1997年以来又相继推出了8.0,9.0,10.0及11.5版本。
11.5版本的界面与10.0版本相比没有什么变化,只是增加了一些统计功能和方法。
与其他版本相比,11.5版本的用户界面更为友好,使用更加方便,统计功能更为强大。
它的基本特点有四个:
[1]大多数操作是通过菜单、图表按钮、对话框完成,操作简单方便;
[2]命令语句、子命令、选择项大部分通过对话框来进行,无需记忆大量的命令、过程与选择项;
[3]可以与其他数据转换接口,其他软件生成的数据,可以转化为SPSS数据
[4]与其他Windows兼容,输出结果可以复制到WORD,以便进一步编辑。
二.SPSS的启动及基本模块
BSPSS11.0版一共由十个模块组成
SPSSBaseAdvancedModels
RegressionModels
Tables
Trends
Categories
Conjoint
ExactTests
MissingValueAnalysis
Maps
三.SPSS的基本窗口
(一)打开SPSS
(二)基本窗口-DataEditor
File文件管理菜单,完成对数据文件的建立、读取、存储、打印等操作。
Edit文件编辑菜单,完成对数据文件的重新编辑、检索、拷贝、剪贴与替换等操作。
View浏览编辑,完成文本或数据内容的状态栏、工具栏、字体、网格线以及数值标签等功能的操作。
Data数据管理,数据的选择、排序菜单,包括对数据行的增加、合并、变量值的选择等
Transform数据变换菜单,创建新变量、重新编码、计算同值的次数等。
Analyze统计过程菜单,完成各种统计分析。
Graphs统计图表,完成统计图表的建立与编辑
Utilities实用程序,有关命令解释、字体选择、文件信息、定义输出标题和窗口设计等。
Windows窗口控制,可进行窗口的排列、选择和显示操作
Help帮助文件,帮助文件的调用、选择和显示等操作。
(三)SPSS的其他窗口
在SPSS的主窗口中还有两个窗口,一个是数据管理窗口,其标题名称是“Newdata”,且默认为激活状态。
数据管理器是一种典型的电子表格形式,用户可通过定义变量名、格式化数据类型后输入原始数值,并可根据需要对数据进行增删、剪贴、修改、存储等操作。
另一个是结果输出窗口,标题名称是“!
Output1”,启动时为非活动窗口,只有当完成一项处理后,才在该窗口显示处理过程提示和计算结果。
当进行某项具体的统计方法操作时,可点击对话框的“Paste”钮激活命令编辑窗口,其标题名称是“!
Syntax1”,或选Window菜单的!
Syntax1项也可激活命令编辑窗口。
用户可利用该窗口进行SPSS命令的输入、编辑和运行,这对熟悉DOS版本的SPSS用户是十分方便的。
上述三个窗口在实际操作时,经常因为内容很多,一个窗口中无法看到全部内容。
有两种方法可帮助用户看到全部内容:
1、使用窗口的滚动条每个窗口的右侧有一个垂直滚动条,用鼠标点击滚动条上下两头的箭号钮或用鼠标按住滚动条中的方块上下拖动,可使窗口中的内容前后翻滚;
底边有一个水平滚动条,用鼠标点击滚动条左右两头的箭号钮或用鼠标按住滚动条中的方块左右拖动,可使窗口中的内容左右移动。
如此,用户便可看清所有内容。
2、改变窗口的大小一般情况下,鼠标指针是一个朝左上方的箭头,当把鼠标指针指向窗口边界时,鼠标指针变成双向箭头形。
这时,若按住鼠标左键移动,可改变窗口的大小,同样可看清窗口内容。
SPSS的退出
完成SPSS的统计分析后,退出该系统的方法是:
选File菜单的Exit项,回答系统提出的有关是否需要存储原始数据、计算结果和SPSS命令之后,即退到Windows的程序管理器中。
SPSS的求助系统
SPSS提供了丰富且详尽的在线帮助。
主要有下列几种方式:
1、主窗口的Help菜单:
在软件运行的任何时候,点击Help菜单选相关的子菜单,可得到所需的各种帮助。
2、主窗口的Utilities菜单:
在Utilities菜单中,有Commandindex...子菜单,它提供有关SPSS各项统计分析技术能解决什么问题的信息。
3、各种对话框中的Help钮:
在具体操作过程中,当弹出某一对话框时,一般总有Help钮,点击该钮,用户可得到这一对话框选项内容的详细帮助。
4、结果输出窗口中的Grossary钮:
当用户在浏览计算结果时,可点击结果输出窗的Grossary钮,它显示各种专用统计术语的解释信息以便用户理解。
5、命令编辑窗口中的Syntax钮:
激活命令编辑窗,可见一Syntax钮,点击该钮,可得到与用户正在编辑的命令相关的命令语法提示。
1.原始数据文件及其类型
*.Dat(原来还有ASCII码)
生成方法
DOS中的EDIT
WORD中的·
TXT
EXCEL中的·
XLS
DBASE中的·
DBF
以上形式的数据文件在SPSS中可以直接调用
打开一个已有的数据文件的方式如下:
2.数据文件
*·
SAV*·
SAS(原来)
数据文件可以根据原始数据的转换获得
3.图形文件*·
CHT
4.命令文件*·
SPS
5.结果文件*·
SPO(OUTPUT,原来是·
LST)
1.多选择题的处理(0,1编码)
2.多位题(要补位)
3.缺失值,以9结尾,如年龄,编码为99,如答案正好是9,以0替补
4.不适用,以8结尾,8,98,998,如答案正好是8,以0替补。
如有四个可选项的多选题而不适用,则为8888。
数据是一个矩阵,行是一个case在多维空间下的位置,列是不同空间的维度用来分析用行收集到的资料。
数据分析:
用微观的方法分析宏观的资料,分析平均人、平均的体系;
这个分析都是在平均的基础上,这种推断是不能还原到个案的,分析的过程是不断抛弃个人影响的过程。
数据的计算机表示法:
变量------问卷中的每一个问题,在dBASE中称为字段(Field)变量名---变量名以字母为首,后面跟A---Z,0-----9字符(字符≤8个字符),变量名不能带扩展名,如A1·
1。
变量值----变量的答案
(一)WORD中录入,存成·
1.方法:
打开WORD文档,录入数据
固定格式:
这种数据要根据已经确定的栏目位置对号入座地录入数据,在对问卷进行编码时,指定了各个项目的数值与栏位(书P10),给数据指定栏目位置时,前后数据一般不留空格,这样可以提高数据录入的速度,缺点是前后的数据不太容易区分。
如:
栏位(列号)
12345678901234567890123
000012261500
00002231400
自由格式P22:
按照问卷编码方案将某个个案数据直接录入,中间可以没有任何空格和其他符号,也可以在输入时在不同的变量之间以空挡、逗号、分号等把变量分开,不同个案之间的数据要对齐,数据录入完成以后,存成*·
TXT文件
2.把·
TXT文件转变为*·
SAV文件
SPSS——File--------ReadTextData-----------点选*·
TXT-------对话框(六步),即TextImportWizard-------Fixedwide------No------下一步--------Thefirstcasebeginsonwhichline----------划线即可-------下一步完成
TXT-------对话框(六步),即TextImportWizard-------Delimite-------下一步--------SPACE-------下一步--------完成
如果特殊数据、负数、小数点多时,则不用这种方法,可以用EXCEL录入。
(二)在EXCEL中录入数据
打开EXCEL表
不用补0,可以录入汉字,速度较慢,一般在小样本时用比较好。
第一行录入变量,第二行开始录入数据
文件保存类型:
XLS(·
工作簿BOOK)
转变为为*·
SAV文件:
SPSS--------File--------Open---------Data----------点选文件类型*·
XLS-------点选BOOK-------OK------存成SPSS的*·
SAV文件即可
用EXCEL录入的优点:
[1]可以进行各种计算,如数学与三角函数
[2]可以进行位置计算,还可以直接COPY
[3]可以用EXCEL做辅助分析,进行数据变换
[4]可以作表,非常方便
直接在SPSSWIN中录入数据
方法:
SPSS——FILE——NEWDATA——点选DataView(数据浏览界面)——录入数据——存成*·
SAV,适合于较小的样本
在DataView(数据浏览界面)中录入的数据还没有在各个数据之间区分意义,可以在VariableView(变量浏览界面)中对录入数据的意义进行界定,这个工作也可以在问卷数据录入前做,也可以在数据录入后做。
点击VariableView(变量浏览界面),对变量进行定义。
定义变量有10种功能选项,
[1]Name:
变量栏名,在这个栏目中输入变量名,如V1、V2、agesex或其他名称。
定义变量名注意:
A.变量名以字母为首,后面跟A---Z,0-----9字符(字符≤8个字符),?
!
/‘’等不能作为变量名,变量名也不能带扩展名,如A1·
B.有些关键词不能作为变量的名字,如ANDORNOTEQLTLEGTGENENETOBY——crosstabsWITHALLTHRUP---PercentageSPSS中不区别大小写字符
可以用中文做变量名,但最好不用,因为涉及一个兼容性问题。
[2]Type:
变量类型,有8种类型可供选择
Numeric:
数值型变量,系统默认值为数值型,系统默认长度为8,小数位数为2
Comma:
带逗号的数值型变量,即整数部分每3位数加一逗号,其余定义方式同数值型。
输入:
1,287,300,显示:
1,287,300
Dot:
带圆点的数值型变量,3位加点数值型,无论数值大小,均以整数形式显示,每3位加一小点(但不是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。
如1.2345显示为12.345,00(实际是12345E-4).
Scientificnotion:
科学记数法输入:
253.7E2,输出:
253.7E2
Date:
日期型变量,有27种表示方法。
点date即可以看到
Dollar:
货币型变量,有12种表示方法
Customcurrency:
自定义型变量,是一种用户利用Edit菜单的Options功能定义的。
String:
字符型变量
一般最常用的是数字型变量与字符型变量。
日期型变量格式:
dd—mmm—yyyy日日-月月月-年年年年
mm/dd/yyyy月月/日日/年年年年
qQyyyy季度Q年年年年
mMmyy月份年年
wWWKyy周数WK年年
hh:
mm:
ss时时分分秒秒
SPSS中存储的实际上是该时间与1582年10月14日零点相差的秒数,如1582年10月15日存储的就是60×
60×
24=86400,在我们把变量类型变换为数值型时可以看到这种数字。
如定date的类型为mm/dd/yyyy,输入10/15/1582,当我们把日期型数据转变为数值型数据时,看到数据变为86400。
货币型变量格式
格式
总长度
小数位数
$#
2
$##
3
$###
4
$###·
##
7
$#,###
6
$#,###·
##
9
$###,###,###,###
16
$###,###,###,###·
##
19
要求:
能够辨别数值型、字符型与日期型变量就可以。
[3]width:
宽度,指的是运算宽度,默认值为8,运算宽度实际上只会改变输出结果的显示宽度,数据的存储结果与运算的精度不受宽度的影响。
[4]Decimals:
小数位数,根据每个变量数据的大小,定义小数的位数
[5]Label:
变量标签,给相应的变量以文字说明
[6]values:
数值标签,
value1
value男
add
最后点OK
[7]missingvalues缺失值,有三种选项
Nomissingvalues没有缺失值
Discretemissingvalues定义1—3个单一数为缺失值
Rangeplusoptionaldiscretevalues定义指定范围为缺失值,同时指定另外一个不在这一范围内的单一数为缺失值
缺失值的意义是指某一项值数值缺失,软件在进行统计时不将其考虑进去。
用户自己把特定的数据界定为缺失值,则为用户缺失值user-missing.如可以把把被调查者拒绝回答或者问题不合适而没有回答的情况界定为用户缺失值9
系统缺失值systemmissing主要是指计算机默认的缺失方式,如果在录入数据时空缺了某些数据,计算机就把其界定为缺失值,这是的数据标记为‘·
’,而用户界定的缺失值则不会在数据显示时出现‘·
’。
[8]columns:
定义数据管理器纵列的长度
[9]字符排列方向:
有三种选择
left左对齐
right右对齐
center居中
[10]measure:
数据量度选择,有三种:
scale连续型变量,是测量的最高层次。
ordinal定序型变量
Nominal定类型变量
将变量定义完毕,点击数据编辑窗口,定义的变量会自动地出现在窗口中。
如何定义,进行操作演示
数据录入和变量定义完毕,可以将其存成*·
sav文件,然后就可以用这些数据进行统计分析
http:
/1121.91.14.201/php/index.php
/www.epidata.dk
下载软件Epidat
建立数据描述文件——建立数据文件——数据录入——数据输出
qes*·
recdbase;
excel;
txt;
data
屏幕设计逻辑校验*·
chk
1.打开Epidat
[1]Definedata——点选newqesfile——建立一个空的untitled1文件,qes是qustionaire的缩写
[2]把空文件untitled1文件存成一个你想要的文件名(如存成first.qes)
file菜单——saveas——出来一个对话框——把untitled1改成first.qes
[3]在空白的EpiEditor中录入——相当于变量名、变量标签、变量值的界定
录入原则:
A.必须有一个变量的名字,如V1,Sex,occupation等
B.对变量进行描述,如V1“个案号”“出生年月”等
C.对变量录入的定义说明:
Shift+#——#号键
变量有几个码,就打几个#键
V1sex#1:
M2:
F
V2Income####
[4]录入完成以后存盘。
File------saveas----------first.qes或Ctrl+S
[5]看一下录入变量的格式
找previewthedataform(左边工具栏第三个),或按一下Ctral+T键。
在屏幕上你可以看到变量的格式,这相当于预览,在里面的空白处录入东西没有用。
2.Makedatafile
Makedatafile——Makedatafile——默认Enternameof·
qes
Enternameofdatafile
(当然也可以改成自己喜欢的路径,但·
qes与·
rec不能改)
点OK——生成first·
rec文件
first·
qes是数据描述文件,first·
rec为建立了数据文件
rec为record的缩写
3.AddChecks
经常出现Checks无法进入,碰到这种情况,点File——Closeall,把所有打开的文档关闭即可)
对录入数据的方式进行某种专门的规定,如果没有可修改的,则直接录入数据
修改检查
A.Valuelabel——赋值(sexincome等)
B.Range/legal——规定变量值的范围(10-80,99)
C.Jumps——跳答1>
write如果是回答1的,跳到职业(S2):
录入1>
S2
D.Mustenter——一定要录入某个值(yes)
E.RepeatNo——一般选择NO,把以前录入的某个值在出现类似情况时进行复制。
修改完成以后或逻辑校验完成以后的数据存成fiest·
chk
4.EnterData
对话框——找first·
rec——录入完毕——点File-----closeform
5.Document
6.Exportdata
存成SPSS等
7.打开SPSS-----File-----open-------syntax------first.sps-----selectall------点黑-------RUN(运行)
点数据窗口--------可以看到已经转换好的数据
FILE-------SAVEAS存成SPSS的SAV文件。
(五)数据文件的编辑与管理
数据录入完成以后,对数据进行编辑与管理非常重要,这可以为分析打下基础。
编辑与管理主要的操作有:
1.增加新的变量(InsertVariable)
激活待增加新变量区的那个变量,Data-------InsertVariable,系统会自动为用户插入一个新的变量var00001,用户可以根据需要对其进行定义并录入数据。
2.增加新的个案(Insertcase)
如果要在第29个个案之前增加一个新的个案,可先激活第29个个案的任一单元格,然后点击Data菜单中的Insertcase,系统会自动为用户增加一个新的观察行,默认为第29个个案,原来的第29个个案观察值变为第30个观察值,然后可以录入数据。
2.删除一个变量列(DeleteVariable)
点选要删除的列,点Edit菜单中的CUT或按Delete键
3.删除一个个案(deletecase)
点选要删除的那个个案,点Edit菜单中的CUT或按Delete键
4.查找个案(GoToCase)
如果数据量很答,查找某一个观察值就很有必要,如果想查找第10个观察值,则点击Data中的GoToCase,出现对话框casenumber10------OK即可
5.数据的排序(SortCa
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 北大 社会学系 讲义 分解