笔记SPSS最新.docx
- 文档编号:3428258
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:26
- 大小:472.17KB
笔记SPSS最新.docx
《笔记SPSS最新.docx》由会员分享,可在线阅读,更多相关《笔记SPSS最新.docx(26页珍藏版)》请在冰豆网上搜索。
笔记SPSS最新
1.anxiety.sav与anxiety2.sav文件格式互相转换。
1.请将数据xulin.sav中的变量x按正常人和克山
病人分组考察正态分布。
图形-直方图—第一行是X,“行”中选group
2.某研究者调查了一批高血压患者的血压控制
情况和肥胖度,数据在tables.sav,试分析二
者之间有无关系。
分析-相关-双相关:
选入FAT和血压控制,确定。
相关性
血压控制情况
fat
血压控制情况
Pearson相关性
1
-.082
显著性(双侧)
.399
N
108
108
fat
Pearson相关性
-.082
1
显著性(双侧)
.399
N
108
149
两者相关程度较高,为负相关。
3.用cars.sav练习frenquency,descriptives,
explore.
答:
frenquency频率,会有统计量如下图,以及频率表
统计量
Horsepower
EngineDisplacement(cu.inches)
N
有效
400
406
缺失
6
0
均值
104.83
194.04
均值的标准误
1.926
5.221
中值
95.00
148.50
众数
150
97
标准差
38.522
105.207
方差
1483.949
11068.589
偏度
1.044
.692
偏度的标准误
.122
.121
峰度
.591
-.791
峰度的标准误
.243
.242
极小值
46
4
极大值
230
455
和
41933
78781
百分位数
10
67.00
90.00
20
72.00
97.70
25
75.25
103.25
30
80.30
112.00
40
88.00
122.00
50
95.00
148.50
60
100.00
205.00
70
112.00
250.00
75
129.75
302.00
80
141.60
305.00
90
160.00
350.30
描述:
描述统计量
N
全距
极小值
极大值
和
均值
标准差
方差
偏度
峰度
统计量
统计量
统计量
统计量
统计量
统计量
标准误
统计量
统计量
统计量
标准误
统计量
标准误
TimetoAcceleratefrom0to60mph(sec)
406
17
8
25
6291
15.50
.140
2.821
7.958
.211
.121
.389
.242
CountryofOrigin
405
2
1
3
636
1.57
.040
.798
.637
.929
.121
-.796
.242
ModelYear(modulo100)
405
12
70
82
30754
75.94
.186
3.742
14.001
.019
.121
-1.198
.242
有效的N(列表状态)
405
探索:
。
有直方图、QQ图、描述、正态性检验、箱线图等。
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
CountryofOrigin
.387
405
.000
.675
405
.000
a.Lilliefors显著水平修正
4.了解企业员工的任职时间、起始薪水、当前
薪水等信息;将上述信息转换成标准正态评
分值,并以便利的形式存入数据库。
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
CurrentSalary
.207
475
.000
.778
475
.000
BeginningSalary
.255
475
.000
.671
475
.000
MonthssinceHire
.082
475
.000
.955
475
.000
a.Lilliefors显著水平修正
肥胖与控制:
分析-描述性统计-交叉表-卡方检验
显著性、sig检验,大于0.05接受
了解企业员工的任职时间、起始薪水、当前薪水等信息;将上述信息转换成标准正态评分值,并以便利的形式存入数据库。
:
分析-描述统计-描述
分析-多重响应:
定义多重响应值
受访人群中最受欢迎的饮料?
(频率)
先在分析-多重相应-定义变量集里将茶等5种饮料定义为多重相应集,计数值为1,名称为A。
再在分析-多重相应-频率里选中A,确定。
$A频率
响应
个案百分比
N
百分比
$Aa
茶
11
23.9%
61.1%
牛奶
10
21.7%
55.6%
咖啡
7
15.2%
38.9%
果汁
9
19.6%
50.0%
水
9
19.6%
50.0%
总计
46
100.0%
255.6%
a.值为1时制表的二分组。
男女喜好的饮料有无差别?
(交叉表)
在分析-多重相应-交叉表中,A选在行,SEX选在列。
定义范围,男为1,女为2,所以最小值是1,最大值是2.男生最喜欢牛奶,而女生喜欢牛奶的很少,所以男女生的喜好有差别。
$A*sex交叉制表
性别
总计
男
女
$Aa
茶
计数
6
5
11
牛奶
计数
7
3
10
咖啡
计数
4
3
7
果汁
计数
4
5
9
水
计数
5
4
9
总计
计数
9
9
18
百分比和总计以响应者为基础。
a.值为1时制表的二分组。
三个城市对饮料的喜好有无差别?
(交叉表)
与上一题方法一样,定义范围是1-3.有差别,比如广州喜欢喝果汁,而上海选果汁的人很少。
$A*city交叉制表
生活地区
总计
北京
上海
广州
$Aa
茶
计数
3
4
4
11
牛奶
计数
3
3
4
10
咖啡
计数
2
3
2
7
果汁
计数
3
1
5
9
水
计数
4
2
3
9
总计
计数
5
5
8
18
百分比和总计以响应者为基础。
a.值为1时制表的二分组。
Pkc.sav分析肿瘤病人的性别及分期对PKC的值有无影响:
分析-比较均值-均值:
由下图可见,性别影响很小,级别影响比较大。
pkc*sex
pkc
sex
均值
N
标准差
1
66.5647
34
15.23156
2
64.1941
17
16.40501
总计
65.7745
51
15.50851
pkc*jibie
pkc
jibie
均值
N
标准差
2.00
80.2350
20
6.45562
3.00
65.1533
15
7.90351
4.00
48.2812
16
9.22036
总计
65.7745
51
15.50851
某汽车厂商声称其发动机排放标准的一个指标平均值低于20个单位,在抽查了10台发动机后,得到文件中的数据,究竟能否由此认定该标准值低于20个单位?
:
分析-比较均值单样本T检验:
(exh.sav)
把T检验设为20
单个样本检验
检验值=20
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
exh
1.234
9
.249
1.13000
-.9422
3.2022
原假设为高于20个单位,Sig值大于0.05,接受原假设。
因此不能认为该机器低于20个单位。
独立样本T检验:
(spromotion.sav)
某商场为某种产品进行了促销活动,请比较前后数日的销售额,以确定促销活动对销售有无影响。
独立样本检验
方差方程的Levene检验
均值方程的t检验
差分的95%置信区间
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
下限
上限
日销售额(万元)
假设方差相等
.225
.638
-1.818
32
.078
-84.431
46.445
-179.036
10.174
假设方差不相等
-1.813
31.163
.079
-84.431
46.565
-179.380
10.519
原假设为促销活动对销售额无影响,SIG值大于0.05,接受,但是
配对样本T检验:
为研究某种药是否影响血清胆固醇,将20名女性按年龄配成10对,每对中随机抽取一人服用新药,另一个服用安眠药,经过一段时间,测量血清胆固醇含量,结果在文件中,问新药是否有影响?
成对样本检验
成对差分
t
df
Sig.(双侧)
均值
标准差
均值的标准误
差分的95%置信区间
下限
上限
对1
newdrug-placebo
-.43000
.88198
.27891
-1.06093
.20093
-1.542
9
.158
原假设新药没有影响,SIG大于0.05,无影响
单因素检验:
Comparemean
*one-wayANOVAs
(spromotion-copy.sav)
某商场为某种产品进行了三种促销方法的尝试,请比较三种促销方法的销售额,以确定促销活动对销售有无影响。
多重比较
购买金额
LSD
(I)type
(J)type
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
方法一
方法二
-45.400
65.987
.497
-180.79
89.99
方法三
-2.500
65.987
.970
-137.89
132.89
方法二
方法一
45.400
65.987
.497
-89.99
180.79
方法三
42.900
65.987
.521
-92.49
178.29
方法三
方法一
2.500
65.987
.970
-132.89
137.89
方法二
-42.900
65.987
.521
-178.29
92.49
所以没什么差别。
bivariate
用于进行两个/多个变量间的参数/非参数相关分析,如果是多个变量,则给出两两分析的结果。
Corr.sav:
Fenxi-相关-双变量
1.根据以前的大量调查,已知顾客对某产品的满意度
评分在72分左右,现该产品进行了从新包装,收集
了一些顾客的满意度评分,现在的评价有无改变?
(Score.sav)找不到呀~~
2.对促销人员培训前和培训后销售额的比较,以确认
业务培训有无效果。
(pair1.sav)
分析-比较均值-配对样本T检验:
成对样本检验
成对差分
t
df
Sig.(双侧)
均值
标准差
均值的标准误
差分的95%置信区间
下限
上限
对1
培训前-培训后
-70.83333
106.04102
30.61140
-138.20858
-3.45809
-2.314
11
.041
SIG小于0.05,拒绝原假设,所以业务培训有效果。
3.对于数据,名牌与普通商品进行比较,名牌商品和
普通商品是否价格有差异,如果有,价格差异大约
是多少,给出区间估计。
(名牌与普通商品价格比
较.sav)
成对样本检验
成对差分
t
df
Sig.(双侧)
均值
标准差
均值的标准误
差分的95%置信区间
下限
上限
对1
名牌商品价格-普通商品价格
1.07000
.58739
.18575
.64981
1.49019
5.761
9
.000
分析-比较均值-配对样本T检验
成对样本检验
成对差分
t
df
Sig.(双侧)
均值
标准差
均值的标准误
差分的95%置信区间
下限
上限
对1
名牌商品价格-普通商品价格
1.07000
.58739
.18575
.64981
1.49019
5.761
9
.000
SIG小于0.05,拒绝原假设,认为有差别。
某公司考察一个产品品牌定位,对31名消费者中的
女职员、女大学生及家庭主妇进行了偏好指数测定,
问三组消费者的偏好有无差别.(prefer.sav)
多重比较
indicator
LSD
(I)分期
(J)分期
均值差(I-J)
标准误
显著性
95%置信区间
下限
上限
一期
二期
-.52020*
.10522
.000
-.7357
-.3047
三期
-1.29091*
.09982
.000
-1.4954
-1.0864
二期
一期
.52020*
.10522
.000
.3047
.7357
三期
-.77071*
.10522
.000
-.9862
-.5552
三期
一期
1.29091*
.09982
.000
1.0864
1.4954
二期
.77071*
.10522
.000
.5552
.9862
*.均值差的显著性水平为0.05。
有差别
例:
某公司准备推出一个新品牌的矿泉水,现已经万事俱备,就是在新产品的名字上几位董事意见尚未统一。
董事会屡议不绝之后,最终决定进行抽样调查,采访了200人,52人喜欢1,61人喜欢2,87人喜欢3,问三种名称的受欢迎程度有无差异?
:
非参数型检验-卡方(先数据-加权)
检验统计量
VAR00002
卡方
9.910a
df
2
渐近显著性
.007
MonteCarlo显著性
显著性
.007b
99%置信区间
下限
.005
上限
.009
a.0个单元(.0%)具有小于5的期望频率。
单元最小期望频率为66.7。
b.基于10000个具有起始种子2000000的采样表。
有差异
根据以往经验,新生儿染色体异常率一般为1%,现某医院观察了当地共400名新生儿,只发现一例染色体异常,该地新生儿染色体异常率是否低于一般:
非参数检验-二项分布
先加权,再二项检验,检验比例0.01.不符合。
二项式检验
类别
N
观察比例
检验比例
渐近显著性(单侧)
精确显著性(单侧)
VAR00002
组1
1.00
1
.00
.01
.090a,b
.090c
组2
399.00
399
1.00
总数
400
1.00
a.备择假设规定第一组中的案例比例小于.01。
b.基于Z近似值。
c.将为该检验提供了精确结果而不是MonteCarlo。
显著性大于0.05,接受原假设,不能说明XX低于一般。
根据employee.sav,分析工资高低是否与教育水平有关:
分析-相关-双相关
相关性
EducationalLevel(years)
CurrentSalary
EducationalLevel(years)
Pearson相关性
1
.664**
显著性(双侧)
.000
N
475
475
CurrentSalary
Pearson相关性
.664**
1
显著性(双侧)
.000
N
475
476
有关,正相关,相关系数为0.664**.在.01水平(双侧)上显著相关。
相关性越接近1,相关性越强
请分析spss自带数据anxity.sav中score的分布情况如何,以及四次实验间的评分有无变化趋势,方差是否齐。
描述-探索,score再上面,trial再下面,是x
正态性检验
Trial
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
Score
1
.238
12
.060
.890
12
.117
2
.169
12
.200*
.940
12
.495
3
.182
12
.200*
.947
12
.595
4
.201
12
.193
.885
12
.100
a.Lilliefors显著水平修正
*.这是真实显著水平的下限。
正态性检验
Trial
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
Score
1
.238
12
.060
.890
12
.117
2
.169
12
.200*
.940
12
.495
3
.182
12
.200*
.947
12
.595
4
.201
12
.193
.885
12
.100
a.Lilliefors显著水平修正
*.这是真实显著水平的下限。
SIG大于0.05,方差齐
四次评分有变化
请分析veneer.sav的磨损指数
:
非参数检验—k个独立样本,定义范围1-4
秩
品牌
N
秩均值
Amountofmaterialwornaway
1.00
4
8.25
2.00
4
9.13
3.00
4
3.00
4.00
4
13.63
总数
16
检验统计量a,b
Amountofmaterialwornaway
卡方
10.188
df
3
渐近显著性
.017
a.KruskalWallis检验
b.分组变量:
品牌
例5.1某专门面向年轻人制作肖像的公司计
划在国内再开设几家分店,收集了目前已
开设的分店的销售数据(Y,万元)及分店所
在城市的16岁以下人数(X1,万人)、人均可
支配收入。
(reg.sav)
分析数据sample.sav中的数据,评价被访者的性别与各种新闻获取方式的情况;定义多重响应及。
·
评价被访者年龄分组与各种汽车产地的情:
Life.xls是某市从1978到1992年的一份统计表,内容包括商品零售总额、居民收入和全市人口数,试分析他们之间是否存在线性相关关系,强度如何。
相关:
双变量相关
现已测得20名糖尿病人的血糖(y,mmol/L),胰岛素(x1,mu/L),及生长素(x2,ug/L)的数据,分析糖尿病人血糖浓度和生长素浓度间有无相关关系。
Pcorr.sav
相关性
控制变量
血糖(mmol/L)
生长素(ug/L)
胰岛素(mU/L)
血糖(mmol/L)
相关性
1.000
.200
显著性(双侧)
.
.411
df
0
17
生长素(ug/L)
相关性
.200
1.000
显著性(双侧)
.411
.
df
17
0
即排除胰岛素的影响分析其他二者的关系
:
篇相关
2.某种药品服用计量一般很大,现研究口服此药与心肌梗死的关系,考虑到年龄是一个可能的因素,将其也纳入调查,数据在oc.sav,请分析口服此药与心肌梗死的关系。
:
偏相关
相关性
控制变量
oc
count
age
oc
相关性
1.000
.848
显著性(双侧)
.
.000
df
0
328
count
相关性
.848
1.000
显著性(双侧)
.000
.
df
328
0
正相关,相关系数为0.848
Pcorr.sav中,建立血糖浓度与胰岛素及生长素的多元线性回归
方程。
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
17.011
2.472
6.880
.000
胰岛素(mU/L)
-.406
.094
-.743
-4.313
.000
生长素(ug/L)
.098
.116
.145
.843
.411
a.因变量:
血糖(mmol/L)
1.分析数据sample.sav中的数据,评价被访者的性别与各种新闻
获取方式的情况;评价被访者年龄分组都使用什么产地的汽车。
分析-多重相应-把报纸等定义为多重相应及,再算交叉表。
$X*sex交叉制表
sex
总计
Male
Female
$Xa
报纸
计数
375
430
805
杂志
计数
121
173
294
电视
计数
451
626
1077
收音机
计数
233
318
551
网络
计数
359
508
867
总计
计数
896
1185
2081
百分比和总计以响应者为基础。
a.值为1时制表的二分组。
对sample.sav中按照子女分类做每天看电视的小时数、年龄、家庭总收入、个人总收入图。
其中每天看电视的小时数、年龄以线图表示,家庭总收入和个人总收入以条图表示(在一张图上)
篇相关
分类变量的相关只能用交叉表来做,卡方
研究中风病人入院时状况(GPS评分)和入院时间的关系,收集了88例中风病人记录。
变量time为时间,1级为5小时以内,级别越高,时间越久。
请问病人及时入院者gsc评
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 笔记 SPSS 最新