spss课堂笔记.docx
- 文档编号:23463433
- 上传时间:2023-05-17
- 格式:DOCX
- 页数:12
- 大小:322.90KB
spss课堂笔记.docx
《spss课堂笔记.docx》由会员分享,可在线阅读,更多相关《spss课堂笔记.docx(12页珍藏版)》请在冰豆网上搜索。
spss课堂笔记
1、教学数据
2、研究数据(2-3周做好选题工作)
(1)自备数据(导师提供的数据)
(2)赵老师提供的数据
(A.NSSE-CHINA.2010-2013;B.CGSS.2006中国社会状况综合调查C.其他)
3、助教:
确定选题、汇总研究进度、提出修改意见。
查重:
paper.
<0.05小概率事件<0.01极小概率事件
0.002的概率<0.05,假设研究样本和总体样本s=x1-x2=0不成立,显著
地方依赖感
焦虑抑郁神经质根据一周以来的自我感受
SCL
性别:
2
年龄:
23
民族:
1
专业:
土地资源管理4
学历:
研究生硕士
城乡:
1
职业:
学生
建立数据文件、算出总分
独立样本的检验T检验
男的均值>女的均值,所以女性的精神病性更强。
0假设:
男性JSBX得分和女性相同。
(不存在显著差异)
构建变量,考察
研究结果表明:
方差的Sig>0.05均值的Sig>0.05不显著相关
F,P,对应t和p为,俩总体均值不存在显著差异,男女研究生在JSBX研究上,不存在显著差异。
方差的Sig<0.05均值的Sig<0.05显著相关
科学:
对象可确定的,可观测的、可测量的,对象的观测和测量可以重复观测和测量,结果可以保持不变。
SQL标准化的量表
音频分析,对音频高的进行汇总。
统计学:
数据分析的方法论。
SAS
EVIEWS
S-plus
编码手册做好、设置97个变量
1-100岁进行等距变量婴儿、儿童…
研究说明和解释
完整的
题目、摘要、作者简介3~6:
5000-6000
1、问题背景
2、方法(T检验、回归分析…)工具(SQL90)和程序(样本)
3、结果3.13.23.3
4、分析讨论
5、基本结论
6、参考文献
变量计量尺度:
性别:
定类变量
年龄:
定距定秩定比
Scale:
定距数据收入、人数
Ordinal:
有固定顺序年龄段职称
nominal:
无固定顺序性别
BemSexRoleInventory
横的为变量,竖的为个案。
8个个案。
8人次。
0假设:
喝茶前体重-喝茶后体重=0
Sig=0.000<0.05假设不成立说明这两数据存在显著差异
男女
专业1:
1023
专业2:
1210
Exp1:
1、不多于8个字符
2、不区分大小写
3、允许汉字作为变量名
4、默认变量:
var
数值型:
1、逗号:
123,456
2、科学计数法:
1.2E+05
字符串(string):
日期型(Date):
变量名标签:
解释说明
变量值标签:
品质数据1-男2-女、1-高2-中3-低
缺失值:
漏填的、明显错误的、篡改的数据
快捷键学习:
关机:
ALT+F4
切换“alt+tab
回到桌面:
Windows+D
利用副本进行数据操作
怎么避免数据复制过来以后串行?
好像没说~
描述统计:
没有推理过程的统计。
标准差、方差、级差:
描述离散程度的变量。
均值:
描述集中程度的变量。
描述分布情况:
偏度、峰度。
3西格玛大约99.73%落在[-3○,3○]
1、频数分析
2、Spss中使用的是样本方差很敏感地反映数据的离散程度
表1(空一格)
姓名
年龄
收入
哈哈
呵呵
均值
中位数
众数
实证和否证?
绝对真理和相对真理:
否证:
找不到反驳的条件或案例,那么也就间接证明了他的真实性。
抽样分布
假设检验的基本步骤
(1)根据检验的目标,对待推断的总体参数或分布做一个基本假设Ho平均年龄50岁(总体均值与检验值之间不存在显著差异)
(2)构造检验统计量,且该统计量服从某种已知分布。
TF检验20与50之间是否存在显著差异
(3)如果概率P值小于用户给定的a水平,则拒绝0假设,否则o假设成立。
(计算T统计量及相应的P值)
(4)P<=a,拒绝0假设,总体均值和检验值之间有显著差异。
单样本T检验:
分析——均值比较检验值为75
得到:
研究结果表明,平均身高为71.8,得到T值,对应P值为,<0.05,拒绝0假设,周岁儿童平均身高小于75cm。
例如:
《中日周岁儿童平均身高比较研究》
独立样本:
配对样本:
1分析——>比较均值——>单样本T检验
表3-1周岁儿童身高的单个样本检验
检验值=75
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
周岁儿童的身高
-3.620
20
.002
-3.14286
-4.9539
-1.3319
构建单样本t检验公式,考察周岁儿童身高是否为75CM,研究结构钢表明:
t=-3.62,p=0.002(<0.05),所以,拒绝零假设,也就是说周岁儿童身高与75CM之间存在显著差异。
2两独立样本T检验是单因素方差分析的形式
1.Ho=U1-U2=0两总体均值无显著差异
2.构造检验统计量,从两样本均值差的分布出发FT
3.<0.05,拒绝零假设,存在显著差异。
方差齐性F检验两总体方法是否齐性
<=a拒绝非齐性
3两配对样本t检验
两总体均值无显著差异,差值序列的均值u=0
0.000不等于0
方差分析
(1)观测变量:
作为观测的对象(如:
亩产量、推销量)
(2)控制因素:
人为可以控制的因素(如,施肥量、种子、先天环境)
观测变量的数据差异=控制因素造成+随机因素造成
{单因素方差分析:
只考虑一个控制因素AC
(各水平下,各总体的分布是否存在显著差异,进而判断各控制变量是否有影响)
构造F统计量:
SST=SSA+SSE
结论:
F值较大时候,P<=用户给定的显著性水平a,则拒绝Ho,认为不同水平各总体均值有显著差异。
LSD:
单因素方差分析中的多重比较,事后两两比较。
(特点:
利用了全部样本数据,不仅是所比较的两组的数据,且认为各水平均是等方差的)
{多因素方差分析:
考虑2个以上的控制因素和他们的交互作用对观测变量的影响
A+B+ABC
SSAB=SST-SSA-SSB-SSE
A、B、AB对应的三个F值
结论:
依次查看各F值,F值较大时候,P<=用户给定的显著性水平a,则拒绝Ho,认为不同水平各总体均值有显著差异。
只考虑A、B不考虑AB,非饱和模型。
这样设定的话,与Full全因子是一样的,饱和。
非饱和模型的话就是没有AB。
{协方差分析:
在尽量排除其他因素的影响下,只考虑单个或多个因素
不同地区的销售额存在显著差异
因果关系:
交叉表
卡方检验
定类与定类:
相关分析:
卡方检验
定序与定序:
Spearman相关系数
定距与定距:
Pearson相关
R=1完全正相关
R=-1完全负相关
R=0不相关
分析——>相关——>双变量
偏相关也称净相关
分析——>相关——>偏相关
e+A+B+C+D=>E
回归分析:
1.确定回归方程的解释变量和被解释变量
2.确定回归方程
3.对回归方程进行检验
4.利用回归方程进行预测
不显著的话,这个变量就要剔除。
逐步进入法
可决系数、判定系数,R^2越高,解释性越高,要看调整后的判定系数。
一元的话:
看R
多元的话:
看调整后的R^2
该回归方程具有较好的解释力。
自变量本身就存在高相关,所以一个自变量高相关,不能排除其他因素的影响。
多重贡献性。
残差分析应包括以下内容:
DW检验用来检验残差的自相关
DW=2无自相关,0-2正相关,2-4负相关,1.5-2.5无自相关现象。
题目、工具、方法、说明
多元线性方程的B1,B2,B3都是偏回归系数。
多重线性分析
1.容忍度:
1-R^2
2.
为什么很多变量被删除了,因为很多变量有相互作用。
聚类分析:
Mall
20个分值变量
一个总值(计算变量)
比较哪个商场更好?
1.单因素方差分析
思路:
1、解题
2、设置变量
3、整理和编辑数据
4、均值比较POSThook事后比较(虽然分数低了点,但没有显著差异,就可以给2个一等奖)
亲疏程度:
个体相似程度、个体差异程度
定距型变量个体间距离的计算方式
卡方
Phi方
聚类分析几点注意:
1.所选择的变量应符合聚类的要求:
所选变量应能够从不同的侧面反映我们研究的目的;
2.不应该有数量级上的差异;
3.不应该有较强的相关关系
最近邻居
最远邻居
分析分类系统聚类分析
个案聚类:
R聚类=变量聚类:
因子分析:
降维—>因子分析
1.基于特征值
2.因子的固定数量
K均值分类(就只出来2个表)在数据栏后面形成结果
先做树形图
因子分析:
因子分析能将很多原始的众多变量综合成几个,起到降维的作用。
1.因子个数远远少于原有变量的个数
2.因子能够反应原有变量的绝大部分信息
3.因子之间不存在线性关系
4.因子具有命名解释性(可以将聚类的指标进行较好的解释)
相关系数矩阵中相关系数<0.3,那么就不建议做因子分析
因子个数的确定方法:
1.特征值>1
2.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 课堂 笔记