频数分析列连表.docx
- 文档编号:29511554
- 上传时间:2023-07-24
- 格式:DOCX
- 页数:17
- 大小:183.77KB
频数分析列连表.docx
《频数分析列连表.docx》由会员分享,可在线阅读,更多相关《频数分析列连表.docx(17页珍藏版)》请在冰豆网上搜索。
频数分析列连表
1频数分析(DescriptiveStatistics-Frequencies)
频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
下面我们通过例子来学习单变量频数分析操作。
1)输入分析数据
在数据编辑器窗口打开“data1-2.sav”数据文件。
2)调用分析过程
在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“DescriptiveStatistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。
图3-4“Frequencies”对话框
3)设置分析变量
从左则的源变量框里选择一个和多个变量进入“Variable(s):
”框里。
在这里我们选“三化螟蚁螟[虫口数]”变量进入“Variable(s):
”框。
4)输出频数分布表
Displayfrequencytables,选中显示。
5)设置输出的统计量
单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:
图3-5“Statistics”对话框
①选择百分位显示“PercentilesValues”栏:
Quartiles:
四分位数,显示25%、50%和75%的百分位数。
Cutpointsfor10equalgroups:
将数据平分为输入的10个等份。
Percentile(s):
:
用户自定义百分位数,输入值0—100之间。
选中此项后,可以利用“Add”、“Change”和
“Remove”按钮设置多个百分位数。
②选择变异程度的统计量“Dispersion”:
(离散趋势)
Std.deviation标准差
Minimum最小值
Variance方差
Maximum最大值
Range 极差
S.E.mean均值标准误
③选择表示数据中心位置的统计量“CentralTendency”:
(集中趋势)
Mean均值
Median中位数
Mode众数
Sum算术和
④选择分布指标“Distribution”:
Skewness偏度
Kurtosis峰度
6)统计图形输出设置
单击“Charts”按钮,将弹出如图3-6所示的对话框:
图3-6“Charts”对话框
①ChartType图形选择栏:
○None:
不输出图形;
○Barcharts:
输出条形图;
○Piecharts:
输出饼图;
⊙Histograms:
输出柱状图。
若选中“√Withnormalcurve”项,则在绘制柱状图中加绘一条正态分布曲线。
②当用户选中条形图或饼图时,在“ChartValues”框的选项中可选择:
⊙Frequencies:
绘制频数图。
○Percentages:
绘制频率图。
7)设置频数表格式
在图3-4对话框中,单击“Format”按钮,打开如图3-7所示的对话框:
图3-7“Format”对话框
①设置排序的方法“Orderby”:
⊙Ascendingvalues:
按变量值的升序排列。
○Descendingvalus:
按变量值的降序排列。
○Ascendingcounts:
按频数的升序排列。
○Descendingcounts:
按频数的降序排列。
②选择多变量输出设置“MultipleVariables”:
⊙Comparevariables选项,所有变量在一个图形中输出,以便进行比较。
○Organizeoutputbyvariables选项,为每一个变量单独输出一个图。
③设置在频数表中显示的组数
选中此项,输入分组数,系统缺省为10组。
设置完成后,点击“Continue”按钮回到上一级对话框。
8)提交执行
在图3-4对话框里单击“OK”按钮,SPSS在输出窗口的输出结果如表1、表2和图1结果。
9)分析结果
表1统计量表 Statistics
三化螟蚁螟
N
Valid
120
Missing
0
Mean(平均数)
75.14
Std.Deviation(标准差)
7.024
Skewness(偏度系数)
-.031
Std.ErrorofSkewness(偏度系数误差)
.221
Kurtosis(峰度系数)
-.582
Std.ErrorofKurtosis(峰度系数误差)
.438
Percentiles
10
65.00
20
68.20
30
71.00
40
73.40
50
75.00
60
77.00
70
79.00
80
81.80
90
84.90
在表1中列出的信息有:
有效观测值有124个,缺失值0个,平均数75.14,标准差7.024。
偏度系数(Skewness)及误差:
-0.031和0.221,峰度系数(Kurtosis)及误差:
-0.582和0.438。
表2频数表
三化螟蚁螟
Frequency
(频数)
Percent
(百分比)
ValidPercent
(有效观测值的百分比)
CumulativePercent
(累积百分比)
Valid?
?
?
?
?
58
1
.8
.8
.8
62
3
2.5
2.5
3.3
63
1
.8
.8
4.2
64
4
3.3
3.3
7.5
65
4
3.3
3.3
10.8
66
1
.8
.8
11.7
67
5
4.2
4.2
15.8
68
5
4.2
4.2
20.0
69
4
3.3
3.3
23.3
70
4
3.3
3.3
26.7
71
5
4.2
4.2
30.8
72
7
5.8
5.8
36.7
73
4
3.3
3.3
40.0
74
4
3.3
3.3
43.3
75
9
7.5
7.5
50.8
76
9
7.5
7.5
58.3
77
5
4.2
4.2
62.5
78
6
5.0
5.0
67.5
79
6
5.0
5.0
72.5
80
6
5.0
5.0
77.5
81
3
2.5
2.5
80.0
82
4
3.3
3.3
83.3
83
3
2.5
2.5
85.8
84
5
4.2
4.2
90.0
85
2
1.7
1.7
91.7
86
4
3.3
3.3
95.0
87
3
2.5
2.5
97.5
88
1
.8
.8
98.3
90
1
.8
.8
99.2
91
1
.8
.8
100.0
Total
120
100.0
100.0
?
在表2中列出的信息有:
Frequency频数;Percent百分比;ValidPercent有效观测值的百分比;CumulativePercent累积百分比。
图3-8频数分布的条形图表示
2列联表分析(Crosstabs)
列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。
SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。
其中卡方检验是分析列联表资料常用的假设检验方法。
例子:
山东烟台地区病虫测报站预测一代玉米螟卵高峰期。
预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1(℃)分为3级(1级为16.5℃以下,2级为16.6-17.8℃,3级为17.8℃以上),6月上旬平均气温x2(℃)分为3级(1级为20℃以下,2级为20.1-21.5℃,3级为21.5℃以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。
数据如下表。
山东烟台历年观测数据分级表()
年份
59
60
61
62
63
64
65
66
67
69
70
71
72
73
74
75
76
77
y
1
3
1
1
3
1
1
2
1
3
2
1
2
2
3
2
2
1
x1
3
2
2
3
1
3
2
3
3
1
2
3
1
1
1
2
2
1
x2
1
2
3
1
1
2
2
1
1
1
1
2
3
1
1
1
1
2
x3
3
1
1
3
1
2
1
3
2
2
1
2
1
2
3
2
3
1
x4
3
1
1
1
1
1
1
1
1
1
3
1
1
2
1
1
1
1
注:
摘自《农业病虫统计测报》131页。
1)输入分析数据
在数据编辑器窗口打开“data1-3.sav”数据文件。
数据文件中变量格式如下:
2)调用分析过程
在菜单选中“Analyze-Descriptive-Crosstabs”命令,弹出列联表分析对话框,如下图
3)设置分析变量
选择行变量:
将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”变量选入“Rows:
”行变量框中。
选择列变量:
将“玉米螟卵高峰发生期[y]”变量选入“Columns:
”列变量框中。
4)输出条形图和频数分布表
Displayclusteredbarcharts:
选中显示复式条形图。
Suppresstable:
选中则不输出多维频数分布表。
。
5)统计量输出
点击“Statistics”按钮,弹出统计分析对话框(如下图)。
Chi-Square:
卡方检验。
选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验
(ContinuityCorrection)及Fisher精确概率检验(Fisher’sExacttest)的结果。
Correlations:
选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。
Nominal:
两分类变量的关联度(Association)测量
ContingencyCoefficient:
列联系数,其值越大关联性越强。
PhiandCramer’sV:
Cramer列联系数,其值越大关联性越强。
Lambda:
减少预测误差率,1表示预测效果最好,0表示预测效果最差。
UncertaintyCoefficient:
不定系数
Ordinal:
两有序分类变量(等级变量)的关联度测量
Gamma:
关联度,+1表示完全正关联,-1表示负关联,0表示无联。
Somers’d:
列联度,其取值范围和意义同上。
Kendall’stau-b:
NominalbyInterval:
一个定性变量和一个定量变量的关联度
Eta:
关联度统计量。
Kappa:
吻合度系数,其取值-1至+1,其值越大吻合程度越高。
Risk:
危险度分析。
McNemar:
配对计数资料的卡方检验。
Cochran’sandMantel-Haenszelstatistics:
检验在协变量存在下,两个二分类变量是否独立。
6)设置列联表的显示
单击“Cells”按钮,弹出列联表显示内容对话框(如下图)。
Counts:
频数
Observed:
观测频数。
Expected:
期望频数。
Percentages:
百分比
Row:
占本行的百分比。
Column:
占本列的百分比。
Total:
占全部的百分比。
Residuals:
残差分析
Unstandardized:
非标准化残差分析。
Standardized:
标准化残差分析。
Adj.Standardized:
调整的标准化残差分析。
NonintegerWeights:
⊙Roundcellcounts:
临近列计算。
○Truncatecellcounts:
。
○RoundcaseWeights临近记录度量
○TruncatecaseWeights
○Noadjustments:
不调整。
7)设置输出格式
单击Format按钮,弹出列联表输出格式对话框(如下图)。
RowOrder:
频数
⊙Ascending:
行变量从小到大升序排列。
○Descending:
行变量从大到小降序排列。
8)设置检验
单击“Exact”按钮,弹出精确检验对话框(如下图)。
⊙Asymptoticonly近似的,系统设置。
○MonteCarlo
Confidencelevel:
99%置信度,系统默认99%。
Numberofsamples:
10000样本数量,系统默认10000。
○Exact
Timelimitpertest:
5minutes限时检验时间,系统默认值5分钟。
9)提交执行
设置完成后,在列联表分析对话框中,点击OK按钮,计算结果输出在结果窗口中。
10)结果与分析
在结果窗口中查看计算结果,主要输出内容如下。
五月气温*玉米螟卵高峰发生期
Crosstab
玉米螟卵高峰发生期
Total
6月20日前
6月21-25日
6月25日以后
五月气温
16.5以下
Count(频数)
ExpectedCount(期望值)
1
2.7
2
2.0
3
1.3
6
6.0
16.6-17.8
Count(频数)
ExpectedCount(期望值)
2
2.7
3
2.0
1
1.3
6
6.0
17.8以上
Count(频数)
ExpectedCount(期望值)
5
2.7
1
2.0
0
1.3
6
6.0
Total
Count(频数)
ExpectedCount
8
8.0
6
6.0
4
4.0
18
18.0
Chi-SquareTests
Value
df
Asymp.Sig.(2-sided)
PearsonChi-Square
皮尔森卡方检验
7.750(a)
4
.101
LikelihoodRatio
似然比卡方检验
8.510
4
.075
Linear-by-LinearAssociation
6.248
1
.012
NofValidCases
18
a9cells(100.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis1.33.
(其余的省约)
结果分析:
从交叉表(Crosstab)对角线中看出,只有“五月气温与玉米螟卵高峰发生期”对角线上出现的频数大于期望值(5>2.7,3>2.0,3>1.3)。
从卡方检验表得知,也只有“五月气温与玉米螟卵高峰发生期”能通过线性间的联合检验(Linear-by-LinearAssociation),双尾检验p<0.012。
因此,玉米螟卵高峰发生期与五月气温有密切的关系,五月气温越高,发生越早。
(注:
本资料素材和资料部分来自网络,仅供参考。
请预览后才下载,期待你的好评与关注!
)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 频数 分析 列连表