SPSS买房数据分析实施报告.docx
- 文档编号:29118856
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:15
- 大小:346.13KB
SPSS买房数据分析实施报告.docx
《SPSS买房数据分析实施报告.docx》由会员分享,可在线阅读,更多相关《SPSS买房数据分析实施报告.docx(15页珍藏版)》请在冰豆网上搜索。
SPSS买房数据分析实施报告
《统计分析软件(双语)》实验报告
题目:
关于“某地区买房数据”的分析报告
姓名:
学号:
1204100215
专业:
统计学
院系:
统计学院
指导教师:
完成日期:
2014年12月10日
摘要
利用SPSS统计分析软件对“某地区买房”数据进行了描述性统计分析,比较均值,相关分析,回归分析四大类型的数据分析。
其中在描述性统计分析中作了频数分析,探索分析,交叉分析,得出了该地区中年龄段在25~45居多,就业大多在国企,文化程度高中和大学所占比重大;大学学历的现居住面积较大,其最大值,最小值以及均值均大于其他三种学历的居住面积。
人均居住面积的单样本T检验的出了的结论是人均居住面积与均值之间存在显著性差异。
现居住面积和人居住面积的双变量的相关分析得出了两者之间存在显著性差异。
在回归分析中得出的结论是现居住面积是服从正态分布的且和满意度是显著相关的。
一、数据简要3
二、数据分析3
(一)描述分析性统计,3
1,就业状况的频数分析3
2,文化程度的频数分析3
3,现居住面积及人均居住面积的描述性分析3
4,居住面积和文化程度的探索分析3
5,文化程度与年收入的交叉列联表分析3
(二)均值比较3
1,人均现住面积和年龄段的描述统计3
2,人均居住面积的单样本T检验3
3,现居住面积的独立样本T检验3
(三)相关分析3
1,现居住面积和人居住面积的双变量的相关分析3
2,人均居住面积,现居住面,居住类型的偏相关分析3
(四)回归分析3
三、小结3
一、数据简要
本次分析的数据为某年某地719个人买房情况统计表,一共有11个变量,其中现居住面积与人均居住面积为scale变量,其余9个变量为nonscale变量,依次为年龄段,文化程度,从业状况,家庭类型,家庭年收入,住房满意度,卖掉现房,购买户型,是否贷款。
二、数据分析
(一)描述分析性统计,
1,就业状况的频数分析
图1:
就业状况条形图
2,文化程度的频数分析
图2:
文化程度扇形图
从图二中可以看出文化程度最比例最多的为高中占42.98%,接下来是大学为35.47%,初中以下为19.61%,最少的为研究生及以上只占1.95%。
3,现居住面积及人均居住面积的描述性分析
表1:
现居住面积及人均居住面积的描述性分析表
DescriptiveStatistics
N
Minimum
Maximum
Mean
Std.Deviation
现居住面积
719
6.00
168.00
58.9062
24.03677
人均现住面积
719
2.400
101.000
20.55481
12.728884
ValidN(listwise)
719
现居住面积及人均居住面积的描述性分析表表示现居住面积的有效数据为719,最小值,最大值,均值,标准差依次为6,168,58.9062,24.03677.由此可以得出现居住面积平均面积为58.9062,居住面积的围在6~168平方米之间,标准差为24.03677平方米。
而均值的有效数据为719,最小值,最大值,均值,标准差依次2.4,101,20.55481,12.728884。
4,居住面积和文化程度的探索分析
图3:
居住面积和文化程度的探索分析箱图
从居住面积和文化程度的探索分析箱图可以得出,大学学历的现居住面积较大,其最大值,最小值以及均值均大于其他三种学历。
也可以知道初中学历,高中,大学均有离群值,而研究生及以上没有离群值。
5,文化程度与年收入的交叉列联表分析
表3:
文化程度与年收入的交叉列联表
CaseProcessingSummary
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
文化程度*家庭年收入
719
100.0%
0
.0%
719
100.0%
文化程度与年收入的交叉列联表给出了参加分析计算的样品统计,共有样品719个,没有缺失值,均为有效值。
图4:
文化程度与年收入的交叉列联表
从图3交叉分组下的频数分布图,从图中可以得出年收入最多75000元以上的在大学学历中,在高中及大学中年收入最多的为10000~25000元之间。
在初中学历中年收入大多都在5000~25000元之间。
研究生及以上的在10000~25000居多。
(二)均值比较
1,人均现住面积和年龄段的描述统计
表3:
人均现住面积和年龄段的描述统计表
Report
人均现住面积
年龄段
Mean
N
Std.Deviation
25岁以下
29.63721
73
19.025021
25~35岁
20.81472
282
13.597321
35~45岁
18.01224
207
8.205001
45~55岁
19.17514
155
10.337327
55岁以上
22.48000
2
17.705954
Total
20.55481
719
12.728884
表人均现住面积和年龄段的描述统计表是以年龄段为分组变量的统计结果,可以看出,不同年龄段的人均居住面积的有较大差异,人均居住面积最多的26.63721平方米在25岁以下,最少的18.01224平方米在35~45之间。
2,人均居住面积的单样本T检验
表4:
One-SampleStatistics
One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
人均现住面积
719
20.55481
12.728884
.474707
基本统计量分析,如表可知,参与分析的样品数有719,平均值为20.55481,标准差为12.72884,均值误差为0.474707。
表5:
One-SampleTest
One-SampleTest
TestValue=0
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
人均现住面积
43.300
718
.000
20.55481
19.6228
21.4868
从表5可知单样本T检验结果为:
自由度为718,t统计量为43.300,对应的置信水平为0,000,95%的置信区间为(19.6228,21.4868),因T=43.300对应的置信水平为0远小于0.05,因此拒绝原假设。
既人均现住面积与均值20.55481存在显著性差异。
3,现居住面积的独立样本T检验
表6:
IndependentSamplesTest
IndependentSamplesTest
Levene'sTestforEqualityofVariances
t-testforEqualityofMeans
95%ConfidenceIntervaloftheDifference
F
Sig.
t
df
Sig.(2-tailed)
MeanDifference
Std.ErrorDifference
Lower
Upper
现居住面积
Equalvariancesassumed
.
.771
-.
277
.954
-.14787
2.56166
-5.19065
4.89492E0
Equalvariancesnotassumed
-.
184.052
.954
-.14787
2.57729
-5.23270
4.93697E0
表为独立样本T检验的结果,从表中可知,对样本的方差是否相等检验的结果为统计量F=0.,对应的置信水平为0.771,既拒绝原假设,两样本方差不等。
而对于T检验的结果为自由度为277,T=-0.,对应的置信水平为0.954远远大于设置的0.05,因此现居面积不存在显著新差异。
GroupStatistics
购买户型
N
Mean
Std.Deviation
Std.ErrorMean
现居住面积
两室两厅
94
56.0851
20.47378
2.11171
三室一厅
185
56.2330
20.09668
1.47754
表7:
GroupStatistics
从上表中可知,参与分析的样本中两室两厅的有94个,其均值为56.0851,标准差为20.47378,均值误差为2.11171。
三室一厅的有185个,其均值为562330,标准差为20.09668
均值误差为1.47754。
(三)相关分析
1,现居住面积和人居住面积的双变量的相关分析
表8:
现居住面积和人居住面积的双变量的相关分析表
Correlations
现居住面积
人均现住面积
现居住面积
PearsonCorrelation
1
.572**
Sig.(2-tailed)
.000
N
719
719
人均现住面积
Pearson()Correlation
.572**
1
Sig.(2-tailed)
.000
N
719
719
**.Correlationissignificantatthe0.01level(2-tailed).
从现居住面积和人居住面积的双变量的相关分析表可以看出,现居住面积和人居住面积的相关系数为r=0,517,显著性水平为0.000(Sig.(2-tailed)),因此在相关系数旁以两个“**”号进行标记,现居住面积和人居住面积的相关性十分显著。
2,人均居住面积,现居住面,居住类型的偏相关分析
表9:
人均居住面积,现居住面,居住类型的偏相关分表
Correlations
ControlVariables
人均现住面积
家庭类型
现居住面积
-none-a
人均现住面积
Correlation
1.000
-.564
.572
Significance(2-tailed)
.
.000
.000
df
0
717
717
家庭类型
Correlation
-.564
1.000
.169
Significance(2-tailed)
.000
.
.000
df
717
0
717
现居住面积
Correlation
.572
.169
1.000
Significance(2-tailed)
.000
.000
.
df
717
717
0
现居住面积
人均现住面积
Correlation
1.000
-.817
Significance(2-tailed)
.
.000
df
0
716
家庭类型
Correlation
-.817
1.000
Significance(2-tailed)
.000
.
df
716
0
a.Cellscontainzero-order(Pearson)correlations.
从人均居住面积,现居住面,居住类型的偏相关分表可以看出人均居住面积,居住类型偏相关系数的r=-0.564,对应的显著性水平为0.000(Sig.(2-tailed)),既人均居住面积和居住类型为负显著相关。
(四)回归分析
表10:
现居住面积和居住满意度的一元线性回归分析表
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
36018.768
1
36018.768
68.174
.000a
Residual
378817.382
717
528.337
Total
414836.150
718
a.Predictors:
(Constant),住房满意度
b.Dependentvariadble:
现居住面积
从现居住面积和居住满意度的一元线性回归分析表可以看出离差平方和为36018.768,残差平方和为378817.382,而回归平方和为414836.150。
统计量F=68.174,对应的置信水平为0.000,远比0.05要小,因此可以认为现居住面积和居住满意度是显著的。
图6:
正态P-P图
图5:
标准化残差的直方图
标准化残差的直方图,用来表示残差的分布情况。
图6:
正态P-P图
正态P-P图,该图是用观察标准化残差分布是否符合正态分布,如果是,则
图中散点图近似为一条直线,且为对角线重叠。
而图6的结果刚好满足,所以现居住面积服从正态分布。
三、小结
从以上分析可以了解到买房与年龄段,文化程度,就业情况,家庭年收入等有一定的关系。
不同年龄段的人均居住面积的有较大差异,人均居住面积最多的26.63721平方米在25岁以下,最少的18.01224平方米在35~45之间。
这个结果的原因可能是因为在25岁以下的时候还和父母一起居住,而这个时候家庭已到成熟期,故人均居住面积较大,而在35~45岁之间自己的小家庭才是发展期,有小孩儿出生,且事业刚刚稳定,所以人均居住面积会相对较小。
不同的文化程度也会影响居住面积,大学学历的现居住面积较大,其最大值,最小值以及均值均大于其他三种学历。
也可以知道初中学历,高中,大学均有离群值,而研究生及以上没有离群值。
人均居住面积和居住类型为负显著相关,现居住面积和人居住面积的相关性是十分显著,且现居住面积和居住满意度业业是显著的。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 买房 数据 分析 实施 报告