应用统计学课程设计报告书.docx
- 文档编号:7347594
- 上传时间:2023-01-23
- 格式:DOCX
- 页数:23
- 大小:139.42KB
应用统计学课程设计报告书.docx
《应用统计学课程设计报告书.docx》由会员分享,可在线阅读,更多相关《应用统计学课程设计报告书.docx(23页珍藏版)》请在冰豆网上搜索。
应用统计学课程设计报告书
目录
12.2描述性分析1
12.2.1频数分析1
12.2.2描述性分析2
12.3均值比较和t检验3
12.3.1Means(均值)过程3
12.3.2单一样本t检验4
12.3.3双样本t检验5
12.4方差分析7
12.5相关分析8
12.5.1相关分析的原理及应用8
12.5.2偏相关分析9
12.6回归分析10
12.6.1一元线性回归分析10
12.6.2多元线性回归分析12
12.7时间序列的曲估计…………………………………………………………12
.
12.8统计图的绘制16
12.8.1条形图16
12.8.2线图17
12.8.3散点图18
12.2描述性分析
12.2.1频数分析
从结果中可以看出,第一产业消费均值为63.4989元、平均标准误差为2.40439、中位数为64.6800元、众数为44.00元、标准差为10.20097元、方差为104.060元、偏度为-0.403元、片度标准误差为-0.536元、峰度为-0.462元、峰度标准误差为1.038元、全距为34.55元、最小值为44.00.
Statistics
第一产业
N
Valid
18
Missing
0
Mean
63.4989
Std.ErrorofMean
2.40439
Median
64.6800
Mode
44.00(a)
Std.Deviation
10.20097
Variance
104.060
Skewness
-.403
Std.ErrorofSkewness
.536
Kurtosis
-.462
Std.ErrorofKurtosis
1.038
Range
34.55
Minimum
44.00
Maximum
78.55
Sum
1142.98
aMultiplemodesexist.Thesmallestvalueisshown
第一产业
Frequency
Percent
ValidPercent
CumulativePercent
Valid
44.00
1
5.6
5.6
5.6
44.76
1
5.6
5.6
11.1
53.61
1
5.6
5.6
16.7
55.70
1
5.6
5.6
22.2
56.99
1
5.6
5.6
27.8
58.17
1
5.6
5.6
33.3
58.86
1
5.6
5.6
38.9
62.00
1
5.6
5.6
44.4
64.12
1
5.6
5.6
50.0
65.24
1
5.6
5.6
55.6
65.80
1
5.6
5.6
61.1
68.83
1
5.6
5.6
66.7
69.30
1
5.6
5.6
72.2
70.72
1
5.6
5.6
77.8
73.28
1
5.6
5.6
83.3
76.41
1
5.6
5.6
88.9
76.64
1
5.6
5.6
94.4
78.55
1
5.6
5.6
100.0
Total
18
100.0
100.0
12.2.2描述性分析
利用SPSS求第一产业的Z分数,在数据窗口中,新变量“Z第一产业”表示“第一产业”Z分数。
如图所示DescriptiveStatistics
N
Mean
Std.Deviation
Variance
第一产业
18
63.4989
10.20097
104.060
ValidN(listwise)
18
12.3均值比较和t检验
12.3.1Means(均值)过程
Means过程的结果输出较简单,在结果输出窗口中包含以下输出表。
Cases
Included
Excluded
Total
N
Percent
N
Percent
N
Percent
18
100.0%
0
.0%
18
100.0%
Report
生活消费
世纪
Mean
N
Std.Deviation
Variance
20
238.3300
10
41.42102
1715.701
21
418.5950
8
80.12879
6420.624
Total
318.4478
18
109.76177
12047.646
ANOVATable
SumofSquares
df
MeanSquare
F
Sig.
生活消费*世纪
BetweenGroups
(Combined)
144424.312
1
144424.312
38.267
.000
WithinGroups
60385.676
16
3774.105
Total
204809.988
17
MeasuresofAssociation
Eta
EtaSquared
生活消费*世纪
.840
.705
(1)处理样本数统计,如图所示。
其中Ilude栏表示参加分析计算的样本数,从表中可知全部样本共有18个参考分析,占到全部样本的100%,即分析计算中没有因数据缺测或其他原因等导致的exclued。
(2)变量分组统计结果,如图所示,可以看出生活消费20世纪的平均值为238.3300,标准差41.42102,,21世准差纪平均值为418.5950,标准差为80.12879。
结果表明生活消费两个世纪里有很大差异,21世纪比20世纪的生活消费明显高
12.3.2单一样本t检验
One-sampleTTest过程的输出比较简单,在结果输出窗口中包含描述性统计表和t检验表。
(1)输出结果第一个表,基本描述性统计量表,从表中可知,参与分析的样品为18,平均消费量为2784.616。
标准差为816.63712,均值误差为192.48321。
(2)输出结果第二个表,单一样本t检验表,从表中可知,自由度df=17,根据公式计算的t值等于4.076。
对应的临界置信水平为0.001。
95%的置信区间为(378.5120,1190.7202)。
计算的t值对应的临界置信水平远远小于的设置的0.05,因此拒绝原假设Ho,表明生活消费与原设想水平存在明显差异。
如图
One-SampleStatistics
N
Mean
Std.Deviation
Std.ErrorMean
能源终端消费
18
2784.6161
816.63712
192.48321
One-SampleTest
TestValue=2000
t
df
Sig.(2-tailed)
MeanDifference
95%ConfidenceIntervaloftheDifference
Lower
Upper
Lower
Upper
Lower
Upper
能源终端消费
4.076
17
.001
784.61611
378.5120
1190.7202
12.3.3双样本t检验
Independent-SamplesTTest的输出比较简单,在结果输出窗口中包含描述性统计表和t检验表两个输出结果如图所示
,
(1)描述性统计表。
给出了一些基本描述性统计量。
由输出结果可以看出,连个世纪生活消费的平均值分别为238.33,418.5950,标准差分别为41.42102,80.12879,均值误差分别为13.09848,28.32981。
(2)T检验表,表示双样本T检验结果,F的相伴概率为3.986,大于显著性水平0.05.,接受方差相等的零假设,可疑认为两个世纪里的生活消费方差无显著性差异,然后看方差相等时的t检验结果。
也就是第一行方差相等的t检验结果,t统计量的相伴概率为0.000小于0.05,不接受t检验的零假设,也就是说领个世纪的生活消费平均值存在差异。
Descriptives
能源终端消费量
N
Mean
Std.Deviation
Std.Error
95%ConfidenceIntervalforMean
Minimum
Maximum
LowerBound
UpperBound
LowerBound
UpperBound
LowerBound
UpperBound
LowerBound
UpperBound
186.83
1
2250.8500
.
.
.
.
2250.85
2250.85
212.33
1
1961.5800
.
.
.
.
1961.58
1961.58
214.55
1
2233.0600
.
.
.
.
2233.06
2233.06
218.73
1
2539.4600
.
.
.
.
2539.46
2539.46
219.09
1
2062.3500
.
.
.
.
2062.35
2062.35
221.61
1
1920.6100
.
.
.
.
1920.61
1920.61
241.47
1
2312.7900
.
.
.
.
2312.79
2312.79
256.52
1
2374.0700
.
.
.
.
2374.07
2374.07
283.82
1
2353.7100
.
.
.
.
2353.71
2353.71
290.12
1
2553.6000
.
.
.
.
2553.60
2553.60
328.35
1
2352.2100
.
.
.
.
2352.21
2352.21
352.66
1
2724.3200
.
.
.
.
2724.32
2724.32
378.04
1
2966.5600
.
.
.
.
2966.56
2966.56
399.80
1
3084.4900
.
.
.
.
3084.49
3084.49
426.41
1
3522.1500
.
.
.
.
3522.15
3522.15
473.99
1
3901.2800
.
.
.
.
3901.28
3901.28
493.76
1
4294.9300
.
.
.
.
4294.93
4294.93
533.98
1
4715.0700
.
.
.
.
4715.07
4715.07
Total
18
2784.6161
816.63712
192.48321
2378.5120
3190.7202
1920.61
4715.07
[DataSet1]
ANOVA
能源终端消费量
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
(Combined)
11337235.100
17
666896.182
.
.
LinearTerm
Contrast
10139187.127
1
10139187.127
.
Deviation
1198047.973
16
74877.998
.
WithinGroups
.000
0
.
Total
11337235.100
17
Correlations
12.4方差分析
结果解读:
我重点解读描述性统计表.方差分析表.各族均值折线图
(1)输出结果文件中的第一个表格为描述性统计量表。
从表中可知,输出的统计量表包括各组样本均值,标准差,标准误差,均值95%置信度区间,最小值和最大值,如各组参与分析的样本数都为1,总样本数为18。
(2)输出结果文件中的第二个表格方差分析表。
总离差平方和为11337235.100,组间离差平方和为11337235.100,组内离差平方和为0,组间离差平方和中能被线性解释的部分为10139187.127,方差检验0,对应的相伴概率为0,小于显著性水平0.05,以此认为18组中至少有一组能与另外一组差异显著。
(3)输出结果图,各组均值折线图,可以看出91和95年的均值相对较少。
Correlations
能源终端消费量
第三产业
能源终端消费量
PearsonCorrelation
1
.934(**)
Sig.(2-tailed)
.000
SumofSquaresandCross-products
11337235.100
2239987.573
Covariance
666896.182
131763.975
N
18
18
第三产业
PearsonCorrelation
.934(**)
1
Sig.(2-tailed)
.000
SumofSquaresandCross-products
2239987.573
506884.345
Covariance
131763.975
29816.726
N
18
18
**Correlationissignificantatthe0.01level(2-tailed).
DescriptiveStatistics
Mean
Std.Deviation
N
能源终端消费量
2784.6161
816.63712
18
第三产业
547.6189
172.67520
18
12.5相关分析
12.5.1相关分析的原理及应用
结果解读:
(1)描述性统计表。
从表中看出,两个变量的样本数都为18,能源终端消费量的均值为2784.6161,标准差为816.63712,;第三产业的均值为547.6189,标准差为172.6752。
相关系数极显著性统计表。
能源终端消费量和第三产业的相关系数r=0.934显著性水平为0.000,因此可见能源终端消费量和第三
(2)产业的相关性十分显著。
DescriptiveStatistics
Mean
Std.Deviation
N
能源终端消费量
2784.6161
816.63712
18
第二产业
1855.0511
551.63183
18
第三产业
547.6189
172.67520
18
Correlations
ControlVariables
能源终端消费量
第二产业
第三产业
-none-(a)
能源终端消费量
Correlation
1.000
.989
.934
Significance(2-tailed)
.
.000
.000
df
0
16
16
第二产业
Correlation
.989
1.000
.875
Significance(2-tailed)
.000
.
.000
df
16
0
16
第三产业
Correlation
.934
.875
1.000
Significance(2-tailed)
.000
.000
.
df
16
16
0
第三产业
能源终端消费量
Correlation
1.000
.993
Significance(2-tailed)
.
.000
df
0
15
第二产业
Correlation
.993
1.000
Significance(2-tailed)
.000
.
df
15
0
(3)aCellscontainzero-order(Pearson)correlations
12.5.2偏相关分析
结果解读:
(1)描述性统计表。
从表中可知,参与分析的能源终端消费量和第三产业,第二产业3个变量的样本数都为18,其中能源终端消费量的均值为2784.6161,标准差为816.63712,。
第三产业的均值为1855.0511,标准差为551.63283,。
第二产业的均值为547.6189,标准差为172.67520。
变量间的相关系数,偏相关系数和显著性检验结果。
能源终端消费量和第二产业的相关系数为0.989,显著性水平为0.000,即能源终端消费量和第二产业是相关的;以第三产业为控制变量,能源终端消费量和第二产业的相关系数为0.993,显著性水平为0.000,可知在扣除第三产业的基础上能源终端消费量和第二产业仍然相关性显著。
ModelSummary(b)
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.934(a)
.873
.865
299.83744
aPredictors:
(Constant),第三产业
bDependentVariable:
能源终端消费量
ANOVA(b)
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
9898795.212
1
9898795.212
110.106
.000(a)
Residual
1438439.888
16
89902.493
Total
11337235.100
17
aPredictors:
(Constant),第三产业
bDependentVariable:
能源终端消费量
Coefficients(a)
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
B
Std.Error
1
(Constant)
364.617
241.212
1.512
.150
第三产业
4.419
.421
.934
10.493
.000
aDependentVariable:
能源终端消费量12
12.6回归分析
12.6.1一元线性回归分析
结果解读:
(1)常用统计量。
相关系数R=0.934,决定系数R2=0.873,而调整绝对系数R2=0.865,回归估计的标准差S=299.83744,模型拟合效果很理想。
(2)方差分析表。
从表中知离差平方和=11337235.100,残差平方和=1438439.888,回归平方和=9898795.212。
回归的显著性检验中,统计量为F=110.106,,对应的置信水平为0.000,小于0.05,因此可认为方程是极显著的。
(3)回归系数分析表。
从表中可以看出,常数项为364.617,回归系数=4.419,回归系数检验统计量t=10.493,相伴概率值为0.000小于0.001。
由此可知回归方程为y=364.617+4.419x
DescriptiveStatistics
Mean
Std.Deviation
N
能源终端消费量
2784.6161
816.63712
18
第二产业
1855.0511
551.63183
18
第三产业
547.6189
172.67520
18
Correlations
能源终端消费量
第二产业
第三产业
PearsonCorrelation
能源终端消费量
1.000
.989
.934
第二产业
.989
1.000
.875
第三产业
.934
.875
1.000
Sig.(1-tailed)
能源终端消费量
.
.000
.000
第二产业
.000
.
.000
第三产业
.000
.000
.
N
能源终端消费量
18
18
18
第二产业
18
18
18
第三产业
18
18
18
VariablesEntered/Removed(b)
Model
VariablesEntered
VariablesRemoved
Method
1
第三产业,第二产业(a)
.
Enter
aAllrequestedvariablesentered.
bDependentVariable:
能源终端消费量
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
1
.999(a)
.998
.998
37.00117
aPredictors:
(Constant),第三产业,第二产业
ANOVA(b)
Model
SumofSquares
df
MeanSquare
F
Sig.
1
Regression
11316698.799
2
5658349.399
4132.937
.000(a)
Residual
20536.302
15
1369.087
Total
11337235.100
17
aPredictors:
(Constant),第三产业,第二产业
bDependentVariable:
能源终端消费量
12.6.2多元线性回归分析
结果解读:
(1)描述统计表。
参与分析的能源终端消费量,第二产业,第三产业的样本数均为18,其对应的均值分别为2784.6161,1855.0511,547.6189,其对应的标准差分别为816.63712,551.63183,172..67520。
(2)相关系数表。
第一栏给出了三个变量两两相关的系数表,因变量能源终端消费量和自变量第二产业的相关系数最大,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 课程设计 报告书