河北省主要城市空气质量的分析.docx
- 文档编号:10631028
- 上传时间:2023-02-22
- 格式:DOCX
- 页数:21
- 大小:671.25KB
河北省主要城市空气质量的分析.docx
《河北省主要城市空气质量的分析.docx》由会员分享,可在线阅读,更多相关《河北省主要城市空气质量的分析.docx(21页珍藏版)》请在冰豆网上搜索。
河北省主要城市空气质量的分析
廊坊师范学院
本科生毕业论文
题目:
河北省主要城市空气质量的分析
学生姓名:
张永华
导师姓名:
朱红霞
院别:
数学与信息科学学院
系 别:
数学系
专业:
信息与计算科学
年级:
2008级本科2班
学号:
08040342039
完成日期2012年4月28日
廊坊师范学院本科生毕业论文
论文题目:
河北省主要城市空气质量的分析
论文摘要:
随着科学技术的发展和人们生活水平的提高,空气污染问题已经成为当今世界各国普遍关注的问题之一.对空气污染的防治和检测成为了各主要城市的重要任务.spss的描述性分析、非参数检验、时间序列分析等分析方法为空气污染的分析提供了有效的工具.本文对河北省11个市级城市在2011年1-9月份的空气污染指数利用SPSS软件进行描述性统计分析、非参数检验,指数平滑分析,先是对全省各主要城市的空气质量进行横向比较,分析我省当前空气质量的总体情况和地区差异,然后对代表性城市空气污染情况进行分析和预测,为国家环境政策的制定提供科学合理的依据.
关键词:
城市空气质量;描述性分析;非参数检验;时间序列分析;SPSS
Title:
AnalysisOfAirQualityInMajorCitiesInHebeiProvince
Abstract:
Withthedevelopmentofscienceandtechnologyandpeople'slivingstandardsimprove,theproblemofairpollutionhasbecomeoneofthecommonconcernissuesintheworld.Preventionanddetectionofairpollutionhasbecometheimportanttaskofallthemajorcities.Thedescriptiveanalysis,non-parametrictests,timeseriesanalysisandotheranalyticalmethodsinSPSSprovideaneffectivetoolfortheanalysisofairpollution.InthisarticlewemadeprocessingonAirPollutionIndex(API)of11prefecture-levelcitysinHebeiProvinceinJanuary-September2011withdescriptiveanalysis,non-parametrictestsandexponentialsmoothinganalysisinSPSS.First,madehorizontalcomparisononairqualityoftheprovince'smajorcitiestoanalyzetheoverallsituationoftheprovince'sairqualityandregionaldifferences,andthenanalysisandforecasttheairpollutionsituationoftherepresentativecityandprovidescientificandrationalbasisfortheformulationofnationalenvironmentalpolicy.
Keywords:
UrbanAirQuality;Descriptiveanalysis;Non-parametrictests;Timeseriesanalysis;SPSS
目录
引言1
1.几种分析方法的介绍2
1.1描述性统计分析2
1.2非参数检验3
1.3时间序列分析法4
2.几种分析方法实现的基本步骤与逻辑框图5
2.1描述性分析的步骤5
2.2描述性分析的逻辑图6
2.3时间序列分析的步骤6
2.4时间序列分析的逻辑图6
3.河北省各主要城市空气质量分析在SPSS上的应用及图表分析7
3.1模型构成及数据来源7
3.2spss实现7
4.结论15
5.建议16
6.结束语16
参考文献17
随着社会经济的发展,城市工业化水平的提高,在我们的日常生活环境中,尤其是在集中了大量的工厂、车辆、人口的城市地区,空气污染问题[1]已经成为一个日益严重的社会和科学问题,是当前世界各国普遍关注的问题之一,是21世纪人类面临的重大挑战.空气质量因为车辆、船舶、飞机的尾气、工业企业生产排放、居民生活和取暖、垃圾焚烧等原因逐渐开始恶化,温室效应,大气污染,臭氧空洞,酸雨蔓延,气候现象变化异常等现象越来越严重.空气污染威胁着人类的日常生活,危害人体健康,给人们的工作带来不便,影响并危害各种生物的生存,直接或间接地损害设备、建筑物.这不仅给经济发展和人民生活带来损失,更严重的是危害人们身体健康,并贻害子孙后代,破坏了人类赖以健康持久地生存的基本条件[2].为此,我们迫切需要找出一种能够有效的衡量空气质量并且以此为依据制定并实施有效对策的方法来缓解并逐渐消除当今时代的空气污染问题.而数学中的描述性分析、非参数检验、时间序列分析等分析方法为空气污染的分析和检测研究提供了有效的工具,上述分析方法我们可以借助计算机SPSS软件来得以实现[3].
1997年国务院决定对重点城市进行空气质量周报,空气质量周报包括对几种主要污染物的检测状况和结果,以空气污染指数的形式报告.空气污染指数[4]反映了一个城市的污染情况和污染的变动规律,对环保工作的开展具有重要的指导意义.本文以河北省各市级城市为研究对象,通过分析在一定时间内各城市空气质量的各项特性来掌握各城市空气质量的情况,以此研究结果为有力依据为今后的改善治理工作奠定坚实的科学基础.
空气污染指数(AirpollutionIndex,简称API)是评估空气质量状况的一组数字,它能告诉您今天或明天您呼吸的空气是清洁的还是受到污染的,以及您应当注意的健康问题.空气污染指数关注的是吸入受到污染的空气以后几小时或几天内人体健康可能受到的影响[5].空气污染指数划分为0-50、51-100、101-150、151-200、201-250、251-300和大于300七档,对应于空气质量的七个级别,指数越大,级别越高,说明污染越严重,对人体健康的影响也越明显.
空气污染指数为0-50,空气质量级别为I级,空气质量状况属于优.此时不存在空气污染问题,对公众的健康没有任何危害.
空气污染指数为51-100,空气质量级别为II级,空气质量状况属于良.此时空气质量被认为是可以接受的,除极少数对某种污染物特别敏感的人以外,对公众健康没有危害.
空气污染指数为101-150,空气质量级别为III
(1)级,空气质量状况属于轻微污染.此时,对污染物比较敏感的人群,例如儿童和老年人、呼吸道疾病或心脏病患者,以及喜爱户外活动的人,他们的健康状况会受到影响,但对健康人群基本没有影响.
空气污染指数为151-200,空气质量级别为III
(2)级,空气质量状况属于轻度污染.此时,几乎每个人的健康都会受到影响,对敏感人群的不利影响尤为明显.
空气污染指数为201-300,空气质量级别为IV
(1)级和IV
(2)级,空气质量状况属于中度和中度重污染.此时,每个人的健康都会受到比较严重的影响.
空气污染指数大于300,空气质量级别为V级,空气质量状况属于重度污染.此时,所有人的健康都会受到严重影响.
分析思路首先利用SPSS软件[6]中的描述性统计分析的方法[7]对各主要城市空气质量进行横向比较,然后利用非参数检验检验个城市空气污染在年内的分布状况是否具有一致性,判断在全省范围内是否存在影响空气质量的共同因素,随后利用时间序列分析中的指数平滑分析方法对其代表性城市的空气污染状况进行分析并预测未来空气质量的变化趋势.
1.几种分析方法的介绍
1.1描述性统计分析
描述性分析过程主要用于对连续变量做基础性描述[8],主要用于描述变量的基本特征.spss中的描述性分析过程可以生成相关的描述性统计,如:
均值、方差、标准差、峰度、偏度等,可以输入多种类型的统计量,描述性分析过程还可将原始数据转换为z分值并作为变量储存,通过这些描述性计量,我们可以对变量变化的综合特征进行全面了解.
1.1.1描述性统计分析的几种常用统计量类型
1.1.1.1均值
均值最常用的是算术平均数,算术平均数是集中趋势最常用、最重要的测度值.他是将总体标志总量除以总体单位总量而得到的均值[9].算数平均数的基本公式是:
算数平均数=总体标志总量/总体单位总量
(1)
1.1.1.2方差与标准差
方差是总体各单位变量值与其算数平均数的离差平方的算数平均数,方差的平方根就是标准差,与方差不同的是,标准差是具有量纲的,与变量值的计量单位相同,其实际意义要比方差清楚.因此对社会现象进行分析时,往往更注重使用标准差.
方差和标准差的计算有两种形式,简单平均式和加权平均式.
在未分组资料情况下,采用简单平均式
(2)
在资料分组情况下,采用加权平均式
(3)
1.1.1.3峰度
峰度是频数分布曲线与正态分布相比较,顶端的尖峭程度.统计上常用四阶中心矩测定峰度,计算公式如下:
(4)
当a4=3时,分布曲线为正态分布;
当a4<3时,分布曲线为平峰分布;
当a4>3时,分布曲线为尖峰分布.
1.1.1.4偏度
偏度是对分布偏斜方向及程度的测试.测量偏斜的程度需要计算偏态系数.这里只介绍中心矩偏态测度法.常用三阶中心矩除以标准差的三次方,表示数据分布的相对偏斜程度,计算方法如下:
(5)
a3为正,表示分布右偏;为负,表示左偏.
1.1.1.5其他相关统计量
最大值,顾名思义,最大值即样本数据中取最大的数据.
最小值,即样本数据中取值最小的数据.
Z标准化值,Z标准化得分是某一数据与平均数的距离以标准差为单位的测量值[10].其计算公式如下:
(6)
Zi即为Xi的Z标准得分.Z的标准化数据越大,说明它离平均数越远.
标准化值不仅能表明各原始数据在一组数据分布中的相对位置,而且能在不同分布的各组原始数据间进行比较,同时还能接受代数方法的处理.因此标准化值在统计分析中起着重要的作用.
1.2非参数检验
非参数检验[11]是统计分析方法的重要组成部分,又称分布自由检验,是相对于参数检验而言的[12],参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法.但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了.非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法[13].由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验.非参数检验在统计分析和实际工作中具有广泛的应用.非参数检验是不需要对总体进行严格限定的统计推断法,这类检验方法的假设前提比参数检验要少得多并且容易满足.
1.2.1多独立样本的非参数检验
由于本文研究的数据量较多,适合使用多独立样本的非参数检验进行数据分析,所以本文主要介绍一下多样本的非参数检验.多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异[14].多组独立样本是指按独立抽样方式获得的多组样本.
SPSS提供的多独立样本非参数检验的方法主要包括中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验.
1.2.1.1中位数检验
中位数检验通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差异.其原假设是:
多个独立样本来自的多个总体的中位数无显著差异.
基本思想是:
如果多个总体的中位数无显著差异,或者说多个总体有共同的中位数,那么这个共同的中位数应在各样本组中均处在中间位置上.于是,每组样本中大于该中位数或小于该中位数的样本数目应大致相同.
1.2.1.2Kruskal-Wallis检验
Kruskal-Wallis检验实质是两独立样本的曼-惠特尼U检验在多个样本下的推广,也用于检验多个总体的分布是否存在显著差异[15].其原假设是:
多个独立样本来自的多个总体的分布无显著差异.
基本思想是:
首先,将多组样本数据混合并按升序排序,求出各变量值的秩;然后,考察各组秩的均值是否存在显著差异.容易理解:
如果各组秩的均值不存在显著差异,则是多组数据充分混合,数值相差不大的结果,可以认为多个总体的分布无显著差异;反之,如果各组秩的均值存在显著差异,则是多组数据无法混合,某些组的数值普遍偏大,另一些组的数值普遍偏小的结果,可以认为多个总体的分布有显著差异.
1.3时间序列分析法
时间序列分析法是将某种统计指标的数值,按时间先后顺序排到所形成的数列[16].时间序列预测法就是通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后若干年内可能达到的水平.时间序列预测法可用于短期、中期和长期预测.根据对资料分析方法的不同,又可分为:
简单序时平均数法、加权序时平均数法、移动平均法、加权移动平均法、趋势预测法、指数平滑法、季节性趋势预测法、市场寿命周期预测法等[17].本文主要使用指数平滑法对问题进行分析.
1.3.1指数平滑分析
指数平滑法是生产预测中常用的一种方法.指数平滑分析是在移动平均模型基础上发展起来的一种时间序列分析预测法,其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均[18].指数平滑模型的思想是对过去值和当前值进行加权平均、以及对当前的权数进行调整以抵消统计数值的摇摆影响,得到平滑的时间序列.指数平滑法不舍弃过去的数据,但是对过去的数据局给予逐渐减弱的影响程度.
1.3.2指数平滑模型的建立
指数平滑法一般有一次指数平滑法、二次指数平滑法和三次指数平滑法.指数平滑法的预测模型为:
初始值的确定,即第一期的预测值.一般原数列的项数较多时(大于15项),可以选用第一期的观察值或选用比第一期前一期的观察值作为初始值.如果原数列的项数较少时(小于15项),可以选取最初几期(一般为前三期)的平均数作为初始值.指数平滑方法的选用,一般可根据原数列散点图呈现的趋势来确定.如呈现直线趋势,选用二次指数平滑法;如呈现抛物线趋势,选用三次指数平滑法.或者,当时间序列的数据经二次指数平滑处理后,仍有曲率时,应用三次指数平滑法.
1.3.3基本公式
指数平滑法的基本公式是:
St=ayt+(1-a)St-1(7)
式中,St是时间t的平滑值;yt是时间t的实际值;St-1是时间t-1的平滑值;a是平滑常数,其取值范围为[0,1].
2.几种分析方法实现的基本步骤与逻辑框图
2.1描述性分析的步骤
(1)根据研究问题选取自变量、因变量.
(2)确定连续变量的样本个数.(3)进行相关分析(如:
均值、方差、标准差、峰度、偏度等).
(4)得出结果.
(5)根据结果进行进一步深入分析,产生结论.
2.2描述性分析逻辑框图
我们用逻辑框图表示描述性分析模型的建模过程.见图1:
根据研究问题选取自变量、因变量
↓
确定连续变量的样本个数
↓
进行相关分析
↓
得出结果
↓
深入分析,产生结论
图1描述性分析的逻辑框图
2.3时间序列分析步骤
(1)收集历史资料,加以整理,编成时间序列,并根据时间序列绘成统计图.
(2)分析时间序列.时间序列中的每一时期的数值都是由许许多多不同的因素同时发生作用后的综合结果.
(3)求时间序列的长期趋势(T)季节变动(s)和不规则变动(I)的值,并选定近似的数学模式来代表它们.对于数学模式中的诸未知参数,使用合适的技术方法求出其值.
(4)根据相关值进行预测,利用时间序列资料求出长期趋势、季节变动和不规则变动的数学模型后,就可以利用它来预测未来的长期趋势值T和季节变动值s,在可能的情况下预测不规则变动值.
2.4时间序列分析逻辑框图
以下是时间序列滑分析的逻辑框图.见图2:
收集与整理相关历史资料
↓
对资料进行检查鉴别,排成数列
↓
进行相关分析
↓
以此模式去预测将来的情况
图2时间序列分析逻辑框图
3.河北省各主要城市空气质量分析的SPSS实现
3.1模型构成及数据来源
本文收集了河北省11个市级城市(石家庄、张家口、承德、秦皇岛、唐山、保定、沧州、衡水、邢台、邯郸)在2011年1-9月份共9个月的空气污染指数以及省会石家庄在2007-2011年共五年的空气质量指数作为数据资源进行各项分析所收集数据均来自于河北省环保厅官方网站(),数据准确、真实、可靠、具有权威性.
3.2SPSS实现
3.2.1描述性分析的SPSS实现
第一步,向SPSS中导入数据:
图3河北省11个市级城市2011年1月-9月份空气污染指数
第二步,使用SPSS软件分析
描述统计
描述,进入描述对话框,将11个城市均选入变量列表:
图4
图5
输出结果如下表:
表1分析结果
3.2.2非参数检验的SPSS实现
第一步,向SPSS中导入数据:
图6建立变量
图7数据变量导入结果
第二步,使用SPSS软件分析
非参数检验
K个独立样本,进入“多个独立样本检验”对话框:
使“空气污染指数”成为检验变量,使“城市”成为分组变量.
图8
图9
输出结果如下表:
表2结果输出
表3结果输出
3.2.3时间序列分析的指数平滑分析的SPSS实现
第一步,向SPSS中导入数据(数据见附表):
图10建立变量
图11石家庄从2007年1月到2011年12月空气污染指数
第二步,使用SPSS软件分析
数据
定义日期,进入“定义日期”对话框,完成时间变量的定义.
图12
第三步,选择分析
预测
创建模型,进入“时间序列模拟器”对话框,将“污染指数”选入“因变量”,在“方法”下拉列表框中选择“指数平滑模型”.
图13
输出结果如下表:
图14结果输出
4.结论
(1)由表1统计性分析结果我们可以看出,全省所有市级城市空气质量均处于II级范围,其中省会石家庄的空气污染情况最为严重,避暑胜地承德的空气质量最佳,已经接近空气质量优等水平.此外,秦皇岛的每天空气质量状况较为稳定.
(2)表2给出了两个变量的“样本数”、“均值”、“标准差”、”极小值”、“极大值”等描述性统计量,从表中我们对全省的空气质量污染状况可以有一个全局的认识.
(3)表3给出了Kruskal-Wallis检验相关的检验统计量.从表中可以看出,P值为0.000,小于显著性水平.因此,认为11个市级城市的空气污染情况存在显著差异.
(4)由图14污染指数平滑模型的观测值图可以看到石家庄五年间的污染指数序列整体成波动状态,该城市污染指数出现过两次剧烈波动,并且总体上波动比较剧烈,以此可预测石家庄未来一段时间内污染指数还将成呈波动状态.
5.建议
针对上述模型结果,本文特提出以下建议:
第一,政府相关部门应制定相应环境保护政策,确保空气质量处于相对良好并稳定的状态.
第二,社会群众应加强自身觉悟,以实际行动保护环境,为保持良好的空气质量作出自己的贡献.
第三,工厂要改进设备,实现空气污染最小化.
6.结束语
描述性分析、非参数检验、时间序列分析作为多变量统计的分析方法,科学、准确、合理地分析出各省级城市的空气污染状况、各城市之间空气污染的相似性以及代表性城市石家庄未来空气污染的变化趋势,对解决空气污染等自然科学问题有极大的帮助,也希望本文对政府相关政策的制定执行提供指导性作用.
参考文献:
[1]姚富鹏彭锐张琪陈娜.室内环境空气污染对人体的危害及其防治[J].中国环境管理干部学院学报.2009年01期
[2]王宗爽武婷车飞王晟周羽化钱小平.[J]环境科学研究.2010年03期
[3]陈胜可.SPSS统计分析从入门到精通[M].清华大学出版社.2010.8
[4]王小辉刘芸芸.解读空气质量指数与空气污染指数[J].中国科技术语.2011年06期
[5]洪盛茂.当代环境现状[J].中国环境监测.2010年01期
[6]朱建平殷瑞飞.SPSS在统计分析中的应用[M].清华大学出版社.2007.1
[7]邱皓政.量化统计与统计分析[M].重庆大学出版社.2009.3
[8]孙建军成颖.应用数理统计[M].东南大学出版社.2007.8
[9]李玉兰.浅议平均数的应用及其陷阱[J].当代经济.2007年09期
[10]ByrneD,DillonH,TranK,etal.Aninternationalcomparisonoflong-termaveragespeechspectra[J].JAcoustSocAm,1996:
2108.
[11]王星.非参数检验[M].中国人民大学出版社.2005.1
[12]郭祖超.什么叫参数检验和非参数检验[M].中国卫生统计.2008年02期
[13]HIRSCHRM,SLACKJR.Non-parametrictrendtestforseasonaldatawithserialdependence[J].WaterResouRes,1984,20(6):
727-732.
[14]朱五英.关于刻度参数的两样本的检验[J].安徽电子信息职业技术学院学报.2006年02期
[15]曾艳李桂花庄刘.完全随机设计两样本的Wilcoxon检验与K-S检验功效比较[J].中国卫生统计.2011年28期
[16]何书院.时间序列分析[M].北京大学出版社.2003
[17]杜永壮王健.季节时间序列理论与应用[M].南开大学出版社.2008.6
[18]余国浩蔡远文.自适应指数平滑法预测遥测数据实时趋势研究[J].装备指挥技术学院学报.2007年02期
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 河北省 主要 城市 空气质量 分析