中国各城市空气质量的聚类分析Word下载.docx
- 文档编号:13992421
- 上传时间:2022-10-16
- 格式:DOCX
- 页数:13
- 大小:40.81KB
中国各城市空气质量的聚类分析Word下载.docx
《中国各城市空气质量的聚类分析Word下载.docx》由会员分享,可在线阅读,更多相关《中国各城市空气质量的聚类分析Word下载.docx(13页珍藏版)》请在冰豆网上搜索。
105
68
154
唐山
114
69
115
秦皇岛
60
47
65
邯郸
95
58
139
邢台
113
160
保定
135
张家口
51
32
40
承德
37
35
49
沧州
31
102
廊坊
46
48
110
衡水
122
太原
80
43
81
呼和浩特
57
沈阳
90
78
大连
34
52
长春
44
73
哈尔滨
上海
24
62
南京
55
无锡
75
徐州
77
常州
41
72
苏州
53
70
南通
28
36
连云港
67
淮安
79
盐城
29
扬州
镇江
30
42
泰州
宿迁
33
74
杭州
宁波
22
温州
23
嘉兴
湖州
绍兴
38
71
金华
衢州
舟山
10
台州
17
丽水
19
合肥
39
88
福州
11
厦门
20
南昌
济南
61
青岛
郑州
108
武汉
94
长沙
83
广州
深圳
珠海
13
佛山
江门
27
肇庆
惠州
16
东莞
45
中山
南宁
海口
7
重庆
成都
63
贵阳
昆明
拉萨
9
西安
兰州
西宁
银川
乌鲁木齐
2.1等价关系法
将每个城市的三种污染物浓度值作为其数据表征,根据最小最大法[6]建立74个城市之间的相似关系矩阵,得74×
74矩阵,然后利用平方法求得相似矩阵的传递闭包,最后取不同的λ值将矩阵中的元素分为不同的类。
相关程序代码见附录I,部分分类结果如表2所示。
表2等价关系法部分分类结果
λ=0.0423
所有城市为一类
λ=0.4362
海口
北京,·
·
,乌鲁木齐
λ=0.87
石家庄
唐山
邢台
λ=0.89
北京
武汉
成都
λ=0.9
λ=0.91
上表中,位于同一单元格内的城市为一类,位于同一行不同单元格内的城市属不同的类。
从表中可看出,随着λ值从0开始增加,海口为第一个脱离大类的城市,这意味着海口的污染程度与其它城市的平均污染程度相差最远。
由于污染物浓度值越大意味着污染程度越严重,这里定义城市的污染指数为3种污染物浓度值的代数平均,则得海口市的污染指数为17,而其它城市的平均污染指数为52.5,因此可认为海口是全国空气质量最好的城市。
另一方面,当λ值增大至0.9附近时,石家庄和邢台依然分在同一类中,说明石家庄和邢台的空气污染程度极为接近,而邢台的污染指数为114,位于所有城市之首,因此石家庄和邢台是全国空气污染最严重的两个城市。
当λ在0.87~0.91之间时,北京、武汉、成都、乌鲁木齐四个城市始终属于同一类,说明武汉、成都、乌鲁木齐的空气污染状况与北京比较接近。
图1给出了几个典型城市的污染物浓度值与全国平均水平的比较情况,从图中依然可以看出,石家庄、唐山、邢台和邯郸的污染程度明显高于全国城市的平均水平,而北京的PM2.5指标值也高于全国平均水平,北京近年来的雾霾情况反映了这一点。
图1几个典型城市的污染物浓度值
2.2.Kmeans分类方法
Kmeans算法[7]是一种基于质心簇的分类方法,首先在元素当中任意挑选k个元素作为初始质心,根据欧氏距离确定与每个元素相距最近的质心,并将每个元素与最近的质心归为一类,接下来再次计算每一簇的质心,再次重新归类,以此循环直至质心不再变化,算法可表示如下:
1)初始化-确定聚类数和聚类中心
2)计算所有样本与聚类中心的距离
3)按照最小距离原则对各个样本进行聚类
4)重新计算聚类中心
5)重复1-4,直到聚类中心不再改变
由于初始质心的数量由用户自定义,所以最终分成的组数也是随意的,表3给出了划分为9组和5组的部分结果,相关程序代码参见附录Ⅱ。
表3Kmeans法部分分类结果
承德
大连
上海
宁波
温州
台州
丽水
…
舟山
福州
厦门
深圳
珠海
惠州
石家庄
邯郸
天津
沧州
廊坊
郑州
西安
哈尔滨
南京
无锡
秦皇岛
张家口
长春
徐州
青岛
西宁
保定
衡水
济南
南通
连云港
淮安
盐城
扬州
镇江
泰州
太原
沈阳
银川
江门
常州
苏州
从表中可看出,Kmeans方法分类结果中,北京、武汉、成都、乌鲁木齐同样属于同一类,类似地,石家庄和邢台也属同类,这一结果与等价关系法形成互相印证。
3.结论
1)等价关系法和kmeans算法能够有效地将样本分类
2)聚类分析显示海口是空气最好的城市
3)石家庄、邯郸、邢台和唐山空气质量较差的城市
4)北京的空气质量同武汉、成都、乌鲁木齐相近
4.人员分工
数据的收集和整理
张文平、于鹏
程序的编制
任文希,彭炽,于鹏
结果分析
彭可文、张文平
PPT制作
彭炽,李冉,任文希
报告编写
李冉、彭可文
附录I等价关系法程序代码
functionr_sol=Cluster(lamda,r_equ)
%WrittenbyWensiJen,2016.03.22
%求截矩阵
[mn]=size(r_equ);
r_tru=0*ones(m);
fori3=1:
m
forj3=1:
ifr_equ(i3,j3)>
=lamda
r_tru(i3,j3)=1;
else
r_tru(i3,j3)=0;
end
end
%聚类
[m1,n1]=size(r_tru);
m1
var4=0;
n1
if(r_tru(i3,j3)==1)%找到每一行的元素1
var4=var4+1;
r_find(i3,var4)=j3;
%把每一行找到的元素1的列下标顺次储存在矩阵的每一行中
end
end
[m2,n2]=size(r_find);
fori4=1:
m2
forj4=2:
n2
if(r_find(i4,j4)~=0)
r_find(r_find(i4,j4),:
)=0;
%将相同行只保留一个其他变为零行
var5=0;
fori5=1:
m2
if(sum(r_find(i5,:
)))~=0
var5=var5+1;
r_sol(var5,:
)=r_find(i5,:
);
[mn]=size(u);
%数据标准化—极差变换
fori=1:
forj=1:
n
u_nor(i,j)=(u(i,j)-min(u(:
j)))/(max(u(:
j))-min(u(:
j)));
%建立相似关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国 城市 空气质量 聚类分析
![提示](https://static.bdocx.com/images/bang_tan.gif)