数据分析与R语言_001.pdf
- 文档编号:3209858
- 上传时间:2022-11-20
- 格式:PDF
- 页数:53
- 大小:1.58MB
数据分析与R语言_001.pdf
《数据分析与R语言_001.pdf》由会员分享,可在线阅读,更多相关《数据分析与R语言_001.pdf(53页珍藏版)》请在冰豆网上搜索。
DATAGURU专业数据分析网站2012.5.10数据分析与R语言第2周DATAGURU专业数据分析网站2012.5.10数据可视化的重要性2DATAGURU专业数据分析网站2012.5.10综合性例子模拟产生统计专业同学的名单(学号区分),记录数学分析,线性代数,概率统计三科成绩,然后进行一些统计分析3DATAGURU专业数据分析网站2012.5.10模拟成绩用runif和rnorm4DATAGURU专业数据分析网站2012.5.10模拟成绩5DATAGURU专业数据分析网站2012.5.10合成数据框并保存到硬盘data.frame()write.table6DATAGURU专业数据分析网站2012.5.10计算各科平均分函数mean(),colMeans(),apply()7DATAGURU专业数据分析网站2012.5.10求各科最高最低分函数max(),min(),apply()8DATAGURU专业数据分析网站2012.5.10求出每人总分9DATAGURU专业数据分析网站2012.5.10总分最高的同学10DATAGURU专业数据分析网站2012.5.10对x1进行直方图分析绘制直方图函数hist()11DATAGURU专业数据分析网站2012.5.10探索各科成绩的关联关系散点图绘制函数plot()12DATAGURU专业数据分析网站2012.5.10列联表分析列联函数table(),柱状图绘制函数barplot()13DATAGURU专业数据分析网站2012.5.10饼图饼图绘制函数pie()14DATAGURU专业数据分析网站2012.5.10箱尾图箱子的上下横线为样本的25%和75%分位数箱子中间的横线为样本的中位数上下延伸的直线称为尾线,尾线的尽头为最高值和最低值异常值15DATAGURU专业数据分析网站2012.5.10箱线图boxplot(x2:
4,col=c(red,green,blue),notch=T)16DATAGURU专业数据分析网站2012.5.10箱尾图水平放置的箱尾图17DATAGURU专业数据分析网站2012.5.10星相图每个观测单位的数值表示为一个图形每个图的每个角表示一个变量,字符串类型会标注在图的下方角线的长度表达值的大小18DATAGURU专业数据分析网站2012.5.10星相图19DATAGURU专业数据分析网站2012.5.10脸谱图安装aplpack包20DATAGURU专业数据分析网站2012.5.10脸谱图用五官的宽度和高度来描绘数值人对脸谱高度敏感和强记忆适合较少样本的情况21DATAGURU专业数据分析网站2012.5.10其它脸谱图安装TeachingDemos包22DATAGURU专业数据分析网站2012.5.10茎叶图23DATAGURU专业数据分析网站2012.5.10QQ图可用于判断是否正态分布直线的斜率是标准差,截距是均值点的散布越接近直线,则越接近正态分布24DATAGURU专业数据分析网站2012.5.10散点图散点图的进一步设置plot(x$x1,x$x2,main=数学分析与线性代数成绩的关系,xlab=数学分析,ylab=线性代数,xlim=c(0,100),ylim=c(0,100),xaxs=i,#Setxaxisstyleasinternalyaxs=i,#Setyaxisstyleasinternalcol=red,#Setthecolorofplottingsymboltoredpch=19)#Settheplottingsymboltofilleddots25DATAGURU专业数据分析网站2012.5.10散点图连线图a=c(2,3,4,5,6)b=c(4,7,8,9,12)plot(a,b,type=l)26DATAGURU专业数据分析网站2012.5.10散点图多条曲线的效果plot(rain$Tokyo,type=l,col=red,ylim=c(0,300),main=MonthlyRainfallinmajorcities,xlab=MonthofYear,ylab=Rainfall(mm),lwd=2)lines(rain$NewYork,type=l,col=blue,lwd=2)lines(rain$London,type=l,col=green,lwd=2)lines(rain$Berlin,type=l,col=orange,lwd=2)27DATAGURU专业数据分析网站2012.5.10密度图函数density()plot(density(rnorm(1000)28DATAGURU专业数据分析网站2012.5.10R内置数据集函数data()列出内置数据29DATAGURU专业数据分析网站2012.5.10热力图利用内置的mtcars数据集绘制heatmap(as.matrix(mtcars),Rowv=NA,Colv=NA,col=heat.colors(256),scale=column,margins=c(2,8),main=CarcharacteristicsbyModel)30DATAGURU专业数据分析网站2012.5.10Iris(鸢尾花)数据集Sepal花萼Petal花瓣Species种属31DATAGURU专业数据分析网站2012.5.10向日葵散点图用来克服散点图中数据点重叠问题在有重叠的地方用一朵“向日葵花”的花瓣数目来表示重叠数据的个数sunflowerplot(iris,3:
4,col=gold,seg.col=gold)32DATAGURU专业数据分析网站2012.5.10散点图集遍历样本中全部的变量配对画出二元图直观地了解所有变量之间的关系pairs(iris,1:
4)33DATAGURU专业数据分析网站2012.5.10散点图集用plot也可以实现同样的效果plot(iris,1:
4,main=Relationshipsbetweencharacteristicsofirisflowers,pch=19,col=blue,cex=0.9)34DATAGURU专业数据分析网站2012.5.10散点图集利用par()在同一个device输出多个散点图Par命令博大精深,用于设置绘图参数,help(par)par(mfrow=c(3,1)plot(x1,x2);plot(x2,x3);plot(x3,x1)35DATAGURU专业数据分析网站2012.5.10关于绘图参数help(par)有哪些颜色?
colors()36DATAGURU专业数据分析网站2012.5.10关于绘图参数绘图设备37DATAGURU专业数据分析网站2012.5.10关于绘图参数位置控制参数mai参数:
Anumericalvectoroftheformc(bottom,left,top,right)whichgivesthemarginsizespecifiedininches.oma参数:
Avectoroftheformc(bottom,left,top,right)givingthesizeoftheoutermarginsinlinesoftext.38DATAGURU专业数据分析网站2012.5.10三维散点图安装scatterplot3d包scatterplot3d(x2:
4)39DATAGURU专业数据分析网站2012.5.10三维作图x-y-seq(-2*pi,2*pi,pi/15)f-function(x,y)sin(x)*sin(y)z-outer(x,y,f)contour(x,y,z,col=blue)persp(x,y,z,theta=30,phi=30,expand=0.7,col=lightblue)40DATAGURU专业数据分析网站2012.5.10调和曲线图41DATAGURU专业数据分析网站2012.5.10调和曲线图unison.r的代码自定义函数调和曲线用于聚类判断非常方便42DATAGURU专业数据分析网站2012.5.10地图安装maps包map(state,interior=FALSE)map(state,boundary=FALSE,col=red,add=TRUE)map(world,fill=TRUE,col=heat.colors(10)43DATAGURU专业数据分析网站2012.5.10R实验:
社交数据可视化先下载安装maps包和geosphere包并加载library(maps)library(geosphere)画出美国地图map(state)44DATAGURU专业数据分析网站2012.5.10R实验:
社交数据可视化画世界地图map(world)45DATAGURU专业数据分析网站2012.5.10R实验:
社交数据可视化通过设置坐标范围使焦点集中在美国周边,并且设置一些有关颜色xlim-c(-171.738281,-56.601563)ylim-c(12.039321,71.856229)map(world,col=#f2f2f2,fill=TRUE,bg=white,lwd=0.05,xlim=xlim,ylim=ylim)46DATAGURU专业数据分析网站2012.5.10R实验:
社交数据可视化画一条弧线连线,表示社交关系lat_ca-39.164141lon_ca-121.640625lat_me-45.213004lon_me-68.906250inter-gcIntermediate(c(lon_ca,lat_ca),c(lon_me,lat_me),n=50,addStartEnd=TRUE)lines(inter)47DATAGURU专业数据分析网站2012.5.10R实验:
社交数据可视化继续画弧线lat_tx-29.954935lon_tx-98.701172inter2-gcIntermediate(c(lon_ca,lat_ca),c(lon_tx,lat_tx),n=50,addStartEnd=TRUE)lines(inter2,col=red)48DATAGURU专业数据分析网站2012.5.10R实验:
社交数据可视化装载数据airports-read.csv(http:
/DATAGURU专业数据分析网站2012.5.10R实验:
社交数据可视化画出多重联系map(world,col=#f2f2f2,fill=TRUE,bg=white,lwd=0.05,xlim=xlim,ylim=ylim)fsub-flightsflights$airline=AA,for(jin1:
length(fsub$airline)air1-airportsairports$iata=fsubj,$airport1,air2-airportsairports$iata=fsubj,$airport2,inter-gcIntermediate(c(air11,$long,air11,$lat),c(air21,$long,air21,$lat),n=100,addStartEnd=TRUE)lines(inter,col=black,lwd=0.8)50DATAGURU专
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 语言 _001
![提示](https://static.bdocx.com/images/bang_tan.gif)