原创R语言移动用户通话时间可视化分析报告附代码数据文档格式.docx
- 文档编号:14021971
- 上传时间:2022-10-17
- 格式:DOCX
- 页数:13
- 大小:85.57KB
原创R语言移动用户通话时间可视化分析报告附代码数据文档格式.docx
《原创R语言移动用户通话时间可视化分析报告附代码数据文档格式.docx》由会员分享,可在线阅读,更多相关《原创R语言移动用户通话时间可视化分析报告附代码数据文档格式.docx(13页珍藏版)》请在冰豆网上搜索。
1Mean:
5.574^Lia:
2Ayala(ID61):
5:
13rdQu.:
8.000^Rebekah:
2Baldwin(ID71):
6:
1Max.:
10.000^Savanah:
2Bar(ID28)ron:
(Other):
189(Other):
183(Other):
189
ZIPPhoneCallIDTime
Min.:
10005212-220-3311:
1Min.:
425201/01/0812:
32:
1stQu.:
10141212-321-1690:
430701/02/0813:
17:
Median:
10471212-335-8571:
440401/02/0814:
54:
Mean:
10736212-340-5502:
448101/03/0815:
52:
3rdQu.:
11356212-358-3769:
457001/04/0813:
19:
Max.:
11697212-403-5255:
528401/05/0809:
09:
(Other):
189
通话时间的分配
数据可视化
p<
-plot_ly()
-add_trace(p,hole=trace1$hole,hoverinfo=trace1$hoverinfo,labels=trace1$labels,labelssrc=trace1$labelssrc,marker=trace1$marker,name=trace1$name,opacity=trace1$opacity,rotation=trace1$rotation,textfont=trace1$textfont,textinfo=trace1$textinfo,textposition=trace1$textposition,type=trace1$type,uid=trace1$uid,values=trace1$values,valuessrc=trace1$valuessrc)
-layout(p,autosize=layout$autosize,dragmode=layout$dragmode,font=layout$font,legend=layout$legend,margin=layout$margin,showlegend=layout$showlegend,title=layout$title,titlefont=layout$titlefont,xaxis=layout$xaxis,yaxis=layout$yaxis)
p
从饼图中我们可以发现1月份的通话数量最多,2月份和3月份的通话次数相当。
其余月份减少。
从通话年份来看,样本大多是08年的样本,09年的样本较少。
从每天的通话数量来看,17号和7号的通话数量最多,然后是20号,19号。
同时可以看到27号的通话时间最少。
Code:
data=read.delim("
raw_data.csv"
sep="
#"
)
head(data)
##PersonIDFirstNameLastNameZIPPhoneCallID
##1127^AlexiaRasmuss(ID127)en11422718-534-24034252
##298^BrendenRasmuss(ID98)en10015646-812-72984253
##394^BeauWare(ID94)10013646-391-99264254
##4127^AlexiaRa(ID127)smussen11422718-534-24034255
##5156^JacobyCo(ID156)ok10045917-808-61864256
##6139^QuintenHubba(ID139)rd10016917-687-22564257
##Time
##101/01/0812:
32
##201/02/0813:
17
##301/02/0814:
54
##401/03/0815:
##501/03/0815:
52
##601/04/0813:
19
#使用R清除hw2_raw_data.csv中的原始数据,以获取唯一的PersonID,FirstName,#LastName,ZIP和Phone,还包括一列显示每个人被调用多少次的列。
#清理数据data=unique(data)
cleandata=data[1,]for(iinunique(data$PersonID)){
cleandata=rbind(cleandata,data[which(data$PersonID==i),][1,])
#cleandata$count=table(data$PersonID)
}
cleandata=cleandata[-1,]
count=as.data.frame(table(data$PersonID))
colnames(count)=c("
PersonID"
"
count"
cleandata=merge(count,cleandata,by="
##最终结果:
head(cleandata)
##PersonIDcountFirstNameLastNameZIPPhoneCallID
##117^JaylenChriste(ID1)nsen10006646-376-44664314
##2109^AliyaHoffman(ID10)11366917-613-64214279
##310010^BransonIng(ID100)ram10026212-780-24674439
##41019^AnabellaNi(ID101)xon11249212-523-65024331
##51022^AnabelleWi(ID102)lson11211917-728-86944509
##61033^FabianBryan(ID103)10168646-523-31214496
##101/29/0811:
##201/15/0808:
44
##303/25/0813:
59
##402/06/0812:
01
##504/30/0813:
09
##604/23/0815:
31
#摘要统计数据summary(cleandata)
##PersonIDcountFirstNameLastName
##1:
##2:
##3:
##4:
##5:
##6:
##(Other):
##ZIPPhoneCallIDTime
##Min.:
##1stQu.:
##Median:
##Mean:
##3rdQu.:
##Max.:
##(Other):
#通话时间的分配cleandata$Time=as.character(cleandata$Time)cleandata$Time=strsplit(cleandata$Time,"
"
)cleandata$date=unlist(lapply(cleandata$Time,function(x)x[[1]]))cleandata$date=as.Date(cleandata$date,format="
%m/%d/%y"
)cleandata$time2=unlist(lapply(cleandata$Time,function(x)x[[2]]))
mtab<
-table(format(as.Date(cleandata$date),"
%m"
))
#数据可视化library(plotly)
##Warning:
package'
plotly'
wasbuiltunderRversion3.3.3
##Loadingrequiredpackage:
ggplot2
ggplot2'
##
##Attachingpackage:
'
##Thefollowingobjectismaskedfrom'
package:
:
##last_plot
stats'
##filter
graphics'
##layout
trace1<
-list(
hole=0.67,
hoverinfo="
label+value+text+percent
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 原创 语言 移动用户 通话时间 可视化 分析 报告 代码 数据