电商平台下用户画像的设计与分析.docx
- 文档编号:23690400
- 上传时间:2023-05-19
- 格式:DOCX
- 页数:53
- 大小:421.27KB
电商平台下用户画像的设计与分析.docx
《电商平台下用户画像的设计与分析.docx》由会员分享,可在线阅读,更多相关《电商平台下用户画像的设计与分析.docx(53页珍藏版)》请在冰豆网上搜索。
电商平台下用户画像的设计与分析
电商平台下用户画像的设计与实现
专业:
计算机科学与技术
姓名:
史维君
指导教师:
申请学位级别:
学士
论文提交日期:
月日
学位授予单位:
天津科技大学
摘要
大数据是数量非常巨大的复杂的半结构化或者非结构化的数据集。
随着时代的开展,越来越多的数据产生,用传统的数据库管理方式,无论是从数据的储存,获取,或者查找等方面都已经无法满足要求了。
随着大数据的来临,人们有了解决大量数据的处理,储存等能力后,人们为了将数据细化,将数据分行业,类型的分了好多种类。
在这里我们所研究的是其中的一个种类:
用户画像。
用户画像核心价值在于了解用户,猜测用户对产品的需求或者潜在需求,精细化的定位人群特征,挖掘潜在的用户群体,为媒体网站、广告主、企业及广告公司充分认知群体用户的差异化特征,根据族群的差异化特征,帮助客户找到营销时机、运营方向,全面提高客户的核心影响力。
在电商行业中。
用户画像可以分析客户的使用习惯、喜好、一系列的购置行为,以及周边的人群的身份、属性、龄等,它对我们的商务行为、对营销的判断会有一定的借鉴。
本文通过使用技术,结合,,和等编程语言,设计并完成了一个具有简单的电商平台下的用户画像。
本设计依赖框架设计出了简洁漂亮的前端界面,使用进行数据分析与产生研究结果。
本系统主要包括,系统管理:
分别从用户管理,角色管理,菜单管理等方面对整个系统进行权限管理。
用户行为:
分别从跳出率,忠诚度,活泼度判断用户在某一天或者某一段时间的整体状况。
访客分析:
分别从地域分布,速度分布,客户端环境等对某个地区的整体环境和地区消费情况进行产品销售。
关键词:
用户画像;;
.
,,,,.,,,,,.:
.
,,,,,,,,'..,,,,,,,.
,,,.,,,.:
,.:
,,.:
,,.
:
;
第一章引言
第一节用户画像的背景及意义
第二节系统所用的开发技术及工具简介
第三节系统环境搭建
第四节论文整体设计结构
第二章系统需求分析与概要设计
第一节用户画像的需求分析
第二节可行性分析
第三节系统总体结构设计
第四节系统功能模块设计
第三章系统的详细设计与实现
第一节数据仓库建模
第二节系统局部功能模块流程图设计
第三节局部功能模块的实现说明
第四节系统结构和页面详细设计
第四章系统测试
第一节软件测试的目的
第二节测试的方法及步骤
第三节系统局部功能测试和结果
第五章论文总结和今后展望
第一节总结
第二节展望
参考文献
致谢
第一章引言
随着互联网时代的来临,人们越来越重视对数据的利用与处理,在海量数据中提取有效信息,进行数据分析与挖掘发现商业价值[]。
用户是时代开展的最重要的因素,利用大数据来分析用户的行为与消费习惯,可以预测商品的开展的趋势,提高产品质量,同时提高用户满意度[]。
本文基于大数据与技术进行电商用户画像的开发与设计,论文将从国内外研究,需求分析,系统概要设计,系统详细设计,系统的实现等方面进行整个工程的描述。
第一节用户画像的背景及意义
随着大数据兴起与不断开展,数据量越来越来,人们想着从这些数据中挖掘出自己想要的信息。
所以有了各种各样的数据挖掘方式或者种类并将其抽象到各个行业。
再次我们讨论的是其中的一个种类,用户画像。
在“用户中心论〞理论支持下,很多行业意识到用户的重要性,在整个社会开展的过程中用户是主导因素[]。
所以有很多行业从原来以产品和效劳为中心的思维方式转换到以用户为主导,开始研究用户的需求,反响和用户满意度等信息[]。
互联网行业也是如此,互联网企业开始加深对用户的了解。
为了使生产或销售的产品能够吸引更多的新用户,同时留住老用户,提高企业的利润,基于用户的研究越来越重要了[]。
在很多传统行业中,商家为了提高用户量,经常会分析用户的生命周期和价值,用户的忠诚度,地域等信息来进行商业决策[]。
比方电商行业,商家会对用户的龄分布,地区,性别,星座,消费能力,家庭收入的方面对用户进行分析,判断用户将来会给商家带来的利润,来进行商业决策[]。
再者分析用户的整体消费情况可以了解用户的消费偏好,进行商品的推送效劳,例如:
短信推送,邮件推送等。
这样就形成了比较成熟的用户行为与消费习惯分析体系,为商家如何长远的获得利益与吸引新用户打下坚实的根底。
随着互联网行业的不断开展,人们对网上消费人群的分析越来越重要。
例如很多大型互联网企业都推出了自己的分析体系,例如:
XX,谷歌,阿里和京东等。
京东将在电子商务全过程中的所有用户的数据都添加到用户画像的建模当中,而且对用户进行全方位的精确定位,描绘用户的特征。
目前京东的用户画像中运用大约三百多个标签来描述客户,涵盖了用户的根本属性,购置能力,偏好等各个方面,利用分析的结果来推荐产品,广告等,同时也更加智能的设置搜索提示功能,更好的效劳于用户,来提高用户的满意度[]。
第二节系统所用的开发技术及工具简介
一、开发技术简介
(一)与简介
是一种与相似的面向对象编程语言,但它比功能更强大、学起来更为简单,而且它具有简单、平安、高性能、面向对象、高可移植性以及跨平台性等优点,因而受到了广阔编程人员的追捧。
同时由于其具有其强大的平台无关性,所以用开发的应用程序可以在各个系统平台上运行,这使得成为目前应用范围最广的编程语言[]。
是一套用于开发企业级应用程序的标准标准,功能十分强大,目前有许多网站的效劳端代码都由它完成编写,使用可以开发出类似电子商务网站和企业资源评估系统这一类伸缩性与灵活性强,且容易维护的分布式企业级网络应用程序[]。
的结构如以下图。
图的结构图
(二)分布式框架
本质上来说是一个开源的分布式框架。
在的三大论文发表之后,有基金会负责开发的大数据的开发工具。
的核心内容是和算法[]。
有以下三个特点:
.可靠性,因为在数据处理是会维护多个数据副本,使得即使在某一节点上计算失败还能重新继续分布处理,而不对数据造成不可恢复性错误。
.高扩展性,在集群处理上,可以特别方便的扩展节点数量。
.低本钱,因为是开源的,所以可以降低好多软件开发本钱。
(三)数据仓库
是一款基于的数据仓库根底架构,他可以方便的将一个结构化的数据文件映射成数据库里面的一张表,还提供查询,学习本钱低等优点[]。
还可以将查询语句转为算法运行,特别适合大型数据的开发与分析。
目前想,淘宝等大型公司都是用进行数据仓库建模和数据分析。
(四)简介
是一个轻量级的前端开发框架,是一套的前端开发库,提供了很多常用的各种和合集,内置了非常多的漂亮样式,简洁灵活,而且是可扩展的,我们可以根据自己需求在他原始的根底上加以扩展来到达我们个性化功能的开发,除此之外还对一下常用的方法进行了分装可以很简单的时候工程开发过程中前后要的交互。
二、开发工具与环境介绍
(一)操作系统
全成,又被很多人成为“社区企业操作系统〞,是的发行之一。
是企业产品的克隆,但是是不收费的,具有以下四个特点:
.环境比较稳定
.有稳定的开发团队提供长久的免费的更新支持
.具有保守性
.性能比较好,就算是大规模的系统也能保持良好的性能
(二)工具
是一款开源的开发工具,系列里面有很多本,比方说支持等开发的专门的本。
而且可扩展能力比较强,可以给里面做各种插件,比方说我们熟知的插件,在这具有很好的提示和查找功能,给我们的开发带来了很多的便利之处。
当前也有收费的不开源,但是提供了很多插件的开发工具。
第三节系统环境搭建
(一)根底环境搭建
本系统的开发运行环境都是基于虚拟机安装的系统,安装和配置环境变量
解压
首先在目录下创立一个文件夹,然后将执行语句将安装到目录下
将添加到环境变量中
执行命令翻开配置文件在文件最后参加以下两句话配置环境
$:
$
然后执行刷新环境配置
(二)集群搭建
.配置,搭建伪分布式,需要修改一下五个配置文件内容:
第一个:
配置路径,开发依赖于
第二个:
配置中的地址
<>
<><>
<><>
<>
<指定运行时产生文件的存储目录>
<>
<><>
<><>
<>
第三个:
配置数据存储是,备份副本的数量
<>
<><>
<><>
<>
第四个:
指定运行在上
<>
<><>
<><>
<>
第五个:
,配置的管理者的地址
<>
<><>
<><>
<>
<获取数据的方式>
<>
<><>
<><>
<>
将添加到环境变量
$:
$:
$:
$
格式化〔是对进行初始化〕
()
.配置免登陆
首先生成免登陆密钥
然后到我的目录
〔四个回车〕
执行完这个命令后,会生成两个文件〔私钥〕、〔公钥〕
将公钥拷贝到要免登陆的机器上
(三)安装与配置
安装完成后修改一下配置文件:
修改
告诉使用外部的
<>
<指定在上存储的路径>
<>
<><>
<><>
<>
<指定是分布式的>
<>
<><>
<><>
<>
<指定的地址,多个用“,〞分割>
<>
<><>
<>,<>
<>
<>
(四)安装与配置
.安装和配置
查询以前安装的相关包
暴力删除这个包
执行命令设置
执行一下语句,将添加到环境变量当中
.*'''''';
.利用将当中的数据直接导入到当中
'\'
第四节论文整体设计结构
一、系统设计思想
本工程通过技术,设计并实现一个简单的用户画像的界面系统,系统通过后台数据操作得出的结果,将其以界面形式反映到前台,决策者可以根据系统提供的图表等信息对整个平台下客户的忠诚度,所属区域,访客的跳出率等几个方面对客户进行初次的总结归纳,最后知道企业的整体营销措施。
二、论文结构安排
第一章主要介绍了本设计的选题背景、选题意义、然后再介绍开发所使用的语言与软件工具,再者介绍个整个系统的环境搭建,最后介绍本论文的整体结构安排。
第二章主要介绍了系统整体的需求分析,然后根据需求写出初步的概要设计。
首先对系统进行简单的需求分析、可行性研究分析,然后接着介绍本网站总体结构、功能模块设计,最后对界面进行简单描述。
第三章主要介绍介绍了用户画像的详细实现过程,在需求分析和概要设计之上更加详细的设计和实现局部系统功能,其次进行功能模块流程图设计,并对一些关键的地方进行代码的说明,最后对整个系统的界面做一下简单的说明与介绍。
第四章主要介绍了系统测试的方法与步骤。
首先简单介绍了系统测试的目的、意义及步骤,然后根据系统测试要求对本系统进行某些模块的测试。
第五章是总结与展望。
对本系统开发与设计过程中遇到的问题和难点,还有自己所收获到的东西进行总结,并对自己以后的职业生涯和努力方向加以重定向、或者进行阶段性的方案。
第二章
系统需求分析与概要设计
在这一章里面我们对用户画像这整个系统进行进行需求分析,可行性研究,还有系统的总体结构介绍和和分模块介绍,最后对局部页面进行简单的介绍。
第一节用户画像的需求分析
本系统大的范围划分总共分为两块:
.后台数据处理与分析采用进行数据分析与数据仓库的建模,系统分析元数据于数据库
.前台显示运用了技术,对后台分析数据进行前台展示。
本系统利用这样的总体结构对整个用户画像进行开发与设计,使之能够初步实现对电商客户的初步分析以及对领导者决策进行帮助。
首先我们从系统的后台数据处理进行分析,我们利用进行数据分析,将整个平台的与客户相关的数据分为了以下的七张表进行数据分析与数据结构化存储:
1.客户消费订单表
根据客户的消费情况提取用户标签
用于了解用户的消费总体情况,以根据用户的消费习惯和消费能力来进行营销行为。
数据于数据库中的:
订单表,退货表,购物车表,用户表。
2.客户购置类目表
根据客户购置类目的情况来提取用户标签
用于了解购置人群情况和某一类目的营销策略
数据于数据库中的:
订单表,类目维表,购物车表。
3.客户购置商店表
根据客户购置商店来提取用户标签
用于了解商店及品牌的购置人群情况
常用来用作某一商店或者某一品牌的营销
数据于数据库中的:
订单表,退货表,购物车表,商店表。
4.客户根本属性表
根据用户所填写的属性标签与推算出来的属性
用于了解用户的人口属性的根本属性和按属性统计
按人口属性进行营销,例如金牛座的优惠和生日优惠
数据于数据库中的:
用户表,用户调查表,孕归模型表,马甲模型表,用户价值模型表。
5.客户营销信息表
将用户营销相关的常用标签放到一张表中,方便使用
数据于数据库中的:
用户表,订单表,用户价值模型表,购物车表,客户品类分群模型表,活动表。
6.客户活动信息表
根据客户参与的活动的情况提取的客户标签
用户了解用户的对活动的参与情况,以进行活动的筹划或者根据对活动不同敏感度的人群做营销
数据于数据库中的:
订单表,活动表,活动订单表,用户表。
7.客户访问信息表
根据客户访问的情况提取的客户标签
用户了解用户的访问总体情况,以根据用户浏览的习惯做营销
数据于数据库中的:
端表,端表,端表,端表。
然后进行前台显示界面功能的分析,在前端我们要用图表加数据的模式展示给用户或者决策者,主要以一下几个方面进行展示:
1.系统管理模块
在这个模块里面我们就主要对用户画像前端系统的一个管理和配置,主要包括,菜单管理,系统用户管理,和角色管理,当然在这个里面也对整个系统的权限进行管理。
2.用户行为分析
在这个模块里面我们就针对用户的一些行为进行分析,然后得到具体的数据,主要从用户的跳出率,忠诚度,活泼度等几个方面对用户进行分析。
3.客户分析
在这个模块里面我们就根据访客所在的地域信息,访客使用的终端环境,还有访客访问速度等几个方面进行分析。
第二节可行性分析
每个软件的开发过程中都会受到各种条件限制,比方说资源,时间,技术,资金等制约因素。
所以在每个软件开发之间我们都要对这个软件各个方面进行调查出一份比较权威的可行性分析研究报告,看这个软件开发各个方面条件是否满足,对于商业软件来说主要还是这个软件的开发是否盈利,是否本钱大于盈利等等各个方面进行权衡。
在软件开发之前进行可行性的研究可以防止软件开发风险,防止人力,资源等方面的浪费。
下面我们就这几个方面进行简要的可行性分析。
一、技术可行性
本系统在后台效劳方面利用了和因为现在是大数据时代,我为了提高自身能力所以自学了大数据方面知识,其中就包括,而且对于操作系统我们在大学课程里面学了操作这门可能讲的操作系统所以在后台效劳方面技术上是可行的。
本系统的前台展示页面使用的技术,在大学课程里面我们既学习了也学习了并且本人从事开发行业也一多了所以在这方面还是比较有经验的所以技术上也是可行的。
对于前端显示框架和图表插件而言,他们两都是轻量级的,并且在官网上都有所对应的案例,所以学习起来也比较容易,再者在前面公司做工程是也用到了这两个框架,所以整理而言在技术方面也是可行的。
再者图,我们在大学阶段开设过软件工程这门课学的就是图的制作和整个软件开发流程,在上课时我们也学会了利用等工具画图,所以在技术上也是可行的。
综上所述,我们可得出结论本系统的开发在技术上是可行的。
二、经济可行性
本系统开发使用的,环境还有开发语言都是开源的,所以在整个开发本钱上节约了很多资源。
三、法律可行性
由于本系统开发过程中使用的开发语言,开发环境这些都是采用开源工程,所以不涉及权问题,而且本系统不会用于商业用途,当然也不会泄露企业内部信息,所以软件整体而言在法律上是可行的。
四、操作可行性
本系统后台数据不需要用户进行操作,用户或者决策者所能接触到的只是前台的数据分析成果展示,所以在操作上没有什么难度,主要是需要用户操作的地方和专业名词都有相应的备注。
用户只需要有一台电脑,能够联网就可以对系统进行操作,所以系统整体而言操作简单符合操作可行性。
第三节系统总体结构设计
本系统是由和开发,其中数据分析采用,在数据分析时需要计算出用户的各种行为等,比方说用户的跳出率的计算,用户忠诚度的分析方法,还有用户对商品打折促销等电商进行的促销活动的敏感度,用户价值的潜力等各个方面的计算与分析,在系统前端用做的前台展示效果,侧重于整个系统权限的管理还有对用户行为,地域等信息进行分析。
本系统到达的效果是使电商更加了解客户,理解客户的真正需求,然后分种类,分地域,分人群进行产品的推销,已到达客户满意度最高,也可以使电商获得最大利润。
系统的整体框架图如以下图。
图用户画像整体框架图
本系统分为后台数据分析和前台分析结果展示,后台数据分析主要是为了数据挖掘工程师用来研究和统计,建模用的,前台是展示给一般系统用户看的,这个主要是提供给企业内部,领导者,或者公司内部做营销等专家作分析,并在分析的根底上领导企业的开展方向和以后生产产品定向。
系统后台全是数据的分析和算法,根本上是供程序员使用的,后台通过简历的七张表对整个企业客户的消费行为,购置能力等方面进行分析,统计生成数据。
而统计数据于企业以前系统用来储存数据的数据库中的表。
整个后台的整个功能就是数据仓库建模,根据一定的算法模型计算出客户消费订单表,客户购置类目表,客户购置商店表,客户根本属性表,客户营销信息表,客户活动表,客户访问信息表七张表。
这七张表分别从不同的方向统计了用户在购置能力,区域分布,忠诚度,敏感指数等方面的值,对用户潜在价值进行挖掘与分析。
同时后台还进行很多算法模型的设置和分析例如:
1.潜在汽车消费模型
现在大多数电商网站都具有汽车频道,对用户的汽车模型也很关心,如表所示。
表汽车消费模型表
用户是否有车
:
未识别
:
是
根据用户是否购置汽车相关的产品来判断用户是否有车
潜在汽车用户
:
未识别
:
是
用户浏览或者搜索汽车相关的产品进行判断
2.用户价值模型
表达用户对网站的价值,对于提高用户留存率非常重要
使用实现用户价值模型参考指标
∙最近一次消费时间或者最后一次消费至今时间
∙消费频率
∙消费金额
3.用户忠诚度模型
忠诚度越高的用户越多,对网站的开展有利,如表所示
表用户忠诚度模型表
用户忠诚度
1.忠诚型用户
2.偶尔型用户
3.投资型用户
4.浏览型用户
1.未识别
2.浏览型用户:
只浏览没购置
3.购置天数大于一定天数的直接判断为忠诚用户
4.购置天数小于一定天数的大局部有优惠才购置的
5.其他类型根据购置天数,购置最后一次距今时间,购置金额进行聚类
4.客户活泼状态模型
∙注册未购置〔只注册没购置,多是第三方登录〕
∙活泼〔可以分为高频,中频,低频,或者直接最近六十天有购置者〕
∙沉睡〔近九十天购置了,近六十天没有购置〕
∙流失〔近九十天无购置,曾经购置过〕
5.疑似马甲模型
∙马甲是指一个用户注册多个账号
∙屡次访问地址想的用户账号是同一个人所有
∙同一台登录屡次的用户账号是一个人所有
∙收货号相同的账号是同一个所有
以上几个模型是其中比较典型的几个分析模型,我们的整个数据分析都是在这些模型的根底上生成的和操作的。
本系统前台主要功能有菜单管理,用户管理,角色管理,跳出率,忠诚度,活泼度,访客流失度,地域分析,速度分析,客户端分析等,如表所示。
表系统功能表
用户管理
实现对新添用户,给用户赋予角色,和编辑用户根本信息,删除用户等功能。
菜单管理
对系统的左侧菜单进行管理,实现增删改查等功能。
角色管理
一个系统可以具有多个角色,而每个角色又具有不同的权限,在这个模块里面实现了对角色的增删改查的功能,除此之外,还有给角色赋予权限和修改权限等功能。
跳出率
利用折线图对客户跳出率进行展现,同时在图表下面配有查询的数据集做图表作为支持。
忠诚度
利用饼状图对用户忠诚度进行展现,同时在图表下面配有查询的数据集做图表作为支持。
活泼度
利用折现图对用户活泼度进行展现,同时在图表下面配有查询的数据集做图表作为支持。
在这个模块里面还统计了用户流失率的统计,同时也有相应的数据作为对图表的支持。
地域分析
利用饼状图对用户所在地域等信息进行展现,同时在图表下面配有查询的数据集做图表作为支持。
速度分析
利用地图对每个地方用户的访问速度进行分析,同时在地图下面配有查询的数据集做图表作为支持。
客户端分析
利用饼状图对用户访问所使用的浏览器和操作系统进行分析。
同时在图表下面配有查询的数据集做图表作为支持。
第四节系统功能模块设计
一、系统用例图分析
用例图是在整个软件或系统开发的分析阶段,常用来描述整个网站的或系统的整体功能,是软件开发中的一种可视化的建模语言。
用例图由三局部组成,分别是参与者,用例,以及参与者与用例之间关系的线或箭头。
参与者,是指系统以外的操作系统或者与系统发生交互的人。
用例,是指整个系统的功能模块。
在画用例图时一般小人表示参与者,椭圆形图标表示用例。
用例图只是展示整个系统功能模块和操作人的关系,并不是介绍代码。
本系统利用用例图展示系统前台的功能模块和操作者的关系。
超级管理员可以操作:
菜单管理,用户管理,角色管理,用户行为分析,用户访客分析等整个功能,而普通用户或者一般决策者只能使用用户行为分析,用户访客行为等非系统管理功能模块。
本系统的总体用例图如以下图:
图系统总体用例图
二、系统功能模块分析
根据前面的对本系统的需求分析,我们可将整个系统分为三块,系统管理,用户行为,访客分析。
以下对每个模块进行介绍:
(一)系统管理
系统管理,管理的是整个系统的配置信息,比方说权限管理,系统菜单管理,用户管理等等。
()用户管理:
由于本系统是公司或企业内部系统,所以不存在注册等信息,本系统的用户管理包括:
新用户的添加〔只有超级管理员才有权限〕,用户角色的分配,还有用户根本信息的修改,例如修改密码等等功能。
()用户登陆:
系统里面已经存在的用户,可以根据自己的账号和密码,同时输入系统自动生成的验证码,当这些信息都对的时候才能登录系统。
进入系统后系统会根据用户的不同角色显示不同的菜单和数据,同时支持登录用户修改自己密码的功能。
()角色管理:
此功能只有超级管理员才能用,在这块里面用户可以建立不同的角色,比方说超级管理员,一般用户等等信息,除此之外还可以对角色信息分条件查看,删除,修改等功能,在这个里面最重要的就是给不同的角色授予不同的权限。
()菜单管理:
这个模块只有在建系统或者系统功能变更或者系统新添加或去除功能的时候才会用到,因为这个涉及到写代码,建立后台处理了。
当然我们在本系统中对此功能也是进行了添加修改,删除,查看等功能。
(二)用户行为模块
用户行为模块主要包括对用户的行为分析,包括用的使用网站的跳出率,用户忠诚度,用户的活泼度等信息。
注:
跳出率:
a.跳出者是指访问量只有一页〔即()是〕访问者。
此类访问者所占的比例越高,说明网站的对他们没有太高的吸引力。
b.跳出率是指单页访问次数〔即访问者从进入页面离开网站的访问次数〕所占的百分比。
c.跳出率是衡量访问质量的指标,跳出率较高通常表示网站进入页〔目标网页〕与访问者相关性不强。
d
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 平台 用户 画像 设计 分析