超市商品摆放位置数据挖掘Word文档下载推荐.docx
- 文档编号:21226715
- 上传时间:2023-01-28
- 格式:DOCX
- 页数:16
- 大小:64.39KB
超市商品摆放位置数据挖掘Word文档下载推荐.docx
《超市商品摆放位置数据挖掘Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《超市商品摆放位置数据挖掘Word文档下载推荐.docx(16页珍藏版)》请在冰豆网上搜索。
二、设计正文
1.本文工作内容
本文的目标是运用数据挖掘的理论和方法,通过研究分析数据仓库,建立一个与ERP集成的以销售为核心的超市决策支持系统,以提高企业商业决策能力。
本文的研究重点有以下几个方面:
(1)对数据挖掘的研究现状进行了分析,探讨了数据挖掘的基本原理与体系结构,并对数据仓库进行了研究,使得建立超市决策支持系统成为可能;
(2)以超市数据仓库中的数据为原始数据,运用维度建模的方法建立了系统的信息模型,并且对数据进行分析;
(3)建立超市决策支持原型系统,并在此系统的基础上,对原型系统进行了实例数据挖掘应用,并把结果进行了可视化转化,最后向企业决策人员提交了挖掘结果。
2.数据挖掘的概况
2.1数据挖掘的概念
数据挖掘主要是从大量的、有噪声的、模糊的、随机的数据中提取人们感兴趣的知识。
这些知识是隐含的、事先未知的、潜在有用的信息,提取的知识表现为概念、规则、规律、模式等形式。
数据挖掘是知识发现的重要技术,它并不是用规范的数据库查询语言(如:
SQL语言)进行查询,而是对查询的内容进行模式的总结和内在规律的搜索。
传统的查询和报表处理只是得到事件发生的结果,并没有深入研究发生的原因,而数据挖掘则主要了解发生的原因,并且以一定的置信度对未来进行预测,用来为决策行为提供有利的支持。
2.2数据挖掘的任务
数据挖掘的任务是对数据库中的大量数据进行抽取、转换、分析和其他模型化处理,并从中提取辅助决策的关键性数据。
数据挖掘的任务主要有以下几方面:
(1)自动预测趋势和行为:
自动寻找预测性信息,直接由数据本身得出结论。
(2)聚类分析。
按相似性归纳分类,同类数据彼此相似,不同类数据相异。
(3)关联分析。
目的是找出数据库中隐藏的关联,以支持度和可信度来度量。
(4)分类。
用于规则描述和预测。
(5)时序模式。
通过时间序列搜索出的重复发生概率较高的模式。
(6)偏差分析。
寻找观察结果与参照之间的差别。
2.3数据挖掘的基本原理
在利用数据挖掘技术进行决策分析时,一般遵循的步骤包含以下几个方面:
在进行数据挖掘工作前,要清楚地知道数据挖掘的目标。
事先明确挖掘的业务目标,确定达到目标的评价方法,这将大大减少挖掘工作的难度和工作量。
选择数据,这些数据可能是数据仓库或数据集市,也可能是各个联机事务处理系统中的数据。
数据预处理,一般包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换、对数据降维等。
数据变换,从初始特征中找出真正有用的特征,以减少数据挖掘需考虑的特征或变量个数。
数据挖掘,首先需要确定数据挖掘的目标和挖掘的知识类型;
在确定挖掘任务后,根据挖掘的知识类型选择合适的挖掘算法;
最后实施数据挖掘操作,运用选定的挖掘算法从数据库中抽取所需的知识。
整个数据挖掘过程是不断地循环和反复的,因而可以对所挖掘出来的知识不断求精和深化,最终达到用户所满意的结果。
3.系统的分析与建模
3.1现状调研与分析
随着我国超级市场的不断普及,我国的超市企业面临竞争的严峻考验。
沃尔玛、家乐福等一些国际著名的零售企业抢滩中国,使中国超市面临着国际化的竞争,中国的商业零售市场竞争日益激烈。
国内零售公司迫切需要通过各种手段提高竞争力。
在这种情况下,超市从上到下迫切需要更科学、更全面细致、更快速准确的经营管理要求。
因此,能否对数据进行灵敏、快速的分析,有针对性地制定政策,适时根据市场需求排放货物,显得越来越重要。
把握市场动向,提包销售利润是商场、超市的最终目标。
在企业管理日趋科学化的今天,如何准确及时的进行生产经营决策是商场、超市面临的严峻问题。
这要求决策者准确及时的捕捉到销售信息,分析销售情况,随时根究历史的销售情况,对下一步的生产经营进行科学决策。
销售分析需要的基础数据涉及到的模块有销售、库存、财务和人事,能够围绕销售趋势、产品需求趋势等辅助决策信息。
3.2数据理解
3.2.1数据的特点
超市的数据挖掘因其数据来源与类型的不同,其做法也稍有不同。
一些超市,其顾客多数持有会员卡或优惠卡,比如沃尔玛在北京的连锁店。
这种情况下,超市的数据仓库记载了最为丰富的信息,它不仅可以提供顾客分层层面上的购物偏好等信息,甚至可以了解到每位顾客的购物习惯;
而有些超市,其顾客多数为匿名消费,他们没有会员卡之类可跟个人记录相联的工具,而且多数是现金消费,超市很难把握每位顾客的消费习惯。
但这一类数据在累计层面上,依然可以为商场提供很多有用信息。
在销售历史数据中,我们常常会发现代表同一概念的属性在不同的数据库含有不同的名字,这将会导致不一致和冗余,而含有大量不一致和冗余数据会降低数据挖掘过程的性能或使之陷入混乱。
并且数据源中常不可避免地存在着不完整、不一致、不精确和重复的数据,这些数据统称为“脏数据”。
脏数据能使挖掘过程陷入混乱,导致不可靠的输出。
将数据集成与变换、清洗将减少或避免这种情况,提高数据挖掘的精度与速度。
3.2.2数据的描述
数据描述是对收集的数据进行描述。
一般数据描述由资料数据和行为数据组成,用来描述各个事务的基本特征,并为超市决策系统模型的分析和建立提供数据源。
现描述的数据为商品的信息、会员信息、退货信息、销售的状态信息。
Merchandise(商品)表
说明
字段
类型
长度
备注
序号
SequenceNumber
int
4
标识列
商品编码
MerchandiseNumber
varchar
20
例:
食品类别:
SP000001
条型码
TreatyCode
tx321SP000001
类别编号
SortNumber
char
10
外键
商品名称
MerchandiseName
50
零售价(元)
RetailPrice
money
8
计量单位
Units
供应商号
ProductManufacturer
Varchar
进货价
PurchasePrice
保质期(天)
CheckTerm
numeric
9
允许空
Remark
MerchandiseType(商品类别)表
字段:
类型:
长度:
备注:
SortID
食品类:
SP0001
类别名
SortName
Customer(用户)表
说明:
用户号
CustomerID
主键
用户名称
CustomerName
用户等级
UserGrade
家庭地址
Address
性别
Six
文化程度
Wenhua
用户积分
Grade
BackSale(退货)表
退货单编号
BackSale_ID
退货日期
BackDate
商品条形码
Product_ID
主键,外键(参照PRODUCT表)
数量
Number
进货价格
Price
ProductName
货品生产厂家
(退货人)普通客户
CommonClient
(退货人)会员
VIP_ID
(退货人)超市
SuperMarket
退货原因
Reason
varcha
250
(销售)表
销售编号
Sale_ID
主键,外键(参照SALE表)
商品编号(条形码)
主键,外键(参照
PRODUCT表
销售日期
SaleDate
商品数量
商品单价
折扣
Discount
会员卡号
收银员编号
Shroff
普通客户
商品类别
ProductSort
3.2.3超市决策系统应解决的问题
超市销售是超市决策系统的的重中之重,销售的情况直接影响到超市能否正常的运营。
采用正确的销售策略是企业不容忽视的问题,通过良好的超市决策可以将超市的商品管理、库存管理、人员管理以及顾客管理良好的结合在一起,以便为良好的销售服务。
在超市销售过程中,决策部门借助于决策系统应该解决以下问题:
(1)顾客聚类分析:
根据顾客的性别、地理分布、文化程度、种族等对顾客做聚类分析,使超市能够有针对性的营销。
(2)顾客忠诚度分析:
根据持续时间、交易数量、地理分布等因素考虑分析。
(3)商品摆放情况分析:
根据顾客购买商品的关联规则,分析商品的最佳摆放位置。
(4)销售员绩效分析:
通过对销售情况汇总,及时了解销售员的工作负荷、服务质量,合理安排销售任务,保证销售工作的顺利进行。
(5)商品退货情况分析:
查询商品的退货情况,按照时段、顾客、商品供应商情况,分析产生原因。
(6)销售趋势预测分析:
按地区、组织、顾客类型、供应商类型、销售员、销售方式、时段和商品进行分析,查询以往商品的销售数据,得出未来的销售趋势,从而采取正确的销售方式。
4.决策支持系统的设计与实现
4.1超市决策支持系统的设计
基于数据挖掘的超市决策支持系统的主要功能功能设计包括商品管理方面、顾客管理方面、销售管理方面的设计。
4.1.1商品管理
通过对数据仓库中多次购买记录的分析,应用商品的关联分析模型,发现不同商品被一起购买的关系,当若干中商品被同时购买超过一定频数时,可以确定这些商品之间具有一定的相关性,以此为依据可以对商品的捆绑销售、位置摆放提供信息支持。
对同一品类的不同商品的销售额、利润率、顾客感兴趣程度进行分析,依据商品品类管理目标模型和品类淘汰模型,可以得出不同商品对于实现利润最大化的重要程度,对一个品类内的商品进行末位淘汰,优化商品的品类结构。
利用数据仓库中关于商品的库存信息以及商品的销售额、销售利润、库存成本、定货成本、定货提前期等数据,结合商品进货和库存管理模型,可以确定商品的最佳定货批量,节约商品的进货、库存管理成本。
4.1.2顾客管理
结合超级市场的会员制度,数据仓库收集了大量的顾客信息和顾客购买记录,依据超市自身需求,首先确定顾客细分变量,结合顾客细分模型,对顾客进行聚类分析。
在聚类分析的基础上,可以归纳出每类顾客的主要特征,可以将这些特征作为分类标准对新客户进行分类。
通过对顾客的聚类、分类分析,我们能够对顾客进行精细管理,从而使我们更好的为顾客提供相适应的服务。
4.1.3销售管理
能够对超级市场促销活动的时间、业绩、商品搭配等进行分析,得出促销活动的重要影响因素,对促销活动的效果进行评价,指导超市企业促销活动的开展。
结合数据仓库中老客户的商品购买记录,分析各个顾客的潜在消费需求,协助超市进行针对性的商品推荐。
对超市数据仓库中各种商品的销售数据进行系统的统计分析,协助超市进行销售数据的整理、分析、储存。
4.2模块设计
超市决策支持系统的主要功能模块包括信息查询、预警提示、联机分析处理、决策支持和系统管理五大模块。
该模块流程图:
超市决策系统功能模块图
5建立顾客细分模型
5.1顾客细分概述
顾客细分,即根据客户不同的特征对市场进行簇的划分,使得属于同一簇的客户具有某种相似的特征。
在超级市场中,不同的顾客之间具有很大的差异,对超市来说也具有不同的价值。
对超级市场来说,对不同的顾客按照相应的标准进行划分,对于优化超级市场的相关策略、增强超市的竞争能力、使超市更好的管理客户等等都是非常有益的。
针对不同的顾客群体制定不同的差异化策略,增加顾客的忠诚度、刺激顾客购买、增加超市盈利,从而使超级市场更好的管理客户。
5.2顾客细分方法及依据
顾客细分是按照一定的规则把一定的顾客划分为不同的顾客群。
通过顾客细分,企业可以更好地识别不同的顾客群体,采取差异化的营销策略,从而有效地降低成本,同时获得更强、更有利可图的市场渗透。
现有的研究依据传统的市场细分理论进行了有益的探讨,例如采用人口统计学变量(如年龄、性别、收入、教育背景和职业等),或者顾客购买行为特征变量(如顾客购买量、购买频率和忠诚度等),亦或是顾客价值变量。
但是,由于这些细分方法的提出是基于不同的研究目的和视角,尚不能满足顾客关系管理对于顾客细分更全面、细致的要求。
顾客细分的方法有很多,顾客细分没有唯一的方法,一个超市要想尽量好的描述、把握客户,应该尝试不同的细分变量,独立变量和联合变量都要考虑。
顾客细分依据
举例
人口统计特点
年龄、性别、收入、职业、社会、地位
地理因素特点
国内国际市场、地区经济发展水平、居住小区级别
家庭生命周期特点
个人所处家庭生命周期的阶段
购买者的个人特点
资产状况、个性、风险偏好、生活方式
5.3顾客细分模型的应用及研究
顾客细分模型以数据仓库为基础,能够进行充分的应用,从而为超市的经营决策提供支持。
而K-平均算法是一种广泛的聚类分析算法,此算法已经在第二章讲过,所以我们在这里直接用K-平均算法对顾客进行细分。
根据上述所讲的顾客细分方法及模型,我们通过聚类分析中的K-平均算法对一家超市的顾客进行了聚类分析我们可以从下面的分析表中发现该超市顾客的一些特点。
聚类分析结果
客户数
人数
金额
计算价值
黄金客户
176
0.0003
0.51
11.60
价值客户
77615
0.1326
62.09
60.20
一般客户
288146
0.8340
37.20
23.89
低值客户
19368
0.0331
0.20
4.31
文章也对分出的每一类客户特点做了关联分析,发现如下特点:
黄金客户都是大集团客户,如机场、政府、大学等,不但订了很多份报纸还有许多其它商品的配送业务,与公司能保持比较长时间的业务关系。
价值客户多是一些较小的公费用户,或是综合市场等多个单客户组成的联合体,还有一些收入高,生活优越的中产阶级。
普通用户大多是一些私费订户,长期稳定地订购公司的产品与服务。
低值客户多是一些订购时间短,续订积极性不高的用户,多是一些年轻人,为了生活方便临时订购。
这个挖掘结果不但发现了有意义的知识,得到了决策者和业务人员的认可,而且也体现了经济学中的20%-80%规律,即少数客户创造大部分的客户生涯价值。
5.4商品关联分析
5.4.1原始数据采集
从超市中选取具有潜在销售关系的一系列产品,设产品销售集合为D。
D={洗发水A、浴衣B、香皂C、润肤霜D、洗衣粉E}
(1)选取超市一段时间内在商品集合D中购买商品的记录进行分析,首先我们对其进行预处理,将购买数量简化为1或0,其中1代表购买,0代表没有购买。
预处理后的销售记录如表。
销售数据处理后
顾客
洗发水A
浴衣B
香皂C
润肤霜D
洗衣粉E
001
1
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
销售记录模块的文件(.arff):
@relationsupermarket
@attributecustomernumeric
@attributexfsnumeric
@attributeyuyinumeric
@attributexznumeric
@attributerfsnumeric
@attributexifnumeric
@data
001,1,1,1,0,0
002,1,1,1,1,0
003,1,1,1,0,0
004,1,1,1,0,0
005,1,1,1,0,1
006,1,1,1,0,0
007,1,1,1,0,0
008,1,1,1,0,0
009,1,1,1,0,0
010,1,1,1,0,0
011,1,1,1,0,0
012,0,1,1,0,0
013,0,1,1,0,0
014,0,1,1,1,1
015,0,1,1,0,0
016,0,0,0,0,0
017,0,0,1,1,0
018,0,1,0,1,0
019,0,0,0,1,0
020,0,0,0,0,1
(2)我们对商品进行销售关联分析
首先计算各个项目集的支持度:
商品的支持度=包含商品的事务数量/全部事务数量;
项集X的支持度support(X)描述了项集X的重要性;
经过计算,结果如表所示。
项目集的支持度
项目集
支持度
A
55%
BC
75%
ACD
5%
B
80%
BD
15%
ACE
C
BE
10%
BCD
D
25%
CD
BCE
E
CE
BDE
AB
DE
CDE
AC
ABC
ABCD
AD
ABD
ABCE
AE
ABE
—
(3)设定最小支持度为50%,进一步计算置信度:
(Lk为k-频繁项目集,Xm-1为Lk的非空子集)。
项目集的支持度
Lk
Xm-1
置信度
Lk
Xm-1
100%
68.75%
93.75%
73.33%
通过得出的频繁项目集结合具体商品进行比较分析,设定最小置信度为85%,可以得到以下一些关联规则:
B,A
C,B
C,C
BC,AB
C,AC
5.5结果分析
从结果中我们可以看出,A、B、C三种商品之间具有很强的相关性,即洗发水、浴衣和香皂之间。
尤其是当顾客购买洗发水时,具有很高的可能性来购买浴衣和香皂。
这个结论对于超市相关物品的摆放、顾客的购买模式研究、商品的进货管理等方面都有着很好的指导意义。
商店可以在商品摆放上将洗发水、浴衣和香皂就近摆放,而润肤霜和洗衣粉则应该与以上商品相对分开。
商店在进货及库存管理上也应该注意以上几种商品数量的协调,从而更好的满足顾客的需求。
三、实验总结
这次对超市物品摆放位置的挖掘实验,我们学习到很多东西,不只是实践经验,还有一些做事的道理:
在工作时,要尽
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 超市 商品 摆放 位置 数据 挖掘