一种基于Web服务的网页智能推荐方法.docx
- 文档编号:9638459
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:7
- 大小:19.24KB
一种基于Web服务的网页智能推荐方法.docx
《一种基于Web服务的网页智能推荐方法.docx》由会员分享,可在线阅读,更多相关《一种基于Web服务的网页智能推荐方法.docx(7页珍藏版)》请在冰豆网上搜索。
一种基于Web服务的网页智能推荐方法
一种基于Web服务的网页智能推荐方法
中图法分类号:
TP393文献标识码:
A
目前推荐系统已经被广泛地使用在各大网站之中[1],尤其在诸如Amazon等大型电子商务平台中,应用就更加广泛。
对于商家,推荐系统能够显著提高商品的销量;对于买家来说,系统能提供根据买家信息智能生成的推荐商品名单。
WebService则是一种新的Web应用程序分支,它们是自包含、自描述、模块化的应用,可以在网络(通常为Web)中被描述、发布、查找以及通过Web来调用。
因为WebService的各种优势,特别是在网络上它能跨平台完成各种任务,所以使得它受到越来越多的关注和应用。
将网页推荐功能与WebService相结合,势必会同时给商家和客户带来更多的利益。
1智能关联介绍
一般来说,推荐系统通常可以划分为三个种类[2]:
①基于内容的推荐系统。
系统根据用户过去的购买或者偏好的信息为其提供推荐。
②关联推荐系统。
系统根据与用户有类似偏好的客户的购买记录进行推荐。
③混合系统。
系统结合了以上两种推荐方法为客户进行推荐。
推荐系统已经经历了多年的发展和研究,并在很多电子商务网站上有了成功的应用,最成功的例子应该属于Amazon网站向用户提供的个性化服务,它能根据不同用户以及其购买浏览记录推荐其网站的书籍、CD以及其他产品。
但是随着互联网用户的不断增加,客户和商家均对推荐服务提出了更高的要求,然而互联网上各种推荐服务的质量仍然不能令人满意,还有待于开发更加高效、智能的推荐系统来完善现有的电子商务平台。
这些改进包括提供更好地表示客户行为已经推荐对象信息的表达方法、更加先进的推荐模型建模方法以及更加有效的推荐性能。
基于以上考虑,本文对如何构建智能推荐系统进行了研究。
关联推荐能够大大提高网页的浏览量,在短时间内将更多的信息暴露给客户,以吸引更多潜在客户,它特别在电子商务网站中得到了广泛的应用。
如果用户在搜索需要的商品时输入“个人PC”,传统的搜索功能将准确返回带有关键字的相关产品的链接或者介绍,客户可以通过点击链接了解物品详情。
但是设想在得到网站有关“个人PC”的查询结果的同时,如果也能通过一些智能的关联或者联想推荐功能,如同时出现带有“笔记本电脑”、“个人商务助理(PDA)”等链接地址,客户就可以在短时间内了解更多的相关信息,同时也给商家带来了无尽的商机。
2智能关联的分类
(1)横向关联
横向关联又可以细分为两种:
①同类关联推荐。
该关联是指从关键字智能关联到它的同种类别。
例如可以从某个服装品牌,如“Nike”联想到其他运动品牌如“Adidas”,“Reebok”,或者由“Nike”的服装系列联想到“Nike”旗下的其他商品,如运动鞋、背包、手表等。
②同义或近义关联推荐。
该关联是指由关键字联想到同义或者近似的关键字。
现今大部分的搜索功能只能对某个指定关键字进行查找、检索,在数据库输入不规范或者关键字不明确的情况下,将无法检索到这类信息。
例如输入“Intel”或者“英特尔”应该达到相同的效果;又如,输入“电脑”应该联想到“PC”,“Computer”等关键字。
(2)纵向关联
与横向关联类似,纵向关联也细分为两种类型:
①历史关联推荐。
所谓的历史关联是通过对该物品购买者的其他浏览历史记录进行分析从而进行物品推荐。
例如在浏览某品牌打印机页面的客户中,有客户也浏览了打印纸、硒鼓的耗材页面,通过关联算法发现这些物品并一起推荐给客户。
②热点关联推荐。
它是指从关键字联想到当前热门商品从而进行推荐。
例如客户浏览某品牌MP3,可以将最近热销的5~10种MP3品牌向客户进行推荐,同时将最热门的1~5种数码产品进行推荐。
3智能关联的实现
3.1产品信息知识库的设计
实现智能关联从而进行推荐的关键是维护一个可扩展的产品信息知识库。
为了产生横向以及纵向的关联,可以设计一个多知识、可扩展的产品知识库,使其包含多方面、多层次的产品信息以及产品知识。
该知识库与一般的产品数据库的区别在于:
(1)在包含每个商品的同时,还包括其生产厂家、生产年份等常用商品属性的关键字,同时也应该包括常用的英语表示。
(2)每个商品还包括同义/近义的关键字、同类别的关键字。
(3)由于同类的概念又分为超类和子类,因此对应每个类别来说最多可能有一个父类、多个子类,并与其他类别形成多种语义关系。
(4)根据应用的不同可以将知识库划分为若干子知识库,每个子知识库对应一个较大的应用领域或类别。
目前已经实现了一个面向电器的可应用于电子商务平台的产品信息库;如图1所示。
在实际应用中,信息库中的类别、同义/近义概念、同类概念等主要通过自动归类算法和手工修改相结合的方法而产生。
其主要思想是从开放的大型语义字典中抽取名词/动名词产生类别信息,同时可以根据几大权威电子商务网站的归类信息进行补充和修改。
关于历史推荐和热点推荐可以通过机器学习算法与一部分手工添加的方式相结合,各种联系所对应推荐的网页链接则是通过检索方式产生的。
利用这个产品信息知识库向客户进行智能推荐将不再困难。
在客户检索某一关键字时,同时检索相关推荐信息并得到对应的网页地址向顾客进行推荐。
通过WebService将推荐服务算法抽象成网络接口[3],可以非常方便地在网站内部甚至不同网站之间进行相关关键字的推荐。
3.2产品信息知识库的实现
关于知识库体系结构、隶属关系、同义/近义关系的构建,依靠手工添加是无法实现大规模扩建和维护的,理想的方法是利用已有的、以概念为组织方式、不断扩充的大型语义词典。
其中知网[4]是比较著名的大型语义词典,其优势在于:
(1)它是大型的中英文双语知识库,适合进行中英文同义关系的信息检索和推荐。
(2)它以概念为组织对象,适合构建带有隶属关系的产品知识库。
通过分析词典的程序文件和已经存在的词典词库文件,构建工作可以通过以下几个步骤进行:
(1)形成概念条目
由于产品数据库中是以产品信息为主,因而从知网中只提取名词/动名词性概念。
在具体的应用中可以根据相应的应用范围进一步缩小提取的范围。
(2)形成同义概念
知网使用了特殊符号来表示不同的关系,其中也包括同义关系。
对此,我们可以根据步骤
(1)提取的各个概念再抽取相应的同义概念,同时提取相应的英语以及英语同义概念,从而为实现同义/近义推荐提供帮助。
(3)形成隶属关系
知网中许多关系隐含在概念词典描述中,通过一些特殊的结构和位置信息体现,特别是隶属关系可以通过特征文件中的缩进层次结构体现出来。
通过定义一些特殊的关系符,然后对不同特征文件和概念词典进行特殊处理,将它们提取出来。
在实际应用中,特别是在电子商务网站的应用过程中,可能需要更多的专业知识在其中,因而在形成隶属关系后,可以参考大型的电子商务网站的类别信息对生成的隶属关系进行相应的修改。
3.3热点推荐和历史推荐算法
3.3.1热点推荐算法
在热点推荐中,我们根据生成隶属关系可以得到用户搜索物品的种类,从而可以对该种类中销售最佳的物品进行推荐形成热点推荐。
同时由于热点推荐需要依靠较多的人类知识,特别是领域专家的知识,所以可以结合人工维护和种类销售最佳物品推荐形成热点推荐列表。
3.3.2历史推荐算法
在历史推荐中,采用的是被广泛使用的协同过滤(CollaborativeFilter)[5]技术。
给定用户记录,协同过滤技术通过将客户记录与其他用户的记录进行比较发现有类似兴趣的客户,从而将类似客户的购买物品也推荐给正在浏览的客户。
在实际应用中,考虑到将用户记录与所有客户记录相比从而得出推荐算法,在数据库变得庞大时计算量会变得非常大。
所以我们研究了一种基于物品的协同推荐算法,并在此基础上产生了我们自己的算法。
基于物品的算法根据每个用户的购买记录和用户评分记录,组合出相似的物品组成推荐列表。
其具体算法描述如下:
Algorithm:
Automaticgenerationoftheassociationinformationbyusingitemtoitemcollaborativefilter
Input:
catalogi
Output:
associationrecommendationinformationofcatalogi
searchitemsetKingivencatalogi
while(K≠)do
{
searchcustomersetJwhopurchasedi;
while(J≠)do
{
searchpurchasesetMofeachcustomerinJ
while(M≠)do
{
foreachitemjinM
returnsim(i,j)
}
}}
其中,sim(i,j)是返回两个向量相似程度的函数;itemi对应M维向量,而M对应于购买或者对itemi进行评分的顾客。
3.3.3历史算法分析
计算这样的相似物品的表是相当费时间的,在最坏的情况下复杂度达到O(NM)。
但是在实际应用中,由于大多数顾客只会购买很少的物品,所以形成的是一个稀疏矩阵,因此其复杂度可以近似为O(NM)。
一般对这个相似物品表进行离线计算,一旦给定物品之间的相似表,当用户搜索指定的物品时,通过查找表格就能找出最相似的若干推荐物品。
这样的计算速度是相当迅速的,它只取决于用户浏览或评分的物品数量。
4基于WebService的智能网页推荐
我们将推荐算法通过WebService形式整合在网页之中,其优势在于它不仅将核心的算法模块化,便于以后的修改和维护,更加主要的优势在于它提供了调用算法的接口,我们可以在任何地点调用这个接口,实现对商品的推荐功能。
在电子商务领域,随着电子商务网站的不断扩大,基于WebService的推荐服务有更多的应用空间。
其他网站在提供电子商务网站的某些商品的广告时,还伴有相关产品的推荐,这对电子商务网站的发展是非常有益的。
?
ピ诰咛逵τ弥校?
当用户在提供的搜索引擎上输入关键字进行查询时,利用智能的网页推荐方法我们不仅可以提供与关键字匹配的常规检索结果,而且还可以推荐与在该关键字基础上进行智能推荐物品的网页链接。
产生智能推荐的流程如下:
①从客户的查询中提取关键字(名词或动名词);
②根据提取的关键字返回常规检索结果;
③利用抽取的关键字查询建立的产品知识库,分别查询相关的横向以及纵向推荐,将其返回的链接组成“向您推荐”项,高亮显示在常规检索的页面下方,成为推荐备选的“相关链接”;
④如果用户选择一个推荐的物品网页,则搜索引擎根据与该物品对应的关键字再产生相应的推荐网页的“向您推荐”项。
5实例研究
为了测试算法,在测试系统中输入“MP3”说明智能网页推荐的效果。
利用前面所述的智能推荐方法,我们将在产品信息数据库中查找相关关键字的信息,同时查找同义/近义的推荐条目,并利用热点推荐算法和历史推荐算法产生相应的推荐条目。
最终得到的推荐链接列表如图2所示。
其中,前两条是更加同义/近义的产品子表中查询的,第三条~第七条是根据历史推荐自动形成的链接,最后一项是根据热点推荐的算法寻找相应种类后自动形成的。
6结束语
基于WebService的智能推荐是一种可为用户提供更多推荐的主动式信息服务,在电子商务网站中有着广泛的应用前景,从图3的访问量的对比中可以清晰地看到这一点。
同时由于智能推荐的引入能够大大提高网页的浏览量,在较短的时间内将更多的信息暴露给客户,因此能吸引更多潜在的客户。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 Web 服务 网页 智能 推荐 方法