微博用户关注及排名的实现Word下载.docx
- 文档编号:16475344
- 上传时间:2022-11-24
- 格式:DOCX
- 页数:44
- 大小:804.62KB
微博用户关注及排名的实现Word下载.docx
《微博用户关注及排名的实现Word下载.docx》由会员分享,可在线阅读,更多相关《微博用户关注及排名的实现Word下载.docx(44页珍藏版)》请在冰豆网上搜索。
计算机科学与技术09-1班
题
目
题目名称
题目性质
1.理工类:
工程设计();
工程技术实验研究型();
理论研究型();
计算机软件型(√);
综合型()
2.管理类();
3.外语类();
4.艺术类()
题目类型
1.毕业设计(√)2.论文()
题目来源
科研课题()生产实际()自选题目(√)
主要
内容
1.使用PHP技术实现微博的常见功能,注册,发表说说……
2.实现微博的排名功能,按照关注度的排名,研究多种排名的实现
3.考虑系统的可拓展性,增加创新性
基本
要求
1.界面美观友好,可操作性强。
2.能够有很好的体现出微博用户的被关注度及排名情况。
3.根据项目的安排完成系统编码及测试。
参考
文献
[1]邹天思,孙鹏.PHP从入门到精通[M].北京:
清华大学出版社,2008.
[2]Michaelkofler.MySQL5权威指南[M].北京:
人民邮电出版社,2006.
[3]潘凯华,邹天思.PHP开发实战宝[M].北京:
清华大学出版社,2010.
[4]陈湘扬,陈国益.PHP5+MySQL网页系统开发设计[M].北京:
电子工业出版社,2007.003
周次
第1~4周
第5~8周
第9~12周
第13~16周
第17~18周
应完成
的内容
提交任务书,申请开题,做好需求分析
搭建环境
进行设计并做出相关的数据库
测试与调试,完善功能
书写毕业论文,准备答辩
指导教师:
职称:
副教授
2013年2月29日
系级教学单位审批:
年月日
摘要
随着互联网技术的迅速发展,微博作为一种新的社交网络服务,其应用越来越广,功能越来越丰富,影响力也越来越大。
微博服务将用户与社交网络之间的距离进一步缩短,为用户提供便捷、快速的内容接收、发布方式。
本文以当前国内较流行的新浪微博作为研究的数据来源,从微博与传统社交网络服务之间的差异入手,充分总结微博服务的新特性,并对两类用户指标进行分析。
本文主要研究了微博服务中关注推荐和排名策略,如何为微博用户提供不同层次的关注对象以及对用户进行合理排名是本文研究重点。
首先,在微博服务中,用户可以自由关注其他用户,以获取这些用户的动态及微博信息,因此,为用户推荐高质量的关注对象是一种建立可靠用户关注关系,有效提高用户对微博服务依赖性的手段。
本文以社会网络统计量为基础,提出一种适用于微博服务的新结构,并据此得到关注推荐模型。
实验表明,该模型使用阈值对用户进行筛选后,两种子模型可以为用户提供不同亲密度的关注对象,有效增加了用户获取关注对象的途径。
其次,由于微博服务目标用户定位和发展模式的需要,目前普遍采用单一指标作为用户排名的依据。
然而,单一指标排名方式难以真实地反映服务中的活跃用户。
最后,本文提出用户排名策略模型以计算用户的活跃指数。
实验及分析表明,活跃指数在微博服务中能够较好地反映活跃用户的特征,适于度量用户活跃度排名情况。
关键词:
微博服务;
关注推荐;
亲密度;
排名策略;
活跃指数
Abstract
WiththerapiddevelopmentofInternettechnology,micro-blogasanewsocialnetworkingservice,itsapplicationismoreandmorewidely,moreandmoreabundantfunctions,influenceisalsogrowing.Micro-blogservicebetweentheuserandthenetworkdistanceshortenedfurther,toprovideconvenient,fastwayforuserstoreceive,publishcontent.BasedonthecurrentdomesticpopularSinamicro-blogassourcesofdata,startingfromthedifferencesbetweenmicro-blogandtraditionalsocialnetworkservice,newfeaturesarefullysummarizedmicro-blogservice,andthetwotypesofuserswereanalyzed.Thispapermainlystudiestherankingstrategiesconcernandrecommendmicro-blogservice,howtoprovideuserswithdifferentlevelsofmicro-blogfocusandusersarerationalrankingisthefocusofthispaper.
Firstofall,inmicro-blogservice,usersarefreetofollowotherusers,theseuserstoobtaindynamicandmicro-bloginformation,tThispaperisbasedonthesocialnetworkstatistics,putsforwardanewstructureformicro-blogservice,andthengetattentionrecommendationmodel.Experimentsshowthat,themodelusesthethresholdtoscreentheuser,twoseedmodelcanfocusondifferentobjectsofintimatedegreeforusers,effectivelyincreasetheuseraccesstotheobjectofinterest.Thenfinally
Secondly,duetotheneedofmicro-blogservicetargetuserlocationandmodeofdevelopment,thecurrentwidespreaduseofasingleindexastheuserrankingbasis.However,thesingleindexrankingmethodscanhardlyreflecttheserviceofactiveusers.
Finally,thispaperputsforwardactiveindexuserrankingstrategymodeltocalculatetheuser.Experimentandanalysis,activeindexcanbetterreflectthecharacteristicsofactiveusersinthemicro-blogservice,issuitableforthemeasurementofactiveusersofrank.
Keywords micro-blogservice;
payattentiontorecommend;
intimacy;
第1章绪论
1.1课题背景
随着互联网高速发展,一种新型的媒体转播工具---微博,诞生了。
与传统的博客相比,微博草根性更强,且广泛分布在桌面、浏览器、移动终端等多个平台上,有多种商业模式并存,或形成多个垂直细分领域的可能,但无论哪种商业模式,应该都离不开用户体验的特性和基本功能。
微博提供了这样一个平台,你即可以作为观众,在微博上浏览你感兴趣的信息;
也可以作为发布者,在微博上发布内容供别人浏览。
发布的内容一般较短,例如140字的限制,微博由此得名。
在微博上,140字的限制将平民和莎士比亚拉到了同一水平线上,这一点导致大量原创内容爆发性地被生产出来。
微博的出现具有划时代的意义,真正标志着个人互联网时代的到来。
博客的出现,已经将互联网上的社会化媒体推进了一大步,公众人物纷纷开始建立自己的网上形象。
微博网站现在的即时通讯功能非常强大,通过QQ和MSN直接书写,在没有网络的地方,只要有手机也可即时更新自己的内容,哪怕你就在事发现场。
相对于传统的博客,微博的发布方式趋于多样化、简单化。
由于其具备手机发送文本的功能,用户不必坐在电脑桌前,便能实现与网络的联通。
在以微博为媒介平台进行话题或者事件传播时,微博用户并非仅仅只是进行简短的事件和观点的陈述播报,他们往往在信息的传播中附加对信息更为详尽的解释性、完整性链接,从而将话题从微博平台转换到大众化的互联网传播平台,因此实现微博信息的二次传播,并且把这种传播从分众传播变成大众传播,而这种第二级的传播在借助大众传播的平台时即转变为大众传播,从而实现传播内容、范围、深度、广度和效果的几何状扩大,达到和第一次个人与个人传播、个人与群体传播时对比鲜明的传播范围和传播效果,从而体现出微博更大的作用和价值。
目前,国外“微博”网站已经很流行了,但国内“微博”网站尚处于“慢热”状态,需要广大的网络编程开发者给予支持,而且开发微博网站,对于自身的成长有很大的帮助。
1.2课题研究意义
基于Web2.0技术的诸多应用,正在逐渐改变互联网用户的日常生活,比如:
BitTorrent为用户提供更加快速的下载传输速度;
Wikipedia依赖用户协作分享不断更新的百科知识;
Biog构建的分享平台使每个人都可以方便地成为网站内容的创造者。
微博作为诸多应用之一的社交网络,在过去的几十年间,其飞速发展已经吸引了亿万互联网用户。
近段时间,微博这个词在网络上非常流行,大到国家领导人,小到普通市民、学生也都在网上开了微博。
许多大型网站也在原来博客的基础上,增加了微博,微博以其短小精悍,更加贴近生活而受到人们的推崇,在浏览之余不禁想问一下它们之间的区别:
(1)字数限制微博必须在140字以内,这是为了手机发布阅读方便,博客没有限制,因为它主要是让人在电脑上发表和阅读的。
(2)被动阅读看博客必须去对方的首页看,而微博在自己的首页上就能看到别人的微博。
(3)发布简便可以通过发短信的方式更新,可以通过手机网络更新,当然也可以通过电脑更新,而博客一般来说,用手机更新非常麻烦。
(4)自传播速度快博客要是靠网站推荐带来流量,而微博通过粉丝转发来增加阅读数。
微博和博客还是有共同点的,不论是博客也好,微博也好,都是一个人所见所闻,或编写,或转载,上至天文,下至地理,世态炎凉,悲欢离合,一篇篇一字字组成了我们的生活,同时也让我们的生活变得丰富多彩。
当今社会是个高科技、高效率、高度竞争的社会。
随着物质水平的逐步提高,我们的的精神生活也开始趋向丰富多彩。
一种新的网络应用形式——“微博”也应运而生。
“微博”以其便捷性,背对脸式的交互方式以及原创性得到了广大网民的宠爱,成为了网络时代新的代名词。
微博成为了一个继博客之后的全新信息平台?
似乎从目前看来,还很难,曾经尝试过用微博客来发布过新闻:
见证中国第一条自主研发的等离子电视机生产线落成,但似乎连一点水花都没有溅起来。
或许是自己的影响力太小吧,怪不得微博客。
不过呢,短短几十个字,也不可能让任何人在微博客上成为意见领袖,最多就是如同一个通讯社记者那样,将一个最新的即时新闻用最少的言语,以最快的速度通过手机或其他方式发布在网上。
以个人面向网络的即时广播,通过群聚的方式,每个人都可以形成一个自己的听众群落;
用微博客的方式,将个人的见解和观点发布给自己的听众,以最精炼的词汇来表达最高深的观点。
某种程度上来说,这种将微博客和即时通讯软件的兼容并包,以群广播的模式来形成自己的意见圈子的做法,与之前一味模仿的同质手法相比,在形式上确实有了进步,感觉较为新颖;
但能否继续下去,人气在短时间之内是否可获得快速突破,盈利模型是否有新的发展,仅靠一款内测产品目前尚难做出判断;
微博客即时广播的方式能否真正的形成一种意见领袖的圈子,以类似名言警句的模式来发展成社会圈子的大舞台,也未可知。
1.3课题国内外发展现状
微博最早起源于Twitter。
Twitter是2006年3月由blogger的创始人威廉姆斯(EvanWilliams)推出的,英文原意为小鸟的叽叽喳喳声,用户能用如发手机短信的数百种工具更新信息。
Twitter的出现把世人的眼光引入了一个叫微博的小小世界里。
Twitter是一个社交网络及微博客服务。
用户可以经由SMS、即时通信、电邮、Twitter网站或Twitter客户端软件(如Twitterrific)输入最多140字的文字更新,Twitter被Alexa网页流量统计评定为最受欢迎的50个网络应用之一。
在国内,从2007年中国第一家带有微博色彩的饭否网开张,到2009年,微博这个全新的名词,以摧枯拉朽的姿态扫荡世界,打败奥巴马、甲流等等名词,成为全世界最流行的词汇。
从2007年5月到2008年初,是我国微博发展的引入期。
这一时期的微博以独立微博网站为主体。
从2008年初开始,国内微博客发展进入了一年的沉寂期。
期间,没有新的微博服务商出现,用户规模增幅也不大。
从2009年2月开始,国内微博焕发出新的活力。
大量微博网站相继上线,用户规模激增,微博成为我国互联网发展的新的热点。
国内微博发展进入了快速成长期,这一时期又分为独立微博二次崛起和全面成长期两个阶段。
这些微博网站以独立微博网站为主体。
2009年8月,新浪微博上线,并迅速成长为中国最具影响力的微博。
在新浪微博的带动下,综合门户网站微博、垂直门户微博、新闻网站微博、电子商务微博、SNS微博、独立微博客网站纷纷成立,甚至电视台、电信运营商也开始涉足微博业务。
中国真正进入微博时代。
中国微博发展至今日虽有不到四年的时间,但其对互联网用户的影响远高于期望,越来越多的网民加入到了“微客”这一群体中,微博在新闻、交流等方面起到的影响也越来越大,很多人也在逐渐增加对这一信息渠道的依赖。
目前,国内微博领域的竞争已经趋于白热化,但主要都集中在综合性微博,行业性微博目前还是尚待开发的处女地。
未来,微博的垂直化发展或将成为一大趋势。
微博细分是市场向前发展的必然趋势,行业微博的出现是必然,并且将会与综合性的微博呈现出较大的区别和不同的发展方向。
未来微博的垂直化发展或细分将成为趋势。
垂直微博是针对某一个行业的专业微博,是微博的细分和延伸。
相对通用微博的信息量大、深度不够等提出来的新的微博服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。
其特点就是“专、精、深”,且具有行业色彩,相比较通用微博的海量信息无序化,垂直微博则显得更加专注、具体和深入。
1.4微博的发展
在未来的互联网发展中,微博的发展将逐步趋于工具化、细分化。
(1)工具化微博已成为门户网站吸引用户、增加用户黏性的重要手段,将成为门户网站继博客之后的又一标配。
SNS推出“动态”功能、QQ邮箱推出广播等都是这一趋势的开始。
(2)细分化一方面,目前我国微博市场的竞争越来越激烈,以新浪为代表的四大门户占据了大部分市场,其他微博服务商难以在全面竞争中取胜。
另一方面,对用户有价值的信息容易被淹没于海量信息中,用户也迫切需要专业细分微博的出现。
现在,已有很多微博服务商结合自身资源条件,对微博网站进行了专业细分,如和讯网推出的财经微博,搜房网推出的房地产专业微博等。
随着用户的细分、竞争的加剧,细分化的趋势将更加明显。
1.5论文主要研究工作
在微博服务中,用户关系是非常重要的资源,所以建立高质量的用户关系就显得尤为重要,而关注推荐与排名策略可以提高用户对微博服务的依赖,吸引新用户使用微博服务提供的各项功能。
本文在分析用户拓扑结构、特征的基础上,以社会网络中的新结构为基础,研究微博服务独特的用户关系,建立关注推荐推荐模型,提出了一种关注推荐方式;
并提出了一种排名策略,该策略通过活跃指数可计算每个用户的活跃程度。
论文的主要工作及成果如下:
(1)对比分析传统社交网络服务与微博服务之间的差异,总结微博服务的特点,结合国内外的微博服务,从产生方式、消息传递、拓扑结构、用户指标等方面分析,对比微博服务中两类用户的异同;
(2)讨论传统社交网络服务中的用户推荐方法,结合微博服务的特点,建立微博关注推荐模型,该模型包括用户过滤方案、关注矩阵建立算法、子模型推荐算法等部分。
实验结果表明推荐模型不仅可以为用户推荐关注对象,还能依照亲密程度对推荐结果进行划分;
1.6论文组织结构
论文全文共6章,各章节组织如下:
第1章绪论。
介绍课题的研究背景、国内外现状,阐述了课题的主要研究内容、关键技术、主要成果及创新点。
第2章相关技术。
对PHP、B/S结构、MySQL和EclipsePHPstudio进行了介绍。
第3章需求分析。
介绍基本微博系统的需求分析和功能设计。
第4章数据库分析和设计。
介绍微博的数据库分析和设计。
第5章系统模块设计实现。
介绍系统各模块的实现及界面。
1.7本章小结
本章介绍了微博系统的课题背景,详细描述了微博的特点,国内现状和未来的发展趋势,并对系统的运行平台以及开发工具、论文的组织结构等内容做了简单介绍。
第2章相关技术
2.1Apache服务器
Apache是世界使用排名第一的Web服务器软件。
它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一。
因为它是自由软件,所以不断有人来为它开发新的功能、新的特性、修改原来的缺陷。
Apache的特点是简单、速度快、性能稳定,并可做代理服务器来使用。
世界上很多著名的网站如Amazon、Yahoo!
、W3Consortium、FinancialTimes等都是Apache的产物。
本来它只用于小型或试验Internet网络,后来逐步扩充到各种Unix系统中,尤其对Linux的支持相当完美。
Apache有多种产品,可以支持SSL技术,支持多个虚拟主机。
Apache的性能无疑是优秀的,并且和PHP语言的完美结合,使开发一个中小型网站变得轻而易举。
因此本系统采用Apache服务器来解释运行由PHP编写的程序。
2.2MySQL数据库[2]
MySQL是一个多用户、多线程的SQL数据库,是一个客户机/服务器结构的应用,它由一个服务器守护程序mysqld和很多不同的客户程序和库组成。
SQL(StructuredQueryLanguage结构化查询语言)是目前使用最广的并且是标准的数据库语言。
SQL语言使得存取或更新信息变得十分容易,你可以直接使用SQL从网站上查询信息。
MySQL的快速和灵活性足以满足一个网站的信息管理工作。
数据库与用户端之间的接口程序可以使用CGI进行通信。
新网ChinaDNS使用的是PHP,使用PHP和MySQL这两样东西加在一起,对于开发数据驱动的网站这项工作而言是最佳组合。
PHP是一种用于服务器端执行程序解释的脚本语言。
如果你接触过ASP的话,那么您对于在HTML页面中嵌入代码应该是比较熟悉了。
PHP代码在服务器一端被解释、执行并转变成普通的HTML页面内容,送给浏览器一端。
这种模式使得我们可以用它来完成相当复杂的功能。
MySQL的功能特点如下:
(1)可以同时处理几乎不限数量的用户;
(2)处理多达50,000,000以上的记录;
(3)命令执行速度快,也许是现今最快的;
(4)简单有效的用户特权系统;
(5)数据类型。
字段支持大量数据类型是件好事。
通常的整数、浮点数、字符串和数字均以多种长度表示,并支持变长的BLOB(BinaryLargeOBject)类型字段由自动增量选项,日期时间字段也能很好的表示。
MySQL与大多数其他数据库系统不同的是提供两个相对不常用的字段类型:
ENUM和SET。
ENUM是一个枚举类型,非常类适于Pascal语言的枚举类型,它允许程序员看到类似于'
red、'
green'
、'
blue'
的字段值,而MySQL只将这些值存储为一个字节。
SET也是从Pascal借用的,它也是一个枚举类型,但一个单独字段一次可存储多个值,这种存储多个枚举值的能力也许不会给你一些印象(并可能威胁第三范式定义),但正确使用SET和ONTAINS关键字可以省去很多表连接,能获得很好的性能提高。
(1)SQL兼容性MySQL包含一些与SQL标准不同的转变,他们的大多数被设计成是对SQL语言脚本语言的不足的一种补偿。
然而,另一些扩展确实使MySQL与众不同,例如,LINK子句搜索是自动地忽略大小写的。
MySQL也允许用户自定义的SQL函数,换句话说,一个程序员可以编写一个函数然后集成到MySQL中,并且其表现的与任何基本函数如SUM()或AVG()没有什么不同。
函数必须被编译道一个共享库文件中(.so文件),然后用一个LOADFUNCTION命令装载。
它也缺乏一些常用的SQL功能,没有子选择(在查询中的查询)。
视图(View)也没了。
当然大多数子查询可以用简单的连接(join)子句重写,但有时用两个嵌套的查询思考问题比一个大连接容易。
同样,视图仅仅为程序员隐蔽where子句,但这正是程序员们期望的另一种便利。
(2)存储过程和触发器MySQL没有一种存储过程(StoredProcedure)语言,这是对习惯于企业级数据库的程序员的最大限制。
多语句SQL命令必须通过客户方代码来协调,这种情形是借助于相当健全的查询语言和赋予客户端锁定和解锁表的能力,这样才允许的多语句运行。
(3)参考完整性(ReferentialIntegrity-RI)MySQL的主要的缺陷之一是缺乏标准的RI机制;
然而,MySQL的创造者也不是对其用户的愿望置若罔闻,并且提供了一些解决办法。
其中之一是支持唯一索引。
Rule限制的缺乏(在给钉字段域上的一种固定的范围限制)通过大量的数据类型来补偿。
不简单地提供检查约束(一个字段相对于同一行的另一个字段的之值的限制)、外部关键字和经常与RI相关的“级联删除”功能。
有趣的是,当不支持这些功能时,SQL分析器容忍这些语句的句法。
这样做目的是易于移植数据库到MySQL中。
这是一个很好的尝试,并且它确实未来支持该功能留下方便之门;
然而,那些没有仔细阅读文档的的人可能误以为这些功能实际上是存在的。
(4)安全性自始至终我对MySQL最大的抱怨是其安全系统,它唯一的缺点是复杂而非标准,另外只有到调用mysqladmin来重读
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 用户 关注 排名 实现