雅虎搜索引擎特点.docx
- 文档编号:10284087
- 上传时间:2023-02-09
- 格式:DOCX
- 页数:22
- 大小:142.45KB
雅虎搜索引擎特点.docx
《雅虎搜索引擎特点.docx》由会员分享,可在线阅读,更多相关《雅虎搜索引擎特点.docx(22页珍藏版)》请在冰豆网上搜索。
雅虎搜索引擎特点
雅虎搜索简介
Yahoo!
全球性搜索技术(YST,Yahoo!
SearchTechnology)是一个涵盖全球120多亿网页(其中雅虎中国为12亿)的强大数据库,拥有数十项技术专利、精准运算能力,支持38种语言,近10,000台服务器,服务全球50%以上互联网用户的搜索需求。
雅虎为您搜索信息,提供了最新、最快捷的方式,不管这个信息是来自雅虎自己的网站,还是世界的任何一个角落。
雅虎搜索的发展里程碑
90年代初,搜索引擎的应用起源于少数高校和科研机构中对研究论文的查找。
1994年4月,斯坦福大学两位博士生杨致远和DavidFilo共同创办了雅虎,通过著名的雅虎目录为用户提供导航服务。
雅虎目录有近100万个分类页面,14个国家和地区当地语言的专门目录,包括英语、汉语、丹麦语、法语、德语、日语、韩文、西班牙语等。
自问世以来,雅虎目录已成为最常用的在线检索工具之一,并成功地使搜索引擎的概念深入人心。
随着网页数量的增长和用户对关键词查询的需要,从1996年到2004年,雅虎先后选用AltaVista、Inktomi等第三方的搜索引擎作为自己网页搜索的后台服务提供商。
为给用户提供更好的搜索体验,雅虎先后收购了Inktomi和Overture等著名的搜索引擎公司,并结合自己多年的搜索技术,重新整合打造出YST搜索技术平台。
2004年3月,雅虎开始推出独立的搜索服务,迅速成长为全球第二大搜索引擎。
进入2005年后,雅虎搜索逐步确立了社区化搜索(SocialSearch)的策略,将积极发挥全球庞大的注册用户群来积累大批高质量内容和元数据(MetaData),从而改善用户的搜索体验。
在这种策略下,雅虎不断推出新的社区化搜索服务,例如:
知识堂、收藏+等,并收购了著名的照片共享网站Flickr和社会书签网站Del.icio.us,进行产品上的优势互补。
雅虎搜索以人为本的理念(BetterSearchThroughPeople)开始引领新的潮流。
雅虎搜索服务大全
网页搜索
搜索全球38种语言网页、文档
视频搜索
为您网罗互联网上精彩的视频短片
资讯搜索
搜索、浏览最新资讯
音乐搜索
百万MP3金曲,只有想不到,没有搜不到!
网址大全
方便的上网导航,精彩网站一网打尽
图片搜索
搜索超过16亿全球图片,多彩世界触手可及
免费站内搜索
免费获取代码,实现对您网站的站内搜索
搜索排行榜
全球用户用搜索投票,流行热点决不错过
影视搜索
大片好剧酷评尽在雅虎影视搜索
WAP搜索
手机也能搜图片,简单方便全免费
酷贴搜索
搜尽奇谈怪帖,了解非主流的世界
搜索日志
雅虎搜索中文博客站点,用户交流平台
雅虎搜索使命
通过帮助人们发现、使用、分享、拓展全人类知识来丰富我们的生活,简称FUSE。
发现(Find):
帮助人们找到他们想要的信息;
使用(Use):
利用搜索完成工作或生活中的任务或者目标;
分享(Share):
与你的朋友分享你的知识,或者与分享你知识的人成为朋友;
拓展(Expand):
利用我们人的智慧来扩展全球信息知识库。
YST技术
YST是Yahoo!
全球搜索技术(Yahoo!
SearchTechnology)的简称,是一个涵盖全球100多亿网页的强大资料库,拥有数十项技术专利和近万台服务器的分布式集群架构,支持38种语言,服务全球50%以上网友的搜索需求。
雅虎网页搜索引擎的基本技术原理如下:
首先,搜索引擎会建立一个网页地图(Webmap),记录互联网的链接结构,再使用网页抓取的蜘蛛程序(Robot)根据网页地图来抓取(Crawl)质量好的网页,存储到网页快照数据库中。
接下来,索引程序(Indexer)会将快照数据库中的网页编号存储到网页索引数据库中,在这个过程中会利用相关技术去掉作弊网页(Spam)。
当用户输入一个查询词搜索时,查询程序会使用这个查询词到索引数据库中比较,并经过相关性计算后,按照相关的程度对网页进行排序,相关性越高的排的越靠前。
相关性的计算是包括各种因素的综合结果,例如:
网站标题或网页内容对查询词的匹配,网页被链接的次数等。
1.什么是雅虎全能搜索?
o雅虎全能搜索是基于Omni-Search技术架构对搜索体验的创新实践,通过对用户查询意图的智能分析,利用通用排序技术,在一个结果页中整合网页、图片、音频、视频、新闻等各种搜索产品,从而最大简化用户的搜索过程。
雅虎全能搜索的Omni-Search技术架构,旨在打造跨平台(PC、手机和电视等)的智能型通用搜索引擎。
o目前,雅虎全能搜索还在起步阶段,未来将会有更多贴心搜索功能陆续加入。
2.雅虎全能搜索有什么特点?
o雅虎全能搜索采用了雅虎独有的Omni-Search技术架构。
用户无需了解各种垂直搜索产品,只要输入查询词,雅虎全能搜索就可以通过智能分析,返回各种相关结果(网页、图片、音频、博客等),并进行综合排序。
Omni-Search架构的理念在于简化搜索过程,将最相关的各种信息快速返回给用户,打造真正意义上的智能型通用搜索引擎。
3.雅虎全能搜索和综合搜索有什么不同?
o除前端展现技术外,雅虎全能搜索会对用户查询词进行智能分析,基于相关性动态返回不同布局的网页、图片、音频等信息。
综合搜索(ComboSearch)是基于固定的模板,整合了各种垂直搜索的结果,每种垂直搜索的位置基本上是不变化的。
4.雅虎全能搜索和网页搜索有什么不同?
o网页搜索是基于文本信息的全网搜索形式,而雅虎全能搜索则是包括了网页搜索在内的多种信息形式(如图片、音频等)的搜索引擎。
雅虎全能搜索特色
1.什么是旅游搜索?
o旅游搜索整合了网页搜索中的风景名胜和旅游攻略的信息,为出游的用户提供旅游资讯。
o当用户搜索景点名称的时候,搜索结果最上面将会展现该景点的介绍、图片、旅游攻略等信息。
o比如:
搜索关键词“九寨沟”,在搜索结果页的上面展现了九寨沟优美的风光图,图片右侧提供了九寨沟的景点介绍以及旅游攻略,您可以点击“精选景点介绍”以及“精选旅游攻略”看到更多相关信息。
o搜索结果页左侧是相关旅游景点推荐,是系统根据用户搜索词自动推荐的旅游景点,点击进入后可以了解丰富的旅游信息。
2.什么是房产搜索?
o房产搜索是指将网页搜索中与房产有关的的信息挑选出来,当用户搜索房产类关键词的时候,在搜索结果中优先展示最相关的房产类信息。
包括租房信息、二手房买卖信息等。
o比如:
搜索关键词词“北京二手房”,搜索结果上面优先显示3条发布时间最新的北京二手房信息。
点击“最新租房信息”或者点击“更多”可以直接到达“北京二手房”的雅虎本地搜索结果页,看到更多更全面的相关信息。
3.什么是下拉提示?
o当输入关键词时,搜索框会展开下拉的提示框,向用户展示与所输入关键词最接近的热门查询词。
如果在提示框中看到所要查询的关键词,直接用鼠标或键盘选择即可达到搜索结果页。
o比如:
输入“奥运”,雅虎全能搜索下拉提示框会显示“奥运会”“奥运知识”“奥运门票”等推荐词。
o同时,下拉提示还提供网址直达、拼音提示、股票代码提示等辅助输入的功能。
推荐网友搜索的热门词的同时,可以更加快捷的找到想要的搜索结果。
o比如:
网址直达功能,输入“雅虎”或“yahoo”,会在下拉框的第一条结果提示“雅虎首页”,点击后就会直接带你到中国雅虎的首页。
o比如:
拼音提示,输入“aoyunhui”,下拉提示就会给出准确的结果“奥运会”。
o比如:
股票代码提示,输入“600036”,下拉提示的结果是“招商银行”。
4.什么是股票搜索?
o炒股是时下最流行的一种业余生活,在众多的股票信息中查找自己所关注的股票行情就不是一件很容易的事情了。
雅虎全能搜索提供给您的股票查询功能,很大程度提高了您查询股票信息的效率。
o在搜索框中输入股票名称、股票代码、或者特定的股票标志性词汇,就会出现股票搜索。
在股票搜索可以直接看到股票或股市指数,实时的行情数据,股票走势折线图,相关资讯报导,以及网页搜索结果。
o比如:
查询600028,就可以得到中国石化的股票行情数据。
5.什么情况下会出现股票搜索?
o直接输入股票名称、股票代码、或者特定的股票意图词时,就可以看到股票搜索。
股票查询功能除了提供某支股票的行情查询外,还提供沪深两市和香港股市的大盘指数查询。
o比如,查询上证指数就可以上海证券交易所的大盘行情。
6.什么情况下会出现“相关资讯”?
o资讯是用户取得信息来源的一种重要方式,为了丰富网页的搜索结果、提供更加全面的信息,雅虎全能搜索在部分搜索结果中加入了“相关资讯”的内容。
o当用户搜索近期比较热门的人物、事件或者股票名称的时候,可以看到相关资讯。
o比如:
查询招商银行就可以得到关于招商银行的最新资讯。
7.首页邮箱登陆界面提供哪些功能?
o雅虎邮箱为用户提供了强大的功能,为了方便用户使用,特别在首页加入邮箱的登陆界面。
如果在首页选择登陆雅虎邮箱,就可以看到邮箱的未读邮件状态。
可以选择从邮箱登陆界面进入雅虎邮箱查看详情。
8.什么情况下会出现知识堂提问框?
o通常会有很多用户习惯使用疑问形式的查询词进行搜索,然而有时在众多的搜索结果中并不能迅速的找到自己想要的结果。
此时请不要着急,全能搜索可以解决您的这个问题。
当您使用带有疑问形式的查询词时,如:
怎样、如何、为什么等类似词语,在搜索结果页的最上方会出现一个知识堂提问框,您直接点击“给我答案”按钮,即可进入到提问页面。
您可以对问题进行详细描述,并选择好接收答案的方式,然后进行提交,这样您的问题就会进入到知识堂页面中,届时会有很多热心的网友告知您想要的答案。
您可以选择使用邮箱接收答案,也可以选择使用手机接收答案(使用手机接收答案是免费的),这样或许比您在众多搜索结果中查找答案更省时,更准确。
欲了解更多关于知识堂的使用方法,点击此处进入知识堂帮助中心。
9.什么是专家答题?
o在您使用疑问形式的查询词进行搜索时,在结果页的上方出现提问框的同时,在右侧您还会看到知识堂专家提问的模块,您在匿名状态或者登录状态都可以向专家进行提问。
输入您的问题,填写正确的邮箱地址及其他相关信息,点击提交即可。
当专家对您的问题进行答复时,答案会自动发送到您的邮箱里面。
相关帮助内容:
什么是知识堂专家?
怎样向特定专家进行提问?
人物搜索专区
1.什么是人物搜索?
o人物搜索是以网页搜索为计算基础,基于传统搜索的信息挖掘技术,将人和人之间的关系抽取出来,针对知名人士给出围绕知名人物的丰富信息。
包括人物简介、人物关系等娱乐化内容。
并可以根据指定关系查看详情。
o比如:
“周杰伦”的人物关系圈有:
“吴宗宪-师生关系”、“方文山-好友关系”等等。
o点击人物关系圈中其中的一个关系人,就可以查到以被点击的人为中心的关系圈;如果点击其中一个关系,可以查到这个关系的详细情况。
o人物关系圈的下面有人物关系的解释,并提供了来源,可以查看关系的详细情况。
o比如:
点击周杰伦和吴宗宪的“信息来源”,就可以查看周杰伦和吴宗宪师生关系的详细情况。
2.什么是人物搜索的六度关系?
o人物搜索的六度关系源自“六度分隔”理论,简单的说就是“最多通过六个人你就能够认识任何一个陌生人”。
通过输入两个人的姓名(姓名1姓名2)可以找到两个人之间的关系,人物六度关系为我们描绘了一张人与人之间的关系传递图。
o比如:
搜索关键词“周杰伦鲁迅”,六度关系为我们展现了流行天王“周杰伦”与中国当代大文豪“鲁迅”之间的人物关系。
3.什么是人物搜索的全部关系?
o人物搜索的全部关系包括人际关系、作品关系以及机构关系。
同时提供个人资料。
o比如:
搜索关键词“王菲”,在王菲的全部关系页面上展示了好友、爱情、恋人等33个人际关系,以及235个作品关系。
选择个人资料,更可以看到王菲的其他重要信息。
4.人物搜索如何处理重名问题?
o重名是个很普遍的现象,人物搜索充分考虑了这个问题。
通过雅虎人物搜索强大的信息抽取和分类技术,对重名的人物信息进行了区分。
用户可以选择察看自己感兴趣的那个人的信息,而不必担心重名混淆的问题。
o比如:
搜索关键词“刘德华”,在维基百科-刘德华信息的右下角,提示了“重名83人”,或者在刘德华的蓝色flash页面上也提示了“和刘德华重名的信息共83条”。
点击后可以看到原来除了明星刘德华,还有那么多位名叫“刘德华”的人,您可以选择查看不同的刘德华。
火车票搜索专区
1.什么是火车票搜索?
o火车票搜索基于雅虎信息提取技术,把互联网上的火车票转让信息实时抓取出来并且自动排序。
用户通过火车票搜索可以找到最新最全的火车票转让信息。
o比如:
搜索关键词“北京到上海”火车票搜索结果可以提供在最近1分钟内发布的火车票转让信息。
2.如何使用火车票搜索?
o在火车票搜索用户可以任意搜索与火车票转让信息有关的关键词,包括:
o1)车次:
比如Z1、D51
o2)出发地-到达地:
比如“北京到上海”
o3)车次和“出发地-到达地”加上日期、铺位类型等词:
比如“T15硬卧”、“广州到上海软卧”等
o比如:
搜索关键词“Z3”或者搜索“北京至武汉”,在搜索结果的最上部会优先显示“Z3”的列车时刻表,或者“北京至武汉”的3个最主要车次的列车时刻表。
列出时刻表的下面是提供用户搜索火车票转让信息的区域。
o在火车票转让信息查询区域,用户只需填入“出发地”和“到达地”,就可以看到最新最全的火车票转让信息。
用户还可以添加其他条件的限制,比如:
车次、出发日期、铺位类型、优选时间等,得到更为准确、更加相关的火车票转让信息。
o比如:
在火车票转让信息查询区域的出发地输入“北京”,到达地输入“长春”,搜索后可以看到按照时间排序的转让信息,并且可以通过搜索结果上面的时间线(蓝色区域)获知未来1周内每天的转让车票数量。
3.火车票搜索的特色是什么?
o全面--时刻监控几百家火车票信息发布网站,不放过一条火车票转让信息。
o实时--分钟级的更新速度。
转让信息一发布,立刻就能搜索到。
o易用--一次搜索掌握一个星期的票数信息,方便灵活安排行程。
博客搜索专区
1.如何让我的博客被雅虎全能搜索收录?
o请确认您的博客服务提供商允许雅虎抓取博客内容。
o目前允许雅虎全能搜索的博客搜索收录的博客服务商有:
o雅虎空间、新浪博客、阿里巴巴网商博客、和讯博客、博客网、网易博客、XX空间、
o搜房博客、TOM博客、中国教育人博客、企博网、csdn博客、博客大巴、凤凰博客、
oLiveSpace、歪酷博客、我爱博客网、博易、天极博客、沪江博客、Donews博客、
o强国博客、BlogSpot、你的博客、逍遥客、育儿博客、东方博客、蓝色月光、
o中华网博客、浙江博客网、中国博客、敏思博客博客生活、天涯博客、网友博客、
o华夏智慧名师博客、126博客网、柒零博客、证券之星星博客外贸精英博客、移动博客、
omyspace
o目前国内主流的博客服务商中只有搜狐博客不允许雅虎抓取。
如果您的博客服务商在上面的列表中,却没能被雅虎收录,请点击这里告诉我们。
2.博客设置了访问权限,是否可以被收录?
o设置了访问权限,是不能被收录的。
所以请保证您的博客设置了公开访问权限。
o以雅虎博客为例,登录后点击博客“设置”链接,在打开的页面中选博客浏览权限为“公开”,则是公开访问权限;反之则是未公开。
未公开的情况下,雅虎搜索无法访问也无法收录。
事实上只有您博客的浏览权限设置为“公开”,其他人才能看到您博客上的文章或者图片,才能认识您,才能对博客的文章进行评论。
这也是扩大博客影响力,广交朋友的必备设置。
3.网站禁止被搜索引擎访问,可以被收录吗?
o如果您的博客服务提供商拒绝雅虎搜索的抓取请求,您的博客将不能被收录。
目前,搜狐博客禁止雅虎搜索的抓取,因而搜狐博客空间下的博客网页将不能被雅虎搜索收录。
4.什么是RSS输出?
o简单说,RSS指站点用来和其他站点之间共享内容的简易方式。
开放博客的RSS功能,可以使搜索引擎更快的发现博客的更新,进行快速收录。
所以,最好请确认您的博客支持并开放了RSS或Atom输出。
RSS还有一个好处是,能准确的提供信息,让博客在搜索引擎中有更好的展现,因此我们推荐您使用RSS。
o以雅虎博客为例,登录后点击博客“设置”链接,在打开的页面中选博客浏览权限为“公开”,同时勾选“RSS功能”开启,表示支持RSS输出;反之则会关闭RSS输出。
5.如何扩大博客的影响?
o利用雅虎全能搜索的博客粉丝,可以找到对您的博客感兴趣的其他博主,让更多的朋友认识您,也让您认识更多的朋友。
o除此之外,您还可以:
oA.可以向搜索引擎和网址站提交您的博客,让更多的用户访问;
oB.经常更新内容,搜索引擎喜欢更新快的博客;
oC.多和其它博主交流,多留言,参与讨论;
oD.开放权限,多与好友交换友情链接,扩大自己的博客圈子。
6.什么是博客结果订阅?
如何使用?
o博客结果订阅是指通过RSS订阅的方式,把关键词的博客搜索结果发送到用户指定位置上并且自动实时更新。
用户不必打开博客搜索,就可以随时、快捷、方便的查看某个关键词的博客搜索结果。
o博客结果订阅的使用方法是:
o1)用户需要借助于具有RSS信息聚合功能的软件,比如SharpReader,NewzCrawler,FeedDemon;或者使用一些具有RSS订阅功能的网络产品,比如个人博客;现在部分浏览器可以通过安装插件的方式提供RSS订阅功能,比如InternetExplorer7.0或者遨游、firefox等。
o2)当搜索某个关键词的时候,博客搜索将会自动产生一个RSS订阅地址。
用户可以在博客搜索结果页左下侧获取到。
将RSS订阅地址添加到阅读软件或者网络产品上,就完成了博客搜索结果的订阅。
o比如:
搜索关键词“股票分析”,在搜索结果页左下侧,有“博客结果订阅”的提示,点击后将出现RSS信息页面,用户只需要将浏览器地址栏中的网址复制下来,添加到自己的阅读工具中,就可以查看实时更新的博客搜索结果了。
7.博客结果订阅的特点是什么?
o1)订阅后的博客结果没有广告或者图片来影响标题或者博客摘要的阅读。
o2)RSS阅读器自动更新用户定制的博客搜索结果的内容,用户可以及时看到最新的博客搜索结果,包括博客文章、视频、博主、播主等等。
o3)用户可以加入多个关键词的RSS订阅地址,同时查看自己关注的多主题的博客文章、视频,或者是阅读博主最新更新的文章。
搜索引擎小技巧集锦
1.巧用空格
如果使用某个查询词进行搜索无法找到准确的结果,不妨在查询词适当的位置加个空格,可以帮助您找到更精确的结果。
比如:
想查询北京地区所有大学的信息,如果搜索“北京大学”,就只能得到北京大学的结果,很难找到其它学校,这是因为“北京大学”这个词本身就是一所的大学的名字。
试着在中间加个空格,搜索“北京大学”,就可以得到北京地区所有大学的信息了。
备注:
虽然搜索引擎可以自动将不同的词语拆分后搜索,但是我们最好在不同词语之间输入空格,尤其是在查询词比较复杂时,这样得到的结果会更准确。
2.空格与减号的妙用
空格+减号,帮我们去掉无用信息。
比如:
“联想-手机”,搜索结果不会出现联想关于手机的信息
3.站内搜索带来的惊喜
在搜索引擎内查找指定网站内的信息,只需要使用命令"site:
"或"domain"。
比如:
在雅虎全能搜索的引擎中查找中国雅虎网站内和财经相关的所有信息,使用查询词“财经site:
”或“财经domain:
”可以找到中国雅虎网站内全部与财经有关的网页。
4.清除搜索框中的历史记录
(1)打开IE浏览器,在菜单中选择“工具”,打开“Internet选项”。
(2)选择“内容”标签,然后单击“自动完成”。
(3)此时会弹出“自动完成设置”窗口,单击“清除表单”按钮。
(4)最后在弹出的询问对话框中选择“确定”。
5.不必担心英文的大小写
搜索引擎会把所有的字母当作小写处理。
比如:
搜索yahoo和YAHOO得到的结果是一样的。
6.双引号带来的精准结果
若您需要得到精确、不分词的搜索结果,可在查询词前后加上双引号(中文双引号、英文双引号都可以)。
比较一下:
搜索"北京大学考研"与北京大学考研。
7.快照,搜索引擎的记忆存储
快照是搜索引擎在收录网页时,对网页做的一个备份。
当您搜索的网页被删除或连接失效时,您可以使用网页快照来查看这个网页。
由于快照是存储在搜索引擎服务器中,所以查看快照的速度往往比直接访问网页要快一些。
8.如何选择查询词?
选择最能描述您所查信息的查询词。
比如:
您想知道“在哪里可以看到山东地图?
”
可以将“山东地图”做为查询词,因为“山东地图”这两个词比“在”、“哪里”、“可以”这些词更能简要、准确的说明想查找的内容。
试一试:
在哪里可以看到山东地图?
山东地图
9.如何在原有结果上进一步查找?
多个查询词之间用空格隔开,然后再进行搜索。
比如:
想查询“马云上福布斯杂志封面的消息。
”
如果只搜索“马云”,会得到很多关于马云的搜索结果,很难找到想要的信息。
但是搜索“马云福布斯封面”,搜索结果中的第一条就是想要的信息。
10.高级搜索语法
(1)title:
“title:
”用于针对标题进行搜索。
比如:
搜索title:
张学友,搜索引擎会搜索到所有标题中包含“张学友”的网页。
由于网页的标题通常会准确的描述网页的内容,所以使用“title:
”进行搜索的效果可能更精确。
title的释义:
超文本窗口标题的开始和结束,它被显示在浏览器顶端的标题栏中。
(2)Link:
“Link:
”用于查找所有链接到某个网址的网页。
比如:
①搜索link:
的网页;
②搜索姚明link:
或者link:
姚明,会搜索到所有链接到“”的网页中,包含“姚明”一词的网页。
备注:
搜索时不能缺少“http:
//”。
(3)Site:
或者domain:
“Site:
”或者“domain:
”用于限定搜索结果的来源。
您如果知道某个站点中有自己需要找的内容,就可以把搜索范围限定在这个站点中,提高查询效率。
使用的方式,是在查询内容的后面,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 雅虎 搜索引擎 特点