搜索引擎的学习与利用梦零终极版.docx
- 文档编号:23755247
- 上传时间:2023-05-20
- 格式:DOCX
- 页数:37
- 大小:105.43KB
搜索引擎的学习与利用梦零终极版.docx
《搜索引擎的学习与利用梦零终极版.docx》由会员分享,可在线阅读,更多相关《搜索引擎的学习与利用梦零终极版.docx(37页珍藏版)》请在冰豆网上搜索。
搜索引擎的学习与利用梦零终极版
搜索引擎的优化使用
不要再轻易告诉别人,说自己“会上网”。
只有明白了以下这些内容,才能说是真正意义上的“上网”,让你对网络的利用更加快捷而准确。
否则,只是会“打开网页”,而非“会上网”。
二者的差异,并非等同,相信看过下文,您自会一番心得。
——写于前面
目录
搜索引擎的优化使用1
前言:
全球最佳的十二搜索引擎5
1、Google5
2、雅虎5
3、XX5
4、Search:
6
5、Infospace:
6
6、Infoseek:
6
7、Bing:
6
8、AltaVista:
7
9、DMOZ:
http:
//dmoz.org7
10、EXCITE:
7
11、Lycos:
7
12、Alltheweb:
8
一,关于逻辑连接词与通配符的使用:
9
通配符的使用:
9
与:
and(“+”可以省略):
9
或:
or:
9
非:
-:
9
组合搜索命令:
9
注意:
10
关于更新与爬虫问题:
10
禁用词(StopWords):
11
二,查找一类文件(同类扩展名的文件)11
三,Google中的检索技巧12
Google中的高级检索12
Google语法13
通配符问题13
关键字的字母大小写13
搜索引擎忽略的字符以及强制搜索13
XX与google的比较14
四,XX中的检索技巧14
初学者入门14
高级搜索功能15
搜索结果页指南15
常见问题15
XX常见问题解答16
XX中命令集及高级命令17
XX搜索结果页指南17
四,其它检索21
目录检索21
新闻搜索22
Google其它的最新发展动态22
AllTheWeb中支持的命令23
Google图片24
一个有趣的地方24
五,关于搜索引擎命令24
1、搜索引擎命令大全(总论)24
2、Google中的高级命令:
27
Site27
intitle:
29
Allintitle:
29
inurl:
29
allinurl:
29
Allintext30
allinanchor30
daterange30
related30
link30
anchor31
Cache31
Intitle与allintitle32
Indexof32
检索示例:
33
3、搜索引擎命令大全(Mini版)33
4、搜索引擎的命令(补充与对比版)34
1.intitle:
34
2.intext:
34
3.inanchor:
35
4.site:
35
5.inurl:
35
6.link:
35
7.cache:
36
8.daterange:
36
9.filetype:
37
10.related:
37
11.info:
37
12.phonebook:
37
13.define:
37
5、XX中,使用的命令集37
六,几个讨论:
39
1、site后的网址位置39
2、site与inurl的区别40
3、命令在特定的范围内再次缩小搜索范围41
4、命令的等同与组合会用41
前言:
全球最佳的十二搜索引擎
只有你不想要的,没有我们找不到的。
首先,让我们了解一下,梦零为您收集的全球最佳的十二个搜索引擎。
1、Google
大哥就是大哥,无人可以憾动其地位。
Google搜索时全世界最受欢迎的搜索引擎,市场占有率62%。
由于Google已经成为最流行的搜索引擎之一,所以很多网站管理员也十分热衷于跟踪他们网站的排名,并试图解释他们排名变化的原因。
2、雅虎
雅虎(Yahoo!
)是美国著名的互联网门户网站,雅虎市场占有率12.8%。
其服务包括搜索引擎、电邮、新闻等。
雅虎搜索是国际两大顶级网页搜索引擎之一,也是全球使用最高的搜索引擎之一,具有全球第一的海量数据库,拥有索引全球190亿网页的全球最大搜索引擎、索引20亿图片的全球最大图片搜索引擎、索引2000万音乐文档的全球最大音乐搜索引擎。
3、XX
XX是全球最大的中文搜索引擎,其使用了高性能的“网络蜘蛛”程序自动的在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。
XX拥有目前世界上最大的中文信息库,总量达到6000万页以上,并且还在以每天几十万页的速度快速增长。
XX的市场占有率5.2%。
XX,符合了中国人的检索心理,知道中国人想要什么,这一点人,google恐怕就不算太“亲近”我们了。
比如,搜索“MM”一词的网络意义,XX在“前几条”就能提供了“XX百科”为我们解答,而google则不然。
因此,XX更善长于中文内容的检索。
但中文检索内容以外,或者技术上,均于上面两位Bigborthers相差甚远。
以上为市场占有率的前三名,在中国国内的搜索速度均很快。
4、Search:
搜索的速度极快,有时结果优于XX。
5、Infospace:
是著名的原搜索引擎,在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。
infospace的主要优点在于它能够利用该引擎猜测出来的、附加的搜索条件来智能优化用户的搜索结果。
在中国的访问速度略慢。
6、Infoseek:
是全球著名的搜索引擎之一,提供全文检索功能,并有较细致的分类目录。
网页收录极其丰富,以西文为主。
7、Bing:
Bing是一款微软公司推出的用以取代LiveSearch的搜索引擎。
中文名称被定为“必应”,有“有求必应”的寓意。
Bing搜索的最大特点在于,与传统搜索引擎只是单独列出一个搜索列表不同,微软还会对返回的结果加以分类。
Bing能够为用户提供更为广泛的相关结果。
在中国国内的搜索速度较快(自动切换为中文版)。
8、AltaVista:
AltaVista是功能全面的搜索引擎,曾经名噪一时,但现在其地位已被Google取代。
即便如此,它仍被认为是功能最完善,搜索精度较高的全文搜索引擎之一。
AltaVista提供常规搜索、高级搜索和主题搜索,主题包括图象(Images)、MP3/Audio等音频文件及视频文件等。
它允许以25种不同的语言进行搜索,并提供英、法、德、意、葡萄牙、西班牙语双向翻译。
9、DMOZ:
http:
//dmoz.org
DMOZ是一个著名的开放式分类目录(OpenDirectoryProject),之所以称为开放式分类目录,是因为DMOZ不同于一般分类目录网站利用内部工作人员进行编辑的模式,而是由来自世界各地的志愿者共同维护与建设的最大的全球目录社区。
全世界最大的开放式目录。
在中国国内的搜索速度均速度略慢。
10、EXCITE:
EXCITE搜索引擎是ARCHITEXT公司的产品,其数据库界面非常友好,用户可以利用关键词、词组和自然语言进行检索。
由于它已经开发出包括中国的多种全球区域版本,为特定地区提供高效率的服务,因此它也是使用最为广泛的搜索引擎之一。
可分类查找Web、Images、News、Video。
在中国国内的搜索速度还可以接受。
11、Lycos:
Lycos是搜索引擎中的元老,是最早提供信息搜索服务的网站之一。
Lycos是目前最大的西班牙语门户网络。
Lycos提供常规及高级搜索。
高级搜索提供多种选择定制搜索条件,并允许针对网页标题、地址进行检索。
并且具有多语言搜索功能,共有25种语言供选择。
在中国国内的搜索速度还可以接受。
12、Alltheweb:
Alltheweb属于全文搜索引擎。
目前提供常规搜索、高级搜索和主题搜索功能。
Alltheweb也是当今成长最快的搜索引擎,目前支持225种文件格式搜索,其数据库已存有49种语言的21亿个Web文件。
而且以其更新速度快,搜索精度高而受到广泛关注,被认为是Google强有力的竞争对手。
(XX、谷歌(Google)等也是全文搜索引擎。
与之相对应的是目录索引类搜索引擎。
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有XX(Baidu)。
它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。
)
一,关于逻辑连接词与通配符的使用:
通配符的使用:
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?
”代表单个字符等。
GOOGLE不支持通配符,只能做精确查询,关键字中的“*”或者“?
”会被忽略掉。
(记住,均是在半角下输入此二通配符)
与:
and(“+”可以省略):
例:
“wordwari”;“WordWarI”必须检索时:
无需用and,两词间空格默认and匹配。
例:
fluorescencechemosensor;化学荧光传感器
或:
or:
或者检索:
OR必须大写,在google中尤其如此。
例:
polyamideORnylon
非:
-:
用-表示,但减号之前必须留一空格,而减号之后,必须无空格。
例:
“flamerreettaarrddaann**”-halogen(不能用NOT)
短语检索:
“fiberreinforced”
组合搜索命令:
利用-来限定关键词一定不要出现在结果中。
例如:
键入seo-网站,会找出包含seo但除了网站的网站。
利用*代替所有的字母,模糊检索那关键词或者是不能确定的关键词。
例如:
键入"爱*"后的会查询到包含爱字的相关内容。
利用()可以把多个关键词划分为一组,并进行优先查询。
例如:
键入"(seo+网络)"来搜索包含"seo"与"网络"的信息.
利用and表示前后两个关键词是"与"的逻辑关系。
例如输入关键词:
聊城and江北水城会找出将包含聊城和江北水城有关的网站。
利用or(|)表示前后两个词是"或"的逻辑关系。
例如输入关键词:
聊城or出口,会找出将包含聊城或者出口的网页。
使用“A|B”来搜索“或者包含词语A,或者包含词语B”的网页。
以上信息在最实用的XX搜索引擎中均可使用。
其中:
wd代表查询关键词
cl=3代表网页搜索
ie=gb2312代表查询输入关键词的编码
pn代表显示搜索结果的页数
rn代表页面显示搜索结果的数量
两个指定关键字之间允许出现的关键词数。
注意:
在XX中,以加引号搜索“强制字符串”时,如“梦飘零”,XX却会将分开以后的结果也列出,列出梦+飘零这类结果,非常可恶,而google则不会出现这类问题。
大部分搜索引擎,对大小写不敏感。
关于更新与爬虫问题:
网易与yahoo的搜索引擎买的就是google,如果google找不到,就不必去此二者。
google每月更新一次web数据库,如果google找不到,去更新频度更勤一些的搜索引擎。
如——9到12天,或许有收获。
google的爬虫(文献检索的起始长度)只爬到每个文档的前110k字节处就停止了,所以长文档里面的部分,google会找不到。
禁用词(StopWords):
最常用的字符以及数字和单个字母等高频词,在检索时系统自动忽略不作检索。
如果必须检索禁用词时可用+,或“”。
如:
of,is,by,i,的为,“http”,“.com”,3等……
二,查找一类文件(同类扩展名的文件)
“filetype:
”是Google开发的非常强大实用的一个搜索语法。
也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。
目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。
PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
同时,也当注意,对于搜索引擎不支持的文件类型,可以采用下面的高级搜索来实现。
如搜索midi文件,用"月光下的凤尾竹inurl:
midi",可以实现非常好的结果。
搜索:
“资产负债表filetype:
docORfiletype:
xlsORfiletype:
ppt”
结果:
已搜索有关资产负债表filetype:
docORfiletype:
xlsORfiletype:
ppt的中文(简体)网页。
搜索:
“拉登OR拉丹site:
”
Google现在已经可以搜索15种,语法:
“filetype:
”。
AdobePortableDocumentFormat(pdf)
AdobePostScript(ps)
Lotus1-2-3(wk1,wk2,wk3,wk4,wk5,wki,wks,wku)
LotusWordPro(lwp)
MacWrite(mw)
MicrosoftExcel(xls)
MicrosoftPowerPoint(ppt)
MicrosoftWord(doc)
MicrosoftWorks(wks,wps,wdb)
MicrosoftWrite(wri)
RichTextFormat(rtf)
ShockwaveFlash(swf)
Text(ans,txt)
文件类型限定:
filetype:
文件名后缀,XX中,亦有此作用)
例:
fluorescencechemosensorfiletype:
三,Google中的检索技巧
Google中的高级检索
说明:
在所有的google搜索中,“限制条件”可以与“搜索内容”位置互换,如:
例:
inurl:
midi“沧海一声笑”与“沧海一声笑”inurl:
midi
二者完全等同。
详细内容见下文中的“搜索引擎命令全集”中的google部分。
Google语法
Google用大写的“OR”表示逻辑“或”操作。
搜索“AORB”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。
在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。
Google用减号“-”表示逻辑“非”操作。
“A-B”表示搜索包含A但没有B的网页。
注意:
这里的“”和“-”号,是英文字符,而不是中文字符的“+”和“-”。
此外,操作符与作用的关键字之间,不能有空格。
比如“搜索引擎-文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。
一般搜索引擎需要在多个关键字之间加上“”,而Google无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。
现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。
通配符问题
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?
”代表单个字符等。
Google对通配符支持有限。
它目前只可以用“*”来替代单个字符。
比如,“以*治国”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。
关键字的字母大小写
Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
搜索引擎忽略的字符以及强制搜索
Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。
在上例“”worldwarI””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
这一搜索事实上把“www的历史”作为完整的一个关键字。
显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。
XX与google的比较
搜索英文不必说用google,搜索中文呢?
很多人并不了解它们更新的情况,google发展早,因而它贮存了大量旧的信息,XX发展迟,信息较新。
更新速度:
对中文google一般半月至一月一更新,而且仅搜索到三级链接,三级以下便不在搜索,那么我如何看到最新的google搜索的结果呢?
这个站点:
XX的更新较快,半月一次,最快一周。
那么如何衡梁这半月与一月的差剧与价值?
对于一些试用数据库,有效期短,或象WF等一月一换MM,最好选用XX,现在维普老是打一枪换一个地方,因而也只好用XX了,google往往搜索出来的结果已过期了。
而能长期使用的MM或数据库,一般象国外的(国内有没有,我真不知道),最好用google,毕竟技术更老道一些,搜索出的结果更多,更广!
四,XX中的检索技巧
初学者入门
1.搜索,就这么简单
2.什么是关键词
3.准确的关键词
4.输入两个关键词搜索
高级搜索功能
1.减除无关资料
2.并行搜索
3.相关检索
4.XX快照
5.网页预览
6.Flash搜索
7.在指定网站内搜索
8.在标题中搜索
9.在url中搜索
10.搜索援助中心
11.IE搜索伴侣
12.XX搜霸
搜索结果页指南
D.在结果中查询
P.XX快照
R.该网站内的更多结果
V.相关检索
常见问题
1.如何清除搜索框中的历史记录?
2.为什么我找不到资料?
3.简体和繁体有无影响?
4.英文字母大小写有无影响?
5.怎样不让搜索引擎收录网站?
XX常见问题解答
1.如何清除搜索框中的历史记录?
如果您的浏览器是IE4,则由查看—>internet选项—>内容—>自动完成—>清除表单—>完成。
如果您的浏览器是IE5,则由工具—>internet选项—>内容—>自动完成—>清除表单—>完成。
如果您希望IE浏览器以后不再记录您输入搜索框的关键词,在“自动完成”里把“表单”前的勾去掉即可。
2.为什么我找不到资料?
XX的统计表明,用户找不到资料的两个最常见原因,一是输入的词语中含有错别字,二是使用过于冗长的关键词搜索。
搜索引擎并不理解网页上的内容,只会找出含有您输入的全部关键词的网页。
所以,输入[斑竹]、[以德制国]搜索,是找不到跟"版主"、"以德治国"相关资料的;输入[现代爱情故事歌词]、[铃羊车的各种图案]、[上海到成都列车时刻表],也是找不到相关资料的。
使用多个词语搜索才能获得更多跟好的资料,您搜索时应该输入的是[现代爱情故事歌词]、[铃羊车图案]、[上海成都列车时刻表]。
3.简体和繁体有无影响?
只要是标准编码,就没有影响。
在XX搜索引擎,您输入标准编码的繁体中文或简体中文,都可以同时搜到繁体中文和简体中文网页。
并且,搜索结果中的繁体网页摘要信息会自动转成简体中文,方便您阅读。
4.英文字母大小写有无影响?
XX搜索引擎不区分英文字母大小写。
所有的字母均当做小写处理。
例如:
输入"oicq",或"OICQ",或"oIcQ",结果都是一样的。
5.怎样不让我的网站出现在搜索引擎中?
请见:
XX中命令集及高级命令
见第五章部分。
XX搜索结果页指南
A.
预览预览本页全部结果(推荐宽带用户使用)
点击此链接,将在每篇搜索结果下打开一个窗口实时展示该结果网页。
同时,链接也将变为“关闭本页全部预览”,再次点击,即可关闭所有展示窗口。
B.
搜索框
在这里,您仅需输入查询内容并敲一下回车键(Enter),即可找到相关资料。
或者,您输入查询内容后,用鼠标点击"XX搜索"按钮,也可找到相关资料。
C.
XX搜索按钮
您只要点击此按钮,XX搜索引擎便开始搜索。
D.
在结果中查询
选中该项后,重新输入查询内容,可在当前搜索结果中进行精确搜索。
E.
网页搜索
点击此按钮,可切换到XX网页搜索。
F.
MP3搜索
点击此按钮,可切换到XXMP3搜索,并看到当前关键词的MP3搜索结果。
G.
Flash搜索
点击此按钮,可切换到XXFlash搜索,并看到当前关键词的Flash搜索结果。
H.
信息快递
点击此按钮,可切换到信息快递搜索,并看到当前关键词的信息快递搜索结果。
XX信息快递服务,是让用户通过XX搜索平台发布信息的一种服务。
其它用户可在XX搜索引擎上使用关键词检索到对应信息。
I.
搜索结果统计信息
这是有关搜索结果数量,以及搜索时间的统计。
J.
检索扩展
提示您输入关键词的同音词、错别字纠正等。
即使您只输入关键词的拼音搜索,也能提示出最符合的中文关键词。
K.
网页标题
这是搜索结果中该网页的标题。
点击该网页标题可直达该网页。
L.
网页摘要
结果网页的信息摘要。
其中您输入搜索的词语,都已高亮显示,以便阅读。
M.
网页网址(url)
这是搜索结果中该网页的网址(url)。
N.
网页大小
这个数字是这一网页文本部份的大小。
O.
网页日期
这是XX搜索引擎更新这个网页的时间。
P.
XX快照
点击每条搜索结果后的"XX快照",可查看该网页的快照内容。
XX搜索引擎已先预览各网站,拍下网页的快照,为用户贮存大量的应急网页。
XX快照不仅下载速度极快,而且您搜索用的词语均已用不同颜色在网页中标明。
Q.
网页预览
点击每条搜索结果后的“网页预览”,可以在该位置下打开一个窗口实时展示该结果网页。
同时,“网页预览”也将变为“关闭预览”,网友再点击“关闭预览”,即可关闭该展示窗口。
R.
该网站内的更多结果
为了便于您阅读更多网站的内容,XX搜索引擎已经自动为您作类聚,每个网站(或频道)只显示一个最相关网页的信息。
点击此链接,可查看该网站内符合搜索条件的更多结果。
S.
竞价排名标记
参与竞价排名的搜索结果摘要后有此标记。
点击此链接,进入XX竞价排名服务窗口。
T.
全部搜索结果
为提供最相关结果,XX已将结果中部份相似网页略去,点击此链接,可查看全部搜索结果。
U.
翻页
显示搜索结果网页顺序,点击相应数字可进入相应搜索结果页面。
点击“下一页”可进入当前页面的下一页。
V.
相关检索词
XX搜索引擎会为您提供"其它用户搜索过的相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 搜索引擎的学习与利用 梦零终极版 搜索引擎 学习 利用 终极
![提示](https://static.bdocx.com/images/bang_tan.gif)