数据库调查报告Word下载.doc
- 文档编号:14345604
- 上传时间:2022-10-22
- 格式:DOC
- 页数:13
- 大小:41.19KB
数据库调查报告Word下载.doc
《数据库调查报告Word下载.doc》由会员分享,可在线阅读,更多相关《数据库调查报告Word下载.doc(13页珍藏版)》请在冰豆网上搜索。
目前搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。
搜索引擎(searchengine)是随着web信息的迅速增加,从1995年开始逐渐发展起来的技术。
据发表在《科学》杂志1999年7月的文章《web信息的可访问性》估计,全球目前的网页超过8亿,有效数据超过9t,并且仍以每4个月翻一番的速度增长。
用户要在如此浩瀚的信息海洋里寻找信息,必然会大海捞针无功而返。
搜索引擎正是为了解决这个迷航问题而出现的技术。
搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。
搜索引擎提供的导航服务已经成为互联网上非常重要的网络服务,搜索引擎站点也被美誉为网络门户。
搜索引擎技术因而成为计算机工业界和学术界争相研究、开发的对象。
。
本文旨在对搜索引擎的关键技术进行简单的介绍,以起到抛砖引玉的作用。
二、关键技术综述(技术术语)
1.引擎分类1)目录式搜索引擎:
以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。
信息大多面向网站,提供目录浏览服务和直接检索服务。
该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。
这类搜索引擎的代表是:
yahoo、looksmart、opendirectory、goguide等。
2)机器人搜索引擎:
由一个称为蜘蛛(spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。
服务方式是面向网页的全文检索服务。
该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。
altavista、northernlight、excite、infoseek、inktomi、fast、lycos、google;
国内代表为:
天网、悠游、openfind等。
3)元搜索引擎:
这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。
服务方式为面向网页的全文检索。
这类搜索引擎的优点是返回结果的信息量更大、更全,缺点是不能够充分使用所使用搜索引擎的功能,用户需要做更多的筛选。
这类搜索引擎的代表是webcrawler、infomarket等。
3.各种搜索引擎的不足之处
(1)大多数中文搜索引擎的查询方式较为单一
一般搜索引擎只提供分类浏览的查询方式和关键词全文检索查询方式,缺乏其它途径的查询方式,并且关键词全文检索模式也比较简单,这将导致信息查询的查准率不高的后果。
(2)目前网上的中文信息较少
相比网上外文信息而言,网上中文信息资源较少,且isp中文站点的质量也良莠不齐,信息更新的速度慢。
通常是几个月才有所更新。
对搜索引擎而言,isp站点的内容的质量也非常重要,它和搜索引擎之间是鱼水关系。
(3)采用的技术比较落后
国内的网站所采用的收集资料的技术比较落后,目前我国自行建立的搜索引
擎,如搜狐对站点的描述不多,与国外著名搜索引擎相比还有很大差距。
这是由于它们均采用目录式搜索引擎(directorysearchengine),即通过人工发现信息并依靠编目员的知识进行分类。
这种引擎的优点是准确度较高,缺点是信息量小且维护所耗费的资源大。
分析各种中文搜索工具,由于中文编码的特殊性和搜索工具设计者的局限性,目前的中文搜索工具在实际应用中仍反映出一定的不足,有的收集范围小、信息量少;
有的搜索能力弱,反馈信息少;
有的不支持某一种中文编码类型,从而使获得的信息资料不齐全、不完整,有的返回的信息很多但是查准率较低。
所有这些问题的实质是搜索引擎缺乏知识的理解能力和处理能力,对要检索的关键字词只是简单的进行机械的匹配来实现。
我们可以借鉴一些新的技术方法来优化中文搜索引擎的功能。
三、研究内容
1.web搜索引擎工作原理和体系结构
略
2.nutch分布式搜索引擎的分析
3.lucene中文分词算法
四、研究方法(这里只是作了简单的介绍)
1.搜索引擎示意图(如图1,搜索引擎能够接受用户通过浏览器提交的查询词或则短语,记作q0;
并在一个可以接受的时间内返回一个和该用户查询匹配的网页信息列表记作l,这个列表的每一个条目至少包含三个元素标题,网址链接,摘要)
图1
2.现代高质量的搜索引擎一般采用如图2所示称为三段式的工作流程,即网页搜索,预处理,查询服务。
图2
3.搜索引擎的体系结构如图3:
图3
4.nutch的架构(图4)和工作流程(图5)
图
4
图5
5.lucene的功能主要包括两块,意识文本内控经切词后索引入库,二是根据查询条件返回结果,如图6是lucene的两大功能的逻辑图。
篇二:
数据库软件调研报告
卢文涛
(清华大学水工01,北京100084)
摘要:
从理论和实践两方面作为切入点,采用查询资料的调研方法,明晰了数据库软件的基本定义,并总结出oracle、sybase、microsoftsql三款数据库软件的共性和特性。
通过对比,最终决定使用oracle的数据库软件。
关键词:
数据库软件;
水文;
资料
abstract:
throughboththeoreticalandpracticalresearch,usingthemethodofliteraturereview,ihasclarifiedthedefinitionofdatabasesoftware,andsummarizedthemutualcharacteristicsoforacle,sybaseandmicrosoftsql.bycontrast,theoracledatabasesoftwareistheoptimalchoice.
keywords:
databasesoftware;
water;
information
1.调研方法
在调研过程中需要用不同方法从不同角度来更加全面的了解水文数据库的情况,所以我在调研中的思路主要分为两个方面—理论和实际。
1.1.理论调研
理论调研主要是调研数据库的具体性质,通过查询资料和访谈法对数据库软件做了详细了解,研究了不同数据库软件的共性和特性。
首先肯定是从百度等搜索引擎上搜索数据库软件,了解其基本概念和用处。
之后了解到有oracle,sybase,microsoftsql等几款著名的数据库软件,接着分别有针对性的对这三款软件进行进一步搜索,进行纵向深入和横向对比,了解三者的共性和各自的特性。
1.2.实践调研
通过理论调研,我已经了解了数据库软件的大体情况,但如果要我做出决策,具体要用哪一款软件来编写水文数据库软件,显然是不能仅仅通过理论上的一些东西,由我这样一个外行人做出一些主观的臆测来判断具体用哪个软件来编写水文数据库然间。
而且理论调研的局限在于并不能告诉我水文数据库的具体要求是
什么,只能由我自己通过各款软件详细情况做出判断。
所以以理论必须结合实践,才能帮助我做出更好地选择。
所谓实践调研,就是对目前各省水文数据库的建设情况做调研,研究不同省在建设水文数据库的时候,选择了哪些数据库软件,这必然是经过当时技术人员的仔细思考所做出的决定,站在巨人的肩膀上,这样才能看的更远。
2调研结果及结论
通过两种方法的调研,我得到了海量的信息,对此稍作总结,概括性地得出结果及最终结论。
2.1通过理论调研,得出oracle、sybase、microsoftsql三款数据库软件的各自特性。
总结如表1:
表1不同数据库特点对比表
3.2通过已有资料,进行实践调研,发现湖北、河北等多数省大都应用oracle的数据库软件。
4.结论
通过理论调研和实践调研两方面的调研,得出结论,使用oracle的数据库软件更佳。
篇三:
数据库需求分析报告
高校学生学籍管理
1.概述编写说明:
本章描述本软件开发的背景,系统目标,用户的业务情况,以便于需求理解。
1·
1背景
在学籍管理中,需要从大量的日常教学活动中提取相关信息,以反映教学情况。
传统的手工操作方式,易发生数据丢失,统计错误,劳动强度高,且速度慢。
使用计算机可以高速,快捷地完成以上工作。
在计算机联网后,数据在网上传递,可以实现数据共享,避免重复劳动,规范教学管理行为,从而提高了管理效率和水平。
2系统目标
学籍管理信息系统以计算机为工具,通过对教务管理所需的信息管理,把管理人员从繁琐的数据计算处理中解脱出来,使其有更多的精力从事教务管理政策的研究实施,教学计划的制定执行和教学质量的监督检查,从而全面提高教学质量。
3业务模式
本系统是运行在win98、win2000、windowsnt等操作系统环境下的多台计算机构成的局域网,主要业务流程如下:
·
按某学生某学期,学年考试及补考成绩,自动生成该学生是否升留降级,退学。
·
按某学生在校期间累计补考科目门数和成绩自动生成该学生是否结业,毕业,授位。
按某学生因非成绩原因所引起的学籍变更作自动处理。
按每学期各年级班学生考试成绩自动生成补考名单,科目。
按每学期各年级学生考试成绩自动生成某课程统计分析表。
按同一年级学习成绩进行同一课程不同班级间成绩比较。
2用户需求
编写说明:
此系统专门为高校学籍管理所设置。
本节主要描述用户需求的使用范围,功能要求信息采集与各部门的使用权限
2·
1使用范围
按成都信息工程学院全日制学生学籍管理等相关文件完成本科和专科学生学籍状况的系统管理(本科生用学年学分制,专科生用学年制)。
系统中保留五个年级学生的信息,学生毕业一年后信息转储,但随时可以查询,输出。
2功能要求
学生档案管理:
学生的一般情况,及奖励,处分情况;
·
学生成绩管理:
学习成绩,补考成绩;
学籍处理:
学生留降级处理,休复学处理,退学处理;
日常教务管理:
日常报表,如通知书,补考通知书等,学生学习成绩的各种分类统
计;
毕业生学籍处理:
结业处理,毕业处理,授位处理,学籍卡片等。
3信息采集与各部门的使用权限
每学期考试完毕由各系录入成绩,然后由教务科收集。
为了信息的安全和数据的权威性,对于网上信息的使用权限和责任规定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 调查报告