6 应用系统设计技术线路.docx
- 文档编号:30057148
- 上传时间:2023-08-04
- 格式:DOCX
- 页数:11
- 大小:286.89KB
6 应用系统设计技术线路.docx
《6 应用系统设计技术线路.docx》由会员分享,可在线阅读,更多相关《6 应用系统设计技术线路.docx(11页珍藏版)》请在冰豆网上搜索。
6应用系统设计技术线路
6应用系统设计技术线路
选用拥有自主知识产权的“清华同方”kbase非结构化数据库系统作为底层。
对所建设内容通过使用清华同方的TPI4.5建库与发布系统作为底层可实现。
实现分项功能时:
6.1数据库制作发布系统
资源建设都有属于自己有特色的一些数据需要建立特色数据库,例如内部资料、行政公文、人事档案、会议纪要、科研成果、设计文档等等。
TPI提供的数据库管理工具可以让用户来建立、维护自己的特色数据库。
TPI数据库管理工具还提供了大量针对不同类别资源的数据库模版,供用户直接使用,用户也可以对模版中的字段进行增删改,以适应自身的需要。
TPI数据库管理工具还提供了“多导航”的支持,多导航的好处在于用户可以根据自己的需要,在同一个库中以不同的分类需求快速定位信息,如“馆藏资源”库,我们既可以按照中图法对图书进行分类,也可以按照学科分类的方法来进行分类,这样就可以在“馆藏资源”库中建立“中图法”和“学科分类”两个分类,用户就可以根据自己的习惯更加方便的在两个分类中进行切换,更好的进行浏览和检索。
6.2元数据标引分类检查
实现元数据的标引和分类。
数据标引完成电子书元数据录入、修改和入库。
数据标引工具支持Word文档、nh文件、html文件、kdh文件、txt文件等文件类型的标引工作。
采用可视化操作,直接从原文中选择需要的内容,操作简单、直观。
通过TCP/IP与FTS服务器相联接,实现分布式的并行数据加工。
元数据标引的主要功能包括:
登录服务器、查看记录、数据标引和设置选项。
6.3数据迁移工具
TPI支持大部分常见的数据库格式,从而使您可以将现有的不同格式的数据库中数据导入TPI数据库中,这样您就不用担心现有的数据如何使用一种工具就可管理和发布了,TPI对CNMARK、ODBC、EXCEL、DC、ACCESS、XML、TPI、CALIS、自定义文本等格式都支持。
6.4纸质资源数字化加工(电子书加工工具)
Bookshop是清华同方知网(北京)技术有限公司自主研发的电子书加工工具。
通过该工具可以把书籍、报刊、公文等各类纸张文档,通过书页扫描、书页图像处理、目录树编改、书页压缩等过程简单快速地形成电子书籍。
也可以把已有各种电子文件,例如WORD、PDF、HTML、PS、S2、S72、PS2、PSD、TXT等,通过本公司自主研发的打印驱动转化为电子书籍。
Bookshop尤其支持各类纸张文档加工成电子书的全过程。
其中包括书页图像扫描及管理、书页图像处理、书页图像识别导入及编改、目录加工处理、书页图像及目录合并形成电子书。
为适应大规模图书加工业务,该工具对部分工艺还设计了批处理工作方式,用于电子书流水线加工。
Bookshop为书籍电子化提供了一种快捷、方便、高效的全面解决方案。
6.5KBASE全文检索服务器
清华同方KBase全文数据库管理系统(简称KBase)是以管理海量的文本、网页、档案、文献、办公文档等非结构化数据为主,具备中文智能信息处理能力的国产数据库管理系统。
KBase具有优异的全文检索性能和强大的海量非结构化数据存储管理能力,拥有超过400万词汇量的、大百科式的概念关系词典,具备业界领先的中文智能信息处理能力。
KBase是清华同方在承建中国国家知识基础设施(CNKI)这一国家级大规模信息化工程的过程中,依托清华大学科技和人才优势,厚积薄发自主研发而成的。
KBase作为CNKI工程的运营支撑平台,管理着目前全球最大的中文知识信息资源数据库,每天提供千万人次的信息检索服务。
同时,KBase已成功应用于包括欧美发达国家在内的全球5000多家机构用户,其优异的性能和稳定性,受到用户的一致好评。
KBase解决了非结构化信息处理的基本问题,可用于任何处理非结构化信息的行业应用,如数字图书馆、数字档案馆、电子政务、企业搜索、知识管理、内容管理、情报分析、互联网不良信息监控、信息资源开发利用、门户建设等等。
6.1.3.5.1.主要特点
5.1.3.5.1.1.高效、准确的全文检索
KBase全文检索速度高达500G/S,处于业界领先地位。
同时,KBase基于先进的高维索引技术在国际上首次将相似检索功能真正做到了实用化水平:
速度高达百万级文献量毫秒级响应。
KBase集成先进的全切分切词算法,很好地解决了歧义切分问题,可将“原子结合成分子”正确地切分成“原子/结合/成/分子”而不是“原子/结合/成分/子”,从而使KBase与同类产品相比具有更高的查准率、查全率。
6.1.3.5.1.2.海量非结构化数据管理
KBase具有强大的海量非结构化数据存储管理能力,单表管理的记录数可达40亿,单表管理的数据容量可达TB级(分区表可达PB级)。
KBase同时支持多机群集,实现数据的分布式存储。
KBase作为CNKI工程的运营支撑平台,目前管理着全球最大的中文知识信息资源数据库,每天提供千万人次的信息检索服务,其优异的性能和稳定性,受到广大CNKI用户的广泛赞誉。
6.1.3.5.1.3.功能强大的关系数据库全文检索网关
KBase提供了对Oracle、DB2、SQLServer、Sybase、Informix等主流关系数据库管理系统(统称RDBMS)的全文检索网关,实现了RDMS和KBase服务器之间的数据共享和实时同步,使用户在享有RDBMS卓越的数据处理功能的同时,拥有KBase优秀的全文检索功能。
基于KBase关系数据库全文检索网关,可以整合多种异构数据源,实现企业级信息资源的统一搜索。
6.1.3.5.1.4.大规模并发处理能力
KBase支持多服务器群集,可将多个独立的KBase服务器虚拟整合成一个整体,实现高效的分布式计算,大大提高系统的并发处理能力。
6.1.3.5.1.5.先进的中文智能信息处理能力
KBase拥有超过400万词汇量的、大百科式的概念关系词典,集成SmartTextMiner文本挖掘引擎和NLP自然语言处理引擎,可提供自动分类、自动聚类、关键词自动标引、自动文摘、信息过滤、关联规则挖掘等多种实用功能。
6.1.3.5.1.6.易用的检索语言
KBase充分考虑用户使用习惯,提供类似SQL的查询语言—KSQL,设计更加人性化。
6.1.3.5.1.7.完整的应用开发接口
KBase提供.Net组件、COM组件、Java组件、ODBC、ADO等数据库访问接口,并且针对有较高底层开发要求的用户提供完整的二次开发接口。
KBase同时支持Z39.50、OAI、OpenURL等访问接口。
6.1.3.5.1.8.支持多种编码
KBase提供对GB2312、BIG5、GBK、GK18030、UNICODE等多种编码的直接支持。
6.1.3.5.2.体系结构
6.1.3.5.3.性能指标
KBase各项性能指标均达到国际先进水平:
全文检索速度:
500GB/秒
相似检索速度:
100万文献量/20毫秒
单表支持最大记录个数:
40亿
单表支持最大容量:
8TB(分区表最大容量2PB)
可同时跨库检索最大数:
255个
拥有500万数量级的概念关系词典
6.1.3.6.使用TPI4.5作为底层的优势
1、提升底层数据库性能,,检索速度为500G/S;性能稳定。
2、完全兼容现阶段图书馆普遍使用的CNMARC标准。
3、支持Z39.50协议标准。
4、完全兼容最新的DublinCore标准。
5、支持XML文件格式。
6、完全支持最新的OAI服务。
7、支持最新的METS协议。
8、支持11种CALIS元数据模板。
9、更详尽的日志管理功能。
10、更先进的安全机制。
11、电子图书的制作操作更灵活、压缩比更高。
12、检详尽的日志管理功能索手段更丰富。
13、支持动态实时信息的处理。
14、实现了流水线控制。
15、可以利用COM组件实现二次开发。
6.2.数字答疑系统(知识域服务)
6.2.1.功能需求
为了完善内蒙古建筑职业技术学院共享性资源库协同教学功能,需要提供强大的WEB表单答疑、EMAIL答疑和实时答疑服务。
6.2.2.分析
分析:
通过数字答疑系统可实现上述功能。
功能介绍如下:
6.2.3.数字答疑系统功能介绍
在信息资源服务中,参考咨询历来是核心服务内容之一,体现了情报服务专业化智能化知识化程度。
随着数字化信息环境的形成,传统参考咨询服务已经受到极大挑战。
为了满足读者对图书馆服务系统日益提高的要求,清华同方知网(北京)技术有限公司推出集文字、音频、视频于一体的智能化网络咨询管理系统,有着强大的用户管理功能,实现单点登陆,游客只有浏览功能,有效用户才能参与咨询。
已登录读者可以查看自己的提问列表及每个问题的状态(新问题、处理中、已回答);对新问题进行修改、取消等操作;对处理中问题进行补充;看已回答问题的答案或提出相关问题。
该系统最终目标是要建立完善的图书馆服务体系,建立数字图书馆与读者之间零距离沟通的桥梁。
6.2.3.1.常见问/答(FAQ)咨询
该模块是参考咨询中心针对一些读者询问频率较高的问题而设立的。
将读者经常询问的一些较大众化、有代表性的咨询问题进行分类组织,编成列表,并提供用户查询。
这样,用户无需请求参考馆员的帮助,只要查询该列表,找到表上所列的与自己所查问题类似的咨询问题,进而通过其所提供的信息源,就可找到自己所需的答案。
可以说,FAQ模块能极大地节约读者和参考馆员的时间。
参考咨询中心工作人员可以创建FAQ库,同时也可将读者问题及相应的答案中直接添加到FAQ库中,在此期间,可以对问题以及相应的答案进行修改。
FAQ模块的主要特色有:
Ø自动网络发布
管理员对FAQ库的更改,直接可以体现在网络上,实现实时网上发布。
Ø知识分类
支持知识分类导航,管理员可以随意添加、删除、修改知识分类。
ØFAQ/知识库管理
管理员可以直接修改FAQ库,也可以从其他库中导入FAQ记录。
系统可以对新加的内容进行自动分类。
Ø读者全文检索
读者可以在FAQ库中进行全文检索。
可以进行基于分词的检索,也可以进行不分词的检索;
Ø完善的知识库
提供专题知识库的功能,可以把某一领域的专业信息保存到专题知识库中,并且可以提供多种方式把知识库的知识提供给用户使用
图FAQ咨询页面
5.2.3.2.WEB表单与MAIL咨询
该模块是帮助用户解答咨询问题。
读者通过登录参考咨询中心的网站,利用WEB表单提出问题。
系统会根据读者的问题,在目前已有的答案资源中找到相关的结果,显示给读者。
如果读者对答案不满意,则继续提交问题。
图书馆的问题解答员可以登录WEB页面,对问题进行解答或转发,同时,给读者发送电子邮件,通知处理结果。
用户可在短期之内收到答复。
即使某些问题无法解答,用户也会收到参考咨询中心提供的一些建议。
WEB表单与E-MAIL咨询模块有以下特色功能:
Ø最佳答案匹配
读者提问后,系统根据读者的问题,利用智能相似性算法自动到FAQ中寻找相应的最佳答案,自动找到最合适的答案。
Ø转发问题
对于不确定的问题或不在自己职责范围内的问题,可以转发给其他馆员来处理。
Ø发布问题
可以将一些经典问题与答案,直接转入到FAQ中,并在网上发布,以供读者访问。
图WEB表单咨询页面
5.2.3.3.实时互动咨询
提供实时文字、音频、视频交流功能,读者可以与参考咨询中心进行点对点的实时交流,实时解决读者的问题。
参考咨询中心工作人员与读者进行实时交流时,还可以通过网页同步浏览功能,与读者的浏览器进行同步。
这样,咨询中心工作人员与读者看到的是同一网页,由工作人员引导读者对网页进行浏览,找到所需要的信息。
工作人员可以边演示边回答读者的提问,馆员和读者之间可以同步信息交流和共享网络信息,共同浏览多种格式的文件,满足了远程教学和辅助教学的需要。
网页同步浏览功能可以大大提高读者服务的效率和质量。
。
实时互动咨询模块的主要特色功能包括:
◆实时交流
完成基本的文字聊天功能,私聊、群聊等功能;
◆文件共享
馆员可以随时给读者推送网页和多种格式的电子文件,实现桌面共享及白板交互的功能;
◆同步浏览
咨询中心工作人员与读者看到的是同一网页,由工作人员引导读者对网页进行浏览,找到所需要的信息;
◆咨询日志归档
将实时文字咨询过程记录下来,馆员对其进行整理、入库;
◆问题进程跟踪
读者、咨询关于可以通过各自的登陆界面跟踪了解问题的处理进程和状态。
图实时互动咨询用户登录页面
图实时互动咨询调度中心
图实时互动咨询网页推送
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用系统设计技术线路 应用 系统 设计 技术 线路