文档自动化系统设计概要.docx
- 文档编号:10313451
- 上传时间:2023-02-10
- 格式:DOCX
- 页数:49
- 大小:224.33KB
文档自动化系统设计概要.docx
《文档自动化系统设计概要.docx》由会员分享,可在线阅读,更多相关《文档自动化系统设计概要.docx(49页珍藏版)》请在冰豆网上搜索。
文档自动化系统设计概要
文档自动化系统设计
第一章文档一体化管理概述
教学目的:
通过本章学习,了解和掌握文件与档案的关系,以及如何实现文档一体化管理,为后面的文档自动化系统设计奠定基础。
教学重点和难点:
文档一体化管理流程
学时:
2学时
教学内容:
第一节文档一体化
一、文件与档案的关系
文件是人类记录、传递和存储信息的一种工具。
包括机关、团体、企事业单位在处理公务活动中形成与使用的机关文件和个人、家族使用的个人文件,也包括人们在生产活动、艺术创作等活动中形成的技术文件、文艺手稿和其他各种形式的记录材料。
公文是指机关、部门、团体在处理公务活动的过程中,按特定体式形成与使用的,具有法定效用的文件。
公文的处理一般说来都有及格相对固定的程序,包括公文的接收、分送、传阅、加工、办理、监督检查、审核、签发、处置、归档等环节。
档案是指过去和现在的党政机关、团体、企事业单位和个人在从事政治、经济、文化、军事、科学、教育、宗教等活动中直接形成的对国家和社会有保存价值的各种文字、图表、图形、声像等历史记录。
档案源于文件,文件是档案的前身,档案是文件的归宿。
文件质量的好坏直接关系到档案的质量和寿命。
二、文档一体化的含义
在实际工作中,文书和档案是属于两个部门分别管理,造成分块管理,使公文到档案的转化和衔接过程进行得并不顺利,这种人为的割断文件与档案之间的联系势必给今后的档案管理制造障碍和出现不必要的重复劳动,势必降低工作效率。
第二节文档一体化系统
文档一体化系统是采用计算机技术来实现的文书、档案一体化管理的系统。
采用计算机技术,可以使文书、档案一体化管理的优越性得到最充分的体现。
最大限度地实现信息资源共享,避免无谓的重复劳动,使实现办公自动化的一个重要环节。
文档自动化系统设计的任务就是建立文档一体化相同的系统结构、程序结构、各类文档报表输入输出格式、用户界面、操作方式,确定功能模块之间的层次关系和调用关系,定义个功能模块间的数据接口,设计数据结构,规定约束或限制,进一步保证设计的可行性。
思考题:
1、文件和档案的概念及二者之间的关系。
2、文档一体化系统的工作流程。
第二章数据库基础
【教学目的】通过本章的学习,理解和掌握数据库的概念、模型以及数据库设计的基础知识,为以后的学习奠定基础
【教学重点】关系数据库
【教学难点】数据库的概念、关系型数据库的设计
【教学学时】4学时
【教学内容】
1.信息、数据和数据处理
(1)信息(Information)。
信息是现实世界中各种事物的特征、形态和不同事物之间的联系在人类头脑中的抽象反映。
换言之,信息是经过加工的有用数据。
这种数据有时能产生决策性的影响。
(2)数据(Data)。
数据是存储在某种媒体上的、能够被识别的物理符号。
数据用型(存储在媒体上的数据形式)和值(描述数据特性的数据内容)来表征与记录事物。
从广义上讲,数据是一切文字、符号、图形、图像、动画、影像、声音等元素的有意义的组合。
数据是信息的载体,信息是数据的内涵。
信息依赖数据来表达,数据则具体地表现信息。
即“信息与数据是既紧密联系又相互区别的一对术语”。
同一信息可以有不同的数据表示形式(例如,某种统计信息既可用表格表示,也可用直方图表示);而同一数据也可能有不同的解释(例如,同样是数据“1”与“0”,在计算机中它们有时被解释成一个二进制位,有时被解释为逻辑“真值”与“假值”)。
(3)数据处理(DataProcessing)。
数据处理是指对数据的收集、记载、整理、组织、存储、检索、计算/加工、维护、传送等一系列活动的总和。
其目的是从已知数据出发,参照各种相关数据,经过计算/加工,得到新的数据。
新的经过精炼的数据表示新的信息,反映事物的本质和特征,以及事物间的内在联系,是有价值、有意义的数据,成为人们决策的依据。
这一过程就叫做信息处理。
由于信息是用数据表示的,所以信息处理具体地体现在数据处理中。
通过处理数据可以获得信息,通过分析和筛选信息可以产生决策。
2.数据管理技术的发展
数据处理的中心问题是数据管理。
数据管理包括对数据的收集、组织、编目、定位、存储、检索、统计和维护等。
计算机数据管理技术的发展大体上经历了三个阶段:
人工管理阶段、文件系统阶段、数据库系统阶段。
(1)人工管理阶段。
20世纪50年代中期以前,计算机主要应用于科学计算。
硬件方面,计算机的外存只有磁带、卡片和纸带等,没有磁盘。
软件方面,只有汇编语言,没有操作系统,没有数据管理的软件。
当时的管理方式是:
数据不保存在计算机中:
在程序运行时输入数据,结构输出后数据与程序都不存入计算机。
没有专用的软件对数据进行管理:
数据管理由人工操作,程序员除编写程序外还要组织数据。
数据不具有独立性:
数据在存储上稍有改变,如增加、删除、修改数据,都必须修改程序。
数据不能共享,冗余度大:
程序与数据一一对应,即使两个程序使用统一组数据,也要各自输入,造成大量的重复数据。
(2)文件系统阶段
20世纪50年代后期至60年代中期,硬件方面有了磁盘、磁鼓,软件方面出现了高级语言和操作系统。
操作系统中的文件系统代替了人工管理数据,其特征如下。
数据有专门的软件——文件系统管理:
数据的变更由文件系统负责维护,不一定修改程序。
数据具有一定的独立性,可长期保存:
文件系统把数据组织成文件形式在磁盘上保存。
数据共享性差、冗余度高:
数据文件仍然与程序对应,同一组数据在多个文件中重复存储。
容易出现数据的不一致性:
同一数据出现在多个文件中,修改时易造成同一数据在不同文件间的差异。
数据间的联系弱:
文件间缺乏联系,因而就不能反应显示世界中事物间的联系。
(3)数据库系统阶段。
该阶段始于20世纪60年代中后期。
该阶段的特征如下。
数据结构化:
数据库中的文件相互联系,遵循一定的结构形式,通过文件间的联系,较好地反映了现实世界事物间的自然联系。
数据充分共享:
数据库中的数据不是面向某个应用,而是面向所有用户的数据需求和整个应用系统,同一数据可供多个用户共享。
数据冗余度低:
在数据库系统中,用户使用数据库中的数据。
该数据以逻辑文件的形式提供给用户,同一数据物理上只存储一次,使用是被映射到不同的逻辑文件里,从而减少了冗余。
数据独立性高:
数据独立性就是使数据与程序无关,数据存储方式的改变不影响应用程序。
数据库的结构分三级:
用户的逻辑结构、整体逻辑结构和物理结构。
数据独立性分两级:
物理数据独立性和逻辑数据独立性。
数据库三级结构的转化过程是:
数据库物理结构--(通过映射)-数据库的整体逻辑结构--(再次映射)-用户的逻辑结构
方便的用户接口:
数据库管理系统作为用户与数据库的结构,提供数据库的定义、运行、维护等功能。
用户可使用查询语言或终端命令操作数据库,也可用程序方式操作数据库。
数据的统一管理:
数据库系统可提供数据控制功能,包括数据库的回复,并发控制、数据安全性和数据完整性。
此外,对数据的操作即可按记录进行,也可按数据项进行,增加了操作的灵活性。
1.1.2数据库系统
1.数据库、数据库管理系统和数据库系统
(1)数据库(DB,DataBase)。
数据库是以一定的格式存放在计算机存储设备上的、结构化的相关数据的集合。
(2)数据库管理系统(DBMS,DataBaseManagementSystem)。
DBMS是数据管理的核心软件,是介于操作系统和用户之间的系统软件,用于对数据库中的数据实行专门管理,提供安全性和完整性等统一控制机制,方便用户以交互命令或程序方式对数据库进行操作,是用户与数据库的接口,提供数据库的定义、建立、检索、更新、维护及各种数据控制。
按照所处理的数据模型,可将DBMS分为层次型、网状型、关系型和面向对象型数据库管理系统。
(3)数据库应用系统(DBAS,DatabaseApplicationSystem)。
数据库应用系统是利用数据库资源开发出来的、面向某一类实际应用的软件系统。
(4)数据库系统(DBS,DatabaseSystem)。
数据库系统是引进数据库技术后的计算机系统,实现有组织、动态地存储大量相关数据,提供数据处理和信息资源共享的便利手段,方便多用户访问的计算机软件、硬件和数据资源的计算机系统。
一个数据库系统通常由5部分组成,包括计算机硬件系统、数据库集合、相关软件、数据库管理系统、数据库管理员(DBA,DatabaseAdministrator)和用户。
(5)数据库技术。
这是一门研究数据库的结构、存储、管理的软件学科。
深入学习需要离散数学、数据结构、操作系统、软件工程等理论知识,所以是一门综合性较强的学科。
(6)数据库理论与技术研究的方向。
当前数据库理论与技术研究的主要方向是:
数据仓库、演绎数据库系统、多媒体数据库、图形数据库系统和多数据库系统集成技术。
2.数据库系统的特点
(1)实现数据共享。
允许多用户同时存取、修改、删除、查询数据而不互相影响。
(2)实现数据独立。
组织数据库中的数据时面向全局,程序员编制程序时,只以简单的逻辑结构来操作数据,使得应用程序不随数据存储结构的改变而变动。
(3)减少了数据的冗余度。
在数据库中,同一个数据在物理上只存储一次,使用时再把它映射到图同的逻辑文件里,有效地节省了存储资源。
(4)避免了数据的不一致性。
数据只有一个物理存储,对数据的访问、修改不会出现差异。
(5)加强了对数据的保护。
数据库的保密机制,可防止对数据的非法存取;进行集中控制有利于数据的完整性;采取并发访问控制保证了数据的正确性;实现了对数据库破坏后的恢复。
1.1.3数据模型
数据模型(DataModel)是对客观事物及其关系的数据描述。
数据模型不仅要表示存储了哪些数据,更重要的是用某种结构形式表示各种不同数据之间的联系。
为了反映事物本身及事物之间的各种关系,数据库中的数据必须有一定的结构,这种结构用数据模型来表示。
一个具体的数据模型应当正确地反映出数据之间存在的整体逻辑关系。
1.数据与数据间关系的描述
(1)现实世界。
现实世界是客观存在的世界,事物及其相互关系是数据的发源地。
(2)信息世界。
信息世界指现实世界中的事物在人类头脑中的抽象反映。
实体(entity):
实体是客观存在的可以相互区别的事物。
实体型与实体值:
实体用型(type)和值(value)来表征。
型是概念的内涵,值是概念的实例。
通常使用实体名和属性名的集合来描述实体型。
实体值是实体的实例,是属性值的集合。
属性(attribute):
实体所具有的特征称为实体的属性。
每个属性都有一个值域(domain),属性的取值类型和取值范围称为值域,取值类型可为数值型、字符型等等。
属性也用型和值表征。
实体集(entityset):
具有相同性质的同类实体的集合称为实体集。
实体标识符(identifier):
能够唯一标识每个实体的属性或属性集的符号称为实体标识符。
(3)机器世界。
信息在机器世界中以数据形式存储,因此,机器世界又称数据世界。
数据世界是信息世界中信息的数据化,现实世界中的事物及其相互关系在机器世界用数据模型描述。
2.实体联系
实体的联系有两种;一是实体内的联系,反映在数据上是同一记录中各字段间的联系;二是实体间的联系,反映在数据上是记录与记录间的联系。
两个不同实体集的实体间有三种关系:
一对一关系、一对多关系、多对多关系。
(1)一对一关系(onetoonerelationship)
(2)一对多关系(onetomanyrelationship)
(3)多对多关系(manytomanyrelationship)
3.实体联系模型
对于数据常用的模型有两类,信息模型(又称概念数据模型)和结构数据模型。
信息模型不涉及信息在计算机内的表示和处理等问题,纯粹用来描述信息的结构。
矩形框:
表示实体;
菱形框:
表示实体间的联系;
椭圆形框:
表示实体或实体间联系的属性;
直线:
用来连接上述三种图形。
4.结构数据模型
(1)层次模型(hierarchicalmodel)。
用树形结构表示实体及实体间联系的模型称为层次模型。
树的节点是实体。
节点间是一种上下级关系或称父子关系。
树上有且仅有一个节点无父节点,称为根节点。
其他节点均有且只有一个父节点。
上下层实体是1:
N关系。
整个模型就像一棵倒立的树。
按照层次模型的结构框架,填入具体数据就组成层次数据库。
层次数据库中与实体对应的部分称为记录。
记录值之间的联系在模型的约束下依然保持树状形。
层次模型有如下的特点。
记录间的联系通过指针实现:
层次分明:
不能直接表示M:
N关系:
(2)网状模型(networkmodel)。
用网状结构的有向图表示实体及实体间联系的模型称为网状模型。
有向图中的节点是实体,有向边(即箭头)表示从箭尾的实体到箭头的实体是1:
N关系。
网状模型的结构是节点的连通图。
与层次模型相比,有向图中可能有多个节点无父节点,有些节点又可能有多个父节点。
网状模型的特点是:
实体间的联系通过指针实现,检索效率较高,表示多对多关系比较灵活。
但这种灵活性是以数据结构复杂化为代价的。
(3)关系模型(relationmodel)。
用二维表结构表示实体及实体间关系的模型称为关系模型。
一个关系就是一张二维表;关系名对应表名,关系的属性名对应表中的栏目名,在数据库表中称为字段名;表中的一行对应一个实体,在数据库表中称为记录;表中的列对应实体的属性,在数据库表中称为字段。
关系中的多条记录,描述了一个实体集。
关系模型表示实体间的关系,是通过对属性的安排,及根据属性值的相等让实体自然地发生联系。
这通常是关键字的作用。
(4)面向对象模型
面向对象数据库是面向对象概念与数据库技术相结合的产物。
面向对象模型一方面对数据结构方面的关系结构进行了改良,另一方面对数据操作引入了对象操作的概念和手段,可以比较完整地描述各种复杂的数据结构,具有丰富的表达能力
1.2关系数据库
1.2.1 关系模型
1.关系模型中常用的术语
(1)字段(field):
字段是信息世界中的“属性”、机器世界中的“数据项”,是可以命名的最小数据单位。
字段也用型和值来表示。
(2)记录(record):
字段的有序集合称为记录。
在关系模型中,记录又称元组;在信息世界中称为实体。
记录也由型和值来描述:
记录型是字段型的集合,记录值是字段值的集合。
一般可用一个记录描述一个实体。
(3)表(table):
同一类记录的集合称为表。
记录的型和值构成了关系数据库的基本单位,即表。
表也分为型和值,表的型也称关系模式,或表结构,由一系列字段型组成。
表是描述实体集的,它对应于信息世界中的实体集。
(4)关键字(key):
能够唯一地确定表中每一条记录的字段或字段组合的部分称为关键字。
有了关键字就可以方便地使用指定的记录。
它对应于信息世界中的实体标识符。
(5)关系数据库:
基于关系模型建立的数据库称为关系数据库。
关系数据库通常是由若干个有着一定联系的表组成的。
在关系数据库系统中,关系模式是相对稳定的,但其中的数据是可以不断变化的,因为系统中的数据需要不断更新。
2.关系的组成与特点
(1)关系的组成。
在VisualFoxPro中,表由表结构和表记录组成。
如图1-6所示。
图中最大的长方形所包含的部分是一个二维表。
二维表中的栏目名加上平行四边形中的内容是表的结构;二维表中去掉列名就是表的记录内容。
图1-6的表中有6条记录,每条记录有5个字段。
二维表的栏目名就是表结构中的字段名。
平行四边形中的英文字母表示字段类型,数字表示字段宽度,对数值型字段除有字段宽度外,还在逗号后给出小数位数。
(2)关系的特点。
表中每一列元素是类型相同的数据;
列不能重名,列的顺序可任意放置;
行的顺序也可任意,表中任意两行不能完全相同(即没有重行);
关系必须是规范化的。
3.关系模型的优点
(1)建立在严格的数学概念基础之上。
每个关系都用一张二维表格来描述,不仅字段、记录描述得很清楚,而且可用关系的性质来衡量关系。
(2)关系规范化,数据的冗余度低。
(3)概念简单,数据结构简单、清晰,用户易懂易用。
(4)存取路径对用户透明,数据的独立性高,安全保密性强。
1.2.2 关系运算
1.传统的集合运算
传统的集合运算主要包括集合的并、差和交运算。
参加运算的两个关系具有相同的结构,即两个关系模式相同。
(1)并。
由关系A和关系B的所有元组构成的集合称为并,记为AUB。
(2)差。
由属于关系A而不属于关系B的所有元组构成的集合称为差,记为A-B。
(3)交。
由既属于关系A又属于关系B的所有元组构成的集合称为交,记为A∩B。
2.专门的关系运算
关系数据库中专门的关系运算又称关系操作,主要包括选择、投影、连接和自然连接运算。
(1)选择(selection)运算:
选择运算是对一个关系的元组,即数据表的记录进行选择,把符合某个条件的所有记录选择出来,并重新构建一个原表的子表。
(2)投影(projection)运算:
投影运算是对一个关系的属性,即数据表的字段进行选择,并按要求重新安排字段的次序,构建一个原表的子表,其属性个数可小于或等于原表。
(3)联接(join)运算:
联接运算是从两个关系中选择符合一定条件的若干元组和记录,形成一个新的关系,即重新构建一个由原来两个表的属性组成的子表。
联接条件中应该出现两个关系中都具有的语义相同或可比的属性,联接的结果是符合条件的所有元组。
如果要联接两个以上的关系,则需两两地进行。
如若要连接三个关系,应先联接两个关系,再把生成的子表与第三个表联接。
(4)自然联接:
在联接运算中,按照属性值对应相等为条件进行的等值联接称为自然联接。
自然联接是最常用的联接运算,是去掉重复属性的等值联接。
1.2.3 关系的设计
1.概述
关系数据库的设计人员通常首先用ER图或面向对象的模型设计出关系模式,再把关系模式转换成关系模型。
即设计与建立数据库关系模式的过程是:
设计思想→ER设计→关系模式。
面对一个实际应用问题,到底构造一个什么样的关系模式是最佳的?
标准是什么?
如何实现?
是关系模式设计时必须解决的问题。
对关系模式的设计包括不同类型、不同单位、不同级别的数据定义;各种数据完整性约束(即数据之间的联系),数据取值的各种限制,各种数据操作所带来的影响等。
2.关系模式的设计
设计关系模式要解决以下几个问题。
(1)数据冗余(DataRedundancy)。
数据冗余指相同的信息在多个元组中重复。
(2)更新异常(UpdateAnomaly)。
数据冗余度高,必然导致修改麻烦。
会造成数据不一致的错误。
(3)插入异常(InsertAnomaly)。
在某段时间里,数据库中的某些属性可能没有值。
(4)删除异常(DeletionAnomaly)。
删除异常是指删除操作导致一些有用信息的丢失。
这里有两点需要说明。
第一,规范化关系只能减少冗余,而不是消除冗余。
第二,关系规范化的级别越高约束条件就越严格,关系规范化有五个级别,分别称为第一范式、第二范式、…、第五范式。
规范化级别越高数据冗余和更新错误就相对越少,但同时也会增加各个关系间相互联系的额外处理及时间开销。
所以规范化的基本原则是:
由低向高,逐步规范,权衡利弊,适可而止。
通常以第三范式为基本要求,并满足实际问题的需要。
1.3VisualFoxpro系统概述
1.严格区分了“数据库文件”和“表文件”
2.增强的查询与数据库管理功能
3.提高了应用程序的开发效率
4.支持面向对象的程序设计
5.利用OLE技术实现应用集成
6.支持网络应用
1.4visualFoxpro的用户界面
1.VFP6.0的启动
2.VisualFoxPro6.0的退出
3.VFP的主界面
VFP有两种工作方式:
交互式操作方式和程序操作方式。
前者又分为命令操作方式和菜单操作方式。
1.交互式操作方式
所谓交互操作方式指用户每发一个命令或选择一项菜单,计算机系统立即执行,并将结果在主窗口工作区返回给用户。
(1)命令操作方式。
命令操作方式指在命令窗口输入一个命令后,按Enter键,计算机系统立即执行该命令并输出结果。
命令操作的优点是能够直接使用系统的各种命令和函数,有效地操纵数据库。
但需要熟练掌握命令和函数的格式和功能。
(2)菜单操作方式。
菜单是实现人机对话的工具。
VFP6.0将若干命令做成菜单,用户可以通过菜单系统的选择或点击工具栏中的按钮来操作数据库。
能够不必记忆命令的具体格式及功能,就可完成对数据库的操作和管理。
所以,初学者通常从菜单工作方式入手。
2.程序操作方式
程序操作方式指利用各种生成器自动生成程序或将命令、语句编写为程序(命令文件),通过运行程序达到操作数据库的目的。
第三章VisualFoxPro集成环境
【教学目的】通过本章的学习,理解和掌握VFP的数据类型、变量、常量、运算符和常用函数的概念和使用方法
【教学重点】VFP的数据类型和常用函数
【教学难点】常用函数的使用方法
【教学学时】6学时
【教学内容】
3.1VisualFoxpro的数据类型
VFP中的数据按其构造、基本特性、用途和运算方法等分为不同的类型,数据类型决定了数据的存储方式和运算方式。
常用的数据类型有如下11种:
1.字符型(Character,C)
字符型数据包括中、英文字符、数字字符和其他可显示的ASCII字符,其长度(即字符个数)范围是0~254个字符。
2.数值型(Numeric,N)
数值型数据用来表示数量,由阿拉伯数字、小数点和正负号组成。
数值型数据的长度为1~20位,包含整数、小数点和小数位数。
在VisualFoxPro中,具有数值特征的数据类型还有整型(Integer,I)、浮点型(Float,F)和双精度型(Double,B),这3种数据类型只能用于字段变量。
3.货币型(Currency,Y)
货币型数据用来存储货币值,默认保留4位小数,存储空间占据8个字节。
4.日期型(Date,D)
日期型数据用来表示日期,其存储格式为“YYYYMMDD”,占8个字节。
日期型数据的显示格式有多种,受SETDATE、SETMARK、SETCENTURY等命令的影响。
5.日期时间型(DateTime,T)
日期时间型数据用来表示日期和时间,其存储格式为“YYYYMMDDHHMMSS”,占8个字节。
其日期部分格式受受SETDATE、SETMARK、SETCENTURY等命令的影响,时间部分格式受SETHOURS、SETSECONDS命令影响。
6.逻辑型(Logic,L)
逻辑型数据用来表示逻辑判断的结果,只有真(.t.或.y.)和假(.f.或.n.)两个值,长度固定为1位。
7.备注型(Memo,M)
备注型数据用于存放数据块,其长度固定为4个字节,用于存储指向备注文件中相应内容的记录指针;备注型字段本身的内容没有长度限制,该字段的数据存放在与表文件同名的备注文件(.fpt)中。
8.通用型(General,G)
通用型数据用来存储OLE(对象链接与嵌入)对象,其长度固定为4个字节,通用型数据中的OLE对象可以是电子表格、文档、图形、声音等。
备注型字段本身的内容没有长度限制,该字段的数据存放在与表文件同名的备注文件(.fpt)中。
3.2VisualFoxpro的常量与变量
3.2.1常量
常量用来表示一个具体的、不变的数据量。
不同类型的常量用不同的书写形式区分。
VFP中常量包括字符型、数值型、日期型、日期时间型、逻辑型、货币
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文档 自动化 系统 设计 概要