第一章 信息与信息管理Word文档下载推荐.docx
- 文档编号:21858519
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:38
- 大小:338.19KB
第一章 信息与信息管理Word文档下载推荐.docx
《第一章 信息与信息管理Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《第一章 信息与信息管理Word文档下载推荐.docx(38页珍藏版)》请在冰豆网上搜索。
它排除了信息的含义因素(语义信息)和价值因素(语用信息),其适应范围受到很大限制。
(2)申农理论只考虑了概率不确定性,对其他形式的不确定性未作解释。
(3)申农的信息概念只是从功能上进行表述的,没有从根本上回答“信息是什么”的问题。
1996年,我国著名学者钟义信教授在其著作《信息科学原理》一书中对信息从理论角度进行了抽象定义,把信息分为“本体论层次信息”和“认识论层次信息”。
他认为,事物的本体论层次信息是指事物运动状态及其变化的方式,认识论层次信息是主体所感知或表述的事物运动状态及其变化的方式。
本书我们参照钟义信教授给出的信息概念,把本体论层次信息定义为事物运动的表征(即表现出来的特征),它包括事物内部结构和外部联系的状态及方式;
而把认识论层次信息定义为主体所感知或表述的事物运动的表征。
认识论层次信息包括事物运动表征的形式、含义和效用,借用语言学中的相应概念,分别称为语法信息、语义信息和语用信息。
由于引入了主体这一条件,认识论层次信息的内涵比本体论层次的信息概念要丰富得多。
作为主体的人,他具有感觉的能力,能够通过其表现特征感觉到事物和事物运动的外在形式;
他具有理解能力,能够进而理解事物和事物运动的内在含义;
他还具有目的性,因而能判断信息的效用价值。
在掌握信息概念时,必须抓住以下三个要点:
(1)信息是一个独立的科学概念。
信息既不是物质,也不是能量,而是一个与物质和能量既有联系又有区别的概念。
(2)研究信息的概念时,一定要分清层次,而不能笼统视之。
本体论层次的信息概念是一种纯客观的概念,它仅关心“事物运动表现特征的客观存在”。
而认识论层次的信息概念是在主体立场上从主客观的关系上来看问题的,它不仅关心主体感知或表述的“客观存在的事物运动的表现特征”本身(即其外在形式),而且关心其逻辑含义及其效用。
(3)信息有“为主体消除或减少某种不确定性”的作用,它所消除或减少的不确定性越多,则表示主体收到的信息量越多。
1.1.2数据、信息和知识的关系
数据(Data)是载荷或记录信息并使之按照一定规则排列组合的物理符号。
它可以是数字、文字、图像、声音、视频数据,也可以是计算机代码。
人们对信息的接受始于对数据的接收,对信息的获取只能通过对数据背景和规则的解读。
背景是接收者针对特定数据的信息准备,即当接收者了解物理符号序列的规律,并知道每个符号或符号组合公认的指向性目标或含义时,便可以获取一组数据载荷的信息,亦即数据转化为信息。
信息是数据载荷的内容,对于同一信息,其数据表现形式可以多种多样。
例如,你可以打电话告诉某人某件事(利用语言符号),也可以写信告诉某人同一件事(利用文字符号),或者干脆画一个图(利用图像符号)。
知识是信息接收者通过对信息的提炼和推理而获得的认识,是人类通过信息对事物运动规律的把握,是人的大脑通过思维重新组合的、系统化的信息集合。
知识的传输一般遵循如下模式:
传输者的知识数据信息接收者的信息。
这一模式说明,要传输知识,传输者首先要将头脑中的知识转化为数据,使之成为按一定的规则排列组合的物理符号,再通过一定渠道将数据传至接收者。
接收者如果能够解读数据的背景与规则,则可以接收到相关的信息,然而最终能否获取传输者意欲传递的知识,还取决于接收者个人对信息的提炼与推理。
只有当信息接收者接收到信息并能够从中提取关于事物运动的规律性认识和合理解释时,信息才转化为知识。
例如,一份病人的病历对非医护人员仅仅是数据或信息,而对医生则能提供相关的知识。
可见,信息能够转化为知识的关键在于信息接收者对信息的理解能力。
概言之,数据是信息的原材料,而信息则是知识的原材料,数据涵盖范围最广,信息次之,知识最小。
数据、信息和知识的包含关系及相互关系如图1.1和图1.2。
图1.1数据、信息和知识的包含关系
图1.2数据、信息和知识的相互关系
1.1.3信息的特性
1.普遍性
信息的普遍性是指信息是无处不在的,也是无时不在的。
信息普遍存在于自然界、人类社会之中,也存在于人类的思维或精神领域之中。
同客观世界所产生的信息一样,精神世界、思维领域的信息也可以具有相对独立性,可以被记录下来加以保存、复制或重现。
2.无限性
信息的无限性表现在两个方面:
(1)一切事物的运动状态和方式都是信息,而客观事物是无限的,因此它所产生的信息必然是无限的。
(2)信息的无限性还表现为信息可以无限扩展。
为了某种目的了解某种信息,就使得信息不断向外延伸。
例如,在对某种产品情况进行调查时,从了解该产品在企业的生产情况,延伸到对该产品的原材料及客户情况的了解,随着这种了解的一步步深化,使得人们对信息的需求无限增加。
3.共享性
信息可以脱离源事物相对独立地存在,因此可以被无限制地进行复制、传播或分配给众多用户,为大家所共享。
信息的共享性有利于信息成为企业的一种资源。
严格地说,只有实现企业信息的共享,信息才能真正成为企业的资源,才能充分利用信息提高企业的生产效率。
4.存储性
信息可以通过一定的方法在时间上实现转移,即信息的存储性。
例如,昨天的信息可以转移到今天,今天的信息转移到明天等。
存储可以借助于各种的存储介质,如纸张、磁带、磁盘、光盘等。
5.不增值性
信息量在传递过程中具有不增值性。
尽管信息具有相对独立性,可以无限制地进行复制,为众多用户所共享,但是在复制或传递过程中,信息量永远不会增加。
把一份信息复制一次,信息量并不会增加一倍,相反,由于噪声干扰的影响,由于复制和传递过程中不可避免地存在误差或非线性操作,结果得到的信息量只会减少。
例如,在图像信息的传递过程中存在压缩问题或衰减问题,往往接收者得到的信息已与原始信息不一致,出现信息损失。
6.时效性(动态性)
由于产生信息的物质世界和精神世界不断变化,现有的信息只能反映它在过去某个时刻的运动状态和方式,随着时间的推移,其对解决特定问题的作用会逐渐降低,以至完全失去效用,这就是信息的时效性。
当然,该信息作为一种历史记录可能在其他方面继续发挥作用。
信息从产生到对解决特定问题完全失去效用的过程构成信息的生命周期。
7.可加工性(可变换性)
信息的可加工性反映在两个方面:
(1)信息可以通过编码进行转换,如将信息存储在计算机里转换成二进制代码,便于存储或处理;
(2)信息可以加工提炼,使杂乱无章的数据变为有使用价值的、有意义的知识。
8.真伪性
信息的真伪性是指信息对客观事物运动表征描述的真实性、准确度。
一个信息可能符合实际情况,也可能与实际情况不符合。
如果接收者接收了一个不符合事实的消息,那么这个信息就会给接收者的决策活动带来不利的影响。
因此,在收集信息时,要尊重事实,确保信息的真实性。
9.有用性
从信息的含义可知,信息是对人们决策有用的一种特殊数据。
但信息的有用性是相对的,某信息对一个决策目标是有用的,但对另一个决策目标是无用的甚至是有害的;
同一信息在不同时间、不同地点对同一决策的效用也是不同的。
1.1.4信息与物质、能量的关系
物质、能量和信息是构成现代社会发展的三大要素。
正如控制论创始人维纳所说:
“信息就是信息,既不是物质也不是能量。
”因此,物质、能量、信息这三者之间的关系是既有区别又有联系的。
1.信息与物质、能量之间的区别
首先,信息不同于物质。
信息是物质的普遍性而不是事物本身,它所表现出来的是物质运动的表征,是物质之间的联系与相互作用。
其次,信息也不同于能量。
信息是物质运动的表征,而能量是物质运动的度量。
能量转换遵循守恒定律,而信息转换不存在守恒现象;
能量不能共享而信息可以共享。
信息与能量的功能也不同,能量为人类提供动力,而信息为人类提供知识和智慧。
2.信息与物质、能量之间的联系
信息与物质、能量之间的联系集中体现在三者都统一于物质,物质是第一性的,能量和信息都源于物质。
(1)物质是信息的源泉。
任何物质的运动过程同时也是信息运动的过程,而任何信息运动的过程都离不开物质的运动过程。
换言之,信息不能脱离物质而单独存在。
(2)信息与能量密不可分。
信息的获取和传递离不开能量,能量的转换与驾驭也离不开信息。
(3)信息与物质、能量可以相互转化。
信息虽然既不是物质也不是能量,但在一定条件下,信息可以转化成物质和能量。
“知识就是力量”、“知识就是生产力”等名言所表述的正是这种转化关系。
1.1.5信息的类型
同一般事物的分类问题一样,信息的类型也取决于其分类的准则和方法。
以决策目标为准则,信息可以划分为有用信息、无用信息和有害信息。
按信息产生的领域分类,有工业信息、农业信息、军事信息、政治信息和管理信息等。
按信息源的性质来分类,有语言信息、图像信息和文字信息等。
从对信息的掌握程度来看,有确定性信息和不确定性信息。
从信息的性质来看,有语法信息、语义信息和语用信息。
这是最常用的一种分类方法。
语义信息指“事物运动的表征”的含义,它与主体的知识结构及其理解能力密切相关。
语用信息指“事物运动表征”的效用,它与主体要解决的问题及其运用能力密切相关。
语法信息指关于“事物运动表征”本身的结构,不涉及这些表征的含义和效用,是最基本、最客观的层次。
它是迄今为止在理论上研究得最多的层次。
根据事物的运动状态不同,语法信息可以划分为:
有限状态语法信息和无限状态语法信息;
连续状态语法信息和离散状态语法信息;
明晰状态语法信息和模糊状态语法信息。
按照事物的运动方式不同,语法信息又可以划分为:
概率型信息、偶然型信息和确定型信息。
它们分别对应随机、半随机和确定型三种不同的运动方式。
所谓概率型信息是指各状态完全按照概率规则或统计规律出现的语法信息。
偶然型信息是指各状态的出现是随机的而不是确定的信息,但这些状态的出现是偶然的,不能大量重复出现,因此不能用概率统计的规则来描述。
确定型信息是指各状态的出现能用经典数学公式来描述,其未知因素常表现在初始条件和环境影响的(约束条件)方面。
1.2信息的度量
信息的度量就是从数量关系上把握信息。
对信息的定量把握,是进一步探讨信息的科学规律的基础。
目前在信息度量方面比较成熟的理论仍然局限于语法信息的度量。
下面先介绍几种描述信息的基本方法。
1.2.1信息的描述
1.概率信息的描述
设X表示一个试验,X={xi|i=1,2,…,n}为试验中所有可能状态的集合,P={pi|i=1,2,…,n}表示每个状态出现的概率的集合,则(X,P)为这一试验的概率空间。
概率空间(X,P)的各元(xi,pi),i=1,2,…,n,正好描述了事物运动的表征,其中xi(i=1,2,…,n)表示事物可能的运动状态,pi(i=1,2,…,n)表示运动状态xi出现的概率。
因此,用概率空间可以刻画事物运动的整体表征,这是描述概率信息的基本方法。
假定一个随机试验X,有n种可能的试验结果x1,x2,…,xn。
如果在试验之前已知这些状态发生的概率为p1,p2,…,pn,则称为先验概率。
在试验完成后,发现这些可能状态的实际发生概率为
,则称为后验概率。
先验概率空间和后验概率空间可以按下式进行变换:
(X,P)
(1-1)
在式(1-1)中,箭头“”是变换符,表示变换;
。
箭头左边为先验概率空间,右边为后验概率空间。
先验概率空间描述了观察者的先验信息,后验概率空间描述了试验后观察者的后验信息。
这样,观察者通过式(1-1)的描述就可以看到随机型信息的变化过程。
后验信息量与先验信息量之差就是观察者试验过程中的实得信息。
在很多实际试验场合,后验概率
是一个0-1型分布,即
用
表示0-1型后验概率分布,这时式(1-1)可以表示为
(1-2)
当观察者对试验没有任何先验信息时,只能假定这n个状态出现的概率是均匀分布的,即
pi=1/n,i=1,2,…,n,用P0表示这种均匀分布的先验概率,这时式(1-1)可以表示为
(X,P0)
(1-3)
式(1-3)表示,在观察试验之前,观察者对试验结果一无所知,试验之后,结果惟一确定。
这时,观察者获得了最大的实得信息。
反之,若试验之后
,则实得信息为0。
例1.1投掷硬币试验
设X={xi│i=1,2},其中x1表示“正面朝上”这一状态,x2表示“反面朝上”这一状态。
在试验之前,观察者无法知道x1和x2状态哪个会出现,根据常识,认为两者出现的概率均等,即pi=1/2,i=1,2。
X的先验概率空间为
或
假定观察结果为正面朝上,即状态x1出现,后验概率空间为
则先验概率空间到后验概率空间转换过程为
2.偶发信息的描述
偶发信息对应于半随机试验。
在半随机试验中,可能的状态也是随机发生的,但由于这类试验是偶尔发生的,不具有大量重复时的统计稳定性,因而不能用概率论来描述。
假定某个随机试验X,它有N个可能的状态x1,x2,…,xN。
试验的结果这N个状态总有一个会发生,且x1发生的可能性为q1,x2发生的可能性为q2,…,xN发生的可能性为qN,且满足归一化条件:
实际试验的结果,可能是q1*,q2*,…,qN*,其中某个
,其余的qn*=0。
把q1,q2,…,qN称为关于X的先验可能度分布,用Q表示,而把q1*,q2*,…,qN*称为关于X的后验可能度分布,用Q*表示。
Q和Q*与概率信息场合的P和P*相似,但Q不是概率,无法用统计的方法求出,而是由观察者根据经验给出,是观察者关于X的主观经验性的先验可能性分布,服从归一化约束。
在半随机试验中,X的状态集合和可能度分布描述了事物的运动状态和方式,分别定义(X,Q)和(X,Q*)为先验可能度空间和后验可能度空间,用它们来描述偶发信息。
观察者的实得信息可以用可能度空间的变换描述:
例1.2以赛马为例,假定有三匹编号为1、2、3的马参加比赛,把它看做一个半随机型试验X,则可能的状态有6种:
x1:
123x2:
132x3:
213x4:
231x5:
312x6:
321
试验的结果到底是哪种状态无法用概率或者确定型公式预测,具有偶然性。
同时由于赛马的竞技状态、场地的环境状况等都无法完全重复,也不可能做大量重复试验,因而只能建立主观的或者是经验的可能性分布,而无法建立概率分布。
假设有关X的先验可能度分布为q1,q2,…,qN,而后验可能度分布为q1*,q2*,…,qN*,则实得信息可以由下面变换描述:
3.模糊信息的描述
模糊信息是指用以消除模糊不确定型的信息。
可以用模糊隶属度曲线来描述模糊事物的运动状态和方式。
把模糊集元素的隶属度记为f,第i个元素的隶属度记为fi,整个模糊集上的隶属度分布记为F。
与概率的情况不同,这里的隶属度不满足归一化的要求,即
把模糊试验X和它的隶属度分布F组成的序对(X,F)称为模糊试验的隶属度空间。
这样,模糊试验所提供的模糊信息可以用试验前后隶属度空间的变化来描述。
用符号F表示试验前的隶属度分布,F*表示试验后的隶属度分布,则模糊试验提供的模糊信息可以描述为:
(X,F)→(X,F*)
4.确定型信息的描述
确定型信息是由确定型试验所提供的信息。
所谓确定型试验,是有确定的试验机构,但初始条件和环境条件都具有动态或时变性的试验。
确定型信息可以用确定性的数学模型来表示。
1.2.2信息的申农测度
信息论的创始人申农1948年提出了信息的申农测度。
申农测度的基本思想是:
信息是用来消除不确定性的,信息的数量可以用被消除掉的不确定性的大小来度量,而这种不确定性是由随机性引起的,可以用概率来描述。
因此,申农测度可用以度量随机事件选择结果的不确定性的大小。
假设有随机事件集合x1,x2,…,xN,出现的概率分别为p1,p2,…,pN,满足
,
则随机事件集合x1,x2,…,xN的申农测度为
(1-4)
其中K为正常数,式(1-4)也称为申农熵公式。
为了更好地理解申农测度的来源、内涵及有关假设和性质,下面给出申农熵公式的一个简单证明。
定理满足以下三个条件的不确定性度量Hs可且仅可用(1-4)式表示:
(1)Hs是pi(i=1,…,N)的连续函数;
(2)如果所有的pi相等(即pi=1/N),那么Hs是N的单调增函数;
(3)如果选择分为相继的两步,原先的Hs等于分步选择的各个Hs值的加权和。
其中条件(3)的意义可以做如下解释:
设有3个事件x1,x2和x3,它们出现的概率分别为p1=1/4,p2=1/3和p3=1/6。
在如图1.3所示不分步选择(a)和分步选择(b)的情况下,它们的概率空间是完全相同的,因此它们的不确定性度量Hs是一样的,即
图1.3(a)不分步选择图1.3(b)分步选择
[证明]
先考虑等概率选择的情况(即pi=1/N,i=1,…,N)
令
由条件(3),有
故有
一般地,有
或
(1-5)
对于给定的,总能找到适当的,使得
(1-6)
两边取对数,并除以logS,得
(1-7)
另一方面,由条件
(2)及式(1-5),得
(1-8)
由式(1-5)和(1-7),得
两边除以A(S),得
(1-9)
由式(1-7)、(1-9),得
式中是任意小的正数。
在极限情况下,有
A(t)=Klogt
由条件
(2)知,K必为正数。
因此,在等概率情况下式(1-4)成立。
考虑不等概率的情形,设事件发生的概率为pi,
先考虑
均为有理数的情形。
均为正整数。
求ui的最小公倍数,设其为U,有U=kiui,则
其中
,故
考虑U个等概率为
的事件,可以看成是先作概率为
的N个不等概率的选择,再在每个选择后分别作ni个概率为
的等概率的选择。
根据条件(3),有
即
故
因此,当
均为有理数时,式(1-4)成立。
当pi(i=1,…,N)为无理数时,可以用有理数无限逼近,根据条件
(1),结论也成立。
证毕■
要注意的是,在申农测度公式的证明中,条件
(1)、
(2)和(3)是申农提出的关于不确定性测度的三个基本假设,也是获得申农熵公式的根本依据。
申农熵具有以下一些性质:
(1)对称性
其中{k
(1),…,k(N)}是{1,…,N}的任意置换。
(2)归一性
(3)可扩展性
(4)确定性
(5)极值性
(6)申农不等式
现在,来考察一个标准的二择一事件,即有两种可能结果且两种结果出现的概率相等(抛硬币的事件就是这种情况),该事件的申农测度为
由归一性,有
取2为对数的底,易得常数K=1,此时申农测度公式变为
(1-10)
要注意的是,当对数的底不为2时,常数
,但可以把不为1的K计入信息的度量单位中。
当对数的底为2时,申农测度的度量单位为二进单位,即比特(binarydigit,bit);
以e为底时,称为自然单位,即奈特(naturaldigit,nat);
以10为底时,即迪特(decimaldigit,dit)。
因此,不失一般性,有申农测度公式
(1-11)
为计算和表达方便,规定0log0=0。
容易证明,1比特=ln2奈特,1比特=lg2迪特。
关于申农测度公式的基本假设、推导过程及其性质详见杨善林和刘业政主编的《管理信息学》,此略。
在信息论中,用Is(p1,…,pN)表示消除不确定性Hs(p1,…,pN)所需要的信息量,有
Is(p1,…,pN)=Hs(p1,…,pN)-0=Hs(p1,…,pN)
如果一个事件只有两种可能性,且出现的概率是均匀分布的,用0表示一种可能性,用1表示另一种可能性,则该事件的信息量为I=log22=1bit,即抛硬币出现正面或反面的信息量为I=log22=1bit;
如果一个事件有四种可能性,且出现的概率是均匀分布的,可以用00、01、10、11四个编码来表示,则该事件的信息量为I=log24=2bit;
如果一个事件有八种可能性,且出现的概率是均匀分布的,可以用000、001、010、011、100、101、110、111八个编码来表示,则该事件的信息量为I=log28=3bit;
如果一个事件有三种可能性,且出现的概率是均匀分布的,则该事件的信息量为I=log23=1.58bit。
如果用拉丁字母来传递信息,出现一个字母就有26种可能性,所以每个拉丁字母的信息量为I=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 信息与信息管理 信息 信息管理