神经网络.docx
- 文档编号:28935248
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:45
- 大小:299.23KB
神经网络.docx
《神经网络.docx》由会员分享,可在线阅读,更多相关《神经网络.docx(45页珍藏版)》请在冰豆网上搜索。
神经网络
神经网络介绍(IntroductiontoNeuralNetworks)
曾有很长一个时期,人工神经网络对我来说是完全神秘的东西。
当然,有关它们我在文献中已经读过了,我也能描述它们的结构和工作机理,但我始终没有能“啊哈!
”一声,如同你头脑中一个难于理解的概念有幸突然得到理解时的感觉那样。
我的头上好象一直有个榔头在敲着,或者像电影AnimalHouse (中文片名为“动物屋”)中那个在痛苦地尖叫“先生,谢谢您,再给我一个啊!
”的可怜家伙那样。
我无法把数学概念转换成实际的应用。
有时我甚至想把我读过的所有神经网络的书的作者都抓起来,把他们缚到一棵树上,大声地向他们吼叫:
“不要再给我数学了,快给我一点实际东西吧!
”。
但无需说,这是永远不可能发生的事情。
我不得不自己来填补这个空隙...由此我做了在那种条件下唯一可以做的事情。
我开始干起来了。
<一笑>
这样几个星期后,在一个美丽的日子里,当时我在苏格兰海边度假,当我越过一层薄雾凝视着狭长的海湾时,我的头脑突然受到一个冲击。
一下子悟到了人工神经网络是怎样工作的。
我得到“啊哈!
”的感觉了!
但我此时身边只有一个帐篷和一个睡袋,还有半盒子的脆玉米片,没有电脑可以让我迅速写出一些代码来证实我的直觉。
Arghhhhh!
这时我才想到我应该买一台手提电脑。
不管怎样,几天后我回到家了,我立刻让我的手指在键盘上飞舞起来。
几个小时后我的第一人工神经网络程序终于编成和运行了,并且工作得挺好!
自然,代码写的有点乱,需要进行整理,但它确实已能工作了,并且,更重要的是,我还知道它为什么能工作。
我可以告诉你,那天我是一位非常得意的人!
我希望本书传递给你的就是这种“啊哈!
”感觉。
当我们学完遗传算法时,你可能已尝到了一点感觉,但你希望这种感觉是美妙的话,那就要等把神经网络部分整个学完。
生物学的神经网络-大脑(ABiologicalNeuralNetwork–TheBrain)
你的大脑是一块灰色的、像奶冻一样的东西。
它并不像电脑中的CPU那样,利用单个或少数几个处理单元来进行工作。
如果你有一具新鲜地保存到福尔马林中的尸体,用一把锯子小心地将它的头骨锯开,搬掉头盖骨后,你就能看到熟悉的脑组织皱纹。
大脑的外层象一个大核桃那样,全部都是起皱的[图0左],这一层组织就称皮层(Cortex)。
如果你再小心地用手指把整个大脑从头颅中端出来,再去拿一把外科医生用的手术刀,将大脑切成片,那么你将看到大脑有两层[图0右]:
灰色的外层(这就是“灰质”一词的来源,但没有经过福尔马林固定的新鲜大脑实际是粉红色的。
)和白色的内层。
灰色层只有几毫米厚,其中紧密地压缩着几十亿个被称作neuron(神经细胞、神经元)的微小细胞。
白色层在皮层灰质的下面,占据了皮层的大部分空间,是由神经细胞相互之间的无数连接线组成(但没有神经细胞本身,正如印刷电路板的背面,只有元件的连线,而没有元件本身那样,译注)。
皮层象核桃一样起皱,这可以把一个很大的表面区域塞进到一个较小的空间里。
这与光滑的皮层相比能容纳更多的神经细胞。
人的大脑大约含有10G(即100亿)个这样的微小处理单元;一只蚂蚁的大脑大约也有250,000个。
以下表1 显示了人和几种动物的神经细胞的数目。
表l人和几种动物的神经细胞的数目
动物 种类
神经细胞的数目(数量级)
蜗牛
10,000(=104)
蜜蜂
100,000(=105)
蜂雀
10,000,000(=107)
老鼠
100,000,000(=108)
人类
10,000,000,000(=1010)
大象
100,000,000,000(=1011)
图0-1大脑半球像核桃
图0-2大脑皮层由灰质和白质组成
图0大脑的外形和切片形状
图1神经细胞的结构
在人的生命的最初9个月内,这些细胞以每分钟25,000个的惊人速度被创建出来。
神经细胞和人身上任何其他类型细胞十分不同,每个神经细胞都长着一根像电线一样的称为轴突(axon)的东西,它的长度有时伸展到几厘米[译注2],用来将信号传递给其他的神经细胞。
神经细胞的结构如图1 所示。
它由一个细胞体(soma)、一些树突(dendrite)、和一根可以很长的轴突组成。
神经细胞体是一颗星状球形物,里面有一个核(nucleus)。
树突由细胞体向各个方向长出,本身可有分支,是用来接收信号的。
轴突也有许多的分支。
轴突通过分支的末梢(terminal)和其他神经细胞的树突相接触,形成所谓的突触(Synapse),(图中未画出),一个神经细胞通过轴突和突触把产生的信号送到其他的神经细胞。
每个神经细胞通过它的树突和大约10,000个其他的神经细胞相连。
这就使得你的头脑中所有神经细胞之间连接总计可能有l00,000,000,000,000个。
这比100兆个现代电话交换机的连线数目还多。
所以毫不奇怪为什么我们有时会产生头疼毛病!
有趣的事实
曾经有人估算过,如果将一个人的大脑中所有神经细胞的轴突和树突依次连接起来,并拉成一根直线,可从地球连到月亮,再从月亮返回地球。
如果把地球上所有人的脑中的神经细胞的轴突和树突连接起来,则可以伸展到离开我们最近的星系!
神经细胞利用电-化学过程交换信号。
输入信号来自另一些神经细胞。
这些神经细胞的轴突末梢(也就是终端)和本神经细胞的树突相遇形成突触(synapse),信号就从树突上的突触进入本细胞。
信号在大脑中实际怎样传输是一个相当复杂的过程,但就我们而言,重要的是把它看成和现代的计算机一样,利用一系列的0和1来进行操作。
就是说,大脑的神经细胞也只有两种状态:
兴奋(fire)和不兴奋(即抑制)。
发射信号的强度不变,变化的仅仅是频率。
神经细胞利用一种我们还不知道的方法,把所有从树突突触上进来的信号进行相加,如果全部信号的总和超过某个阀值,就会激发神经细胞进入兴奋(fire)状态,这时就会有一个电信号通过轴突发送出去给其他神经细胞。
如果信号总和没有达到阀值,神经细胞就不会兴奋起来。
这样的解释有点过分简单化,但已能满足我们的目的。
正是由于数量巨大的连接,使得大脑具备难以置信的能力。
尽管每一个神经细胞仅仅工作于大约100Hz的频率,但因各个神经细胞都以独立处理单元的形式并行工作着,使人类的大脑具有下面这些非常明显的特点:
能实现无监督的学习。
有关我们的大脑的难以置信的事实之一,就是它们能够自己进行学习,而不需要导师的监督教导。
如果一个神经细胞在一段时间内受到高频率的刺激,则它和输入信号的神经细胞之间的连接强度就会按某种过程改变,使得该神经细胞下一次受到激励时更容易兴奋。
这一机制是50多年以前由DonardHebb在他写的OrganinationofBehavior一书中阐述的。
他写道:
“当神经细胞A的一个轴突重复地或持久地激励另一个神经细胞B后,则其中的一个或同时两个神经细胞就会发生一种生长过程或新陈代谢式的变化,使得激励B细胞之一的A细胞的效能会增加”
与此相反的是,如果一个神经细胞在一段时间内不受到激励,那么它的连接的有效性就会慢慢地衰减。
这一现象就称可塑性(plasticity)。
对损伤有冗余性(tolerance)。
大脑即使有很大一部分受到了损伤,它仍然能够执行复杂的工作。
一个著名的试验就是训练老鼠在一个迷宫中行走。
然后,科学家们将其大脑一部分一部分地、越来越大地加以切除。
他们发现,即使老鼠的很大一部份大脑被切除,它们仍然能在迷宫中找到行走路径。
这一事实证明了,在大脑中,知识并不是保存在一个局部地方。
另外所作的一些试验则表明,如果大脑的一小部分受到损伤,则神经细胞能把损伤的连接重新生长出来。
【译注:
我想到在人类身上也能见到这种现象:
由于心血管病或其他原因引起大面积脑组织坏死的脑梗死病人经过一段时间的康复训练后也能恢复健康,特别是,记忆力并不受损。
】
处理信息的效率极高。
神经细胞之间电-化学信号的传递,与一台数字计算机中CPU的数据传输相比,速度是非常慢的,但因神经细胞采用了并行的工作方式,使得大脑能够同时处理大量的数据。
例如,大脑视觉皮层在处理通过我们的视网膜输入的一幅图象信号时,大约只要100ms的时间就能完成。
考虑到你的神经细胞的平均工作频率只有100Hz,100ms的时间就意味只能完成10个计算步骤!
想一想通过我们眼睛的数据量有多大,你就可以看到这真是一个难以置信的伟大工程了。
善于归纳推广。
大脑和数字计算机不同,它极擅长的事情之一就是模式识别,并能根据已熟悉信息进行归纳推广(generlize)。
例如,我们能够阅读他人所写的手稿上的文字,即使我们以前从来没见过他所写的东西。
它是有意识的。
意识(consciousness)是神经学家和人工智能的研究者广泛而又热烈地在辩论的一个话题。
有关这一论题已有大量的文献出版了,但对于意识实际究竟是什么,至今尚未取得实质性的统一看法。
我们甚至不能同意只有人类才有意识,或者包括动物王国中人类的近亲在内才有意识。
一头猩猩有意识吗?
你的猫有意识吗?
上星期晚餐中被你吃掉的那条鱼有意识吗?
因此,一个人工神经网络( Artificialneuralnetwork, 简称ANN )就是要在当代数字计算机现有规模的约束下,来模拟这种大量的并行性,并在实现这一工作时,使它能显示许多和人或动物大脑相类似的特性。
下面就让我们瞧瞧它们的表演吧!
【译注1】引自JohnR.Searle的“MINDS,BRAINANDSCIENCE”,p44。
JohnR.Searle是美国当代哲学-心理学家,写过大量有关大脑和意识本质方面的书。
【译注2】这是指全在大脑中神经细胞,否则,如支配全身各部分的神经细胞有的远远要长,如超过一米。
3 数字版的神经网络 (TheDigitalVersion)
上面我们看到了生物的大脑是由许多神经细胞组成,同样,模拟大脑的人工神经网络ANN是由许多叫做人工神经细胞(Artificialneuron,也称人工神经原,或人工神经元)的细小结构模块组成。
人工神经细胞就像真实神经细胞的一个简化版,但采用了电子方式来模拟实现。
一个人工神经网络中需要使用多少个数的人工神经细胞,差别可以非常大。
有的神经网络只需要使用10个以内的人工神经细胞,而有的神经网络可能需要使用几千个人工神经细胞。
这完全取决于这些人工神经网络准备实际用来做什么。
有趣的事实 有一个叫HugodeGaris的同行,曾在一个雄心勃勃的工程中创建并训练了一个包含1000,000,000个人工神经细胞的网络。
这个人工神经网络被他非常巧妙地建立起来了,它采用蜂房式自动机结构,目的就是为一客户定制一个叫做CAMBrainMachine(“CAM大脑机器”)的机器(CAM就是CellularAutomataMachine的缩写)。
此人曾自夸地宣称这一人工网络机器将会有一只猫的智能。
许多神经网络研究人员认为他是在“登星”了,但不幸的是,雇用他的公司在他的梦想尚未实现之前就破产了。
此人现在犹他州,是犹他州大脑工程(UtahBrainProject)的领导。
时间将会告诉我们他的思想最终是否能变成实际有意义的东西。
[译注1]
[译注1]HugodeGaris现在为犹他州立大学教授,有关他和他的CAM机器,可在该校网站的一个网页上看到报道,其上有真实的照片, 见http:
//www.cs.usu.edu/~degaris
图2一个人工神经细胞
我想你现在可能很想知道,一个人工神经细胞究竟是一个什么样的东西?
但是,它实际上什么东西也不像;它只是一种抽象。
还是让我们来察看一下图2吧,这是表示一个人工神经细胞的一种形式。
图中,左边几个灰底圆中所标字母w代表浮点数,称为权重(weight,或权值,权数)。
进入人工神经细胞的每一个input(输入)都与一个权重w相联系,正是这些权重将决定神经网络的整体活跃性。
你现在暂时可以设想所有这些权重都被设置到了-1和1之间的一个随机小数。
因为权重可正可负,故能对与它关联的输入施加不同的影响,如果权重为正,就会有激发(excitory)作用,权重为负,则会有抑制(inhibitory)作用。
当输入信号进入神经细胞时,它们的值将与它们对应的权重相乘,作为图中大圆的输入。
大圆的‘核’是一个函数,叫激励函数(activationfunction),它把所有这些新的、经过权重调整后的输入全部加起来,形成单个的激励值(activationvalue)。
激励值也是一浮点数,且同样可正可负。
然后,再根据激励值来产生函数的输出也即神经细胞的输出:
如果激励值超过某个阀值(作为例子我们假设阀值为1.0),就会产生一个值为1的信号输出;如果激励值小于阀值1.0,则输出一个0。
这是人工神经细胞激励函数的一种最简单的类型。
在这里,从激励值产生输出值是一个阶跃函数[译注2]。
看一看图3后你就能猜到为什么有这样的名称。
图3阶跃激励函数
[译注2]由图可知阶跃函数是一元的,而激励函数既然能把多个输入相加应为多元,故需加以区别。
如果到目前为止你对这些还没有获得很多感觉,那也不必担心。
窍门就是:
不要企图去感觉它,暂时就随波逐流地跟我一起向前走吧。
在经历本章的若干处后,你最终就会开始弄清楚它们的意义。
而现在,就放松一点继续读下去吧。
3.1现在需要一些数学了(NowforSomeMath)
今后讨论中,我将尽量把数学降低到绝对少量,但学习一些数学记号对下面还是很有用的。
我将把数学一点一点地喂给你,在到达有关章节时向你介绍一些新概念。
我希望采用这样的方式能使你的头脑能更舒适地吸收所有的概念,并使你在开发神经网络的每个阶段都能看到怎样把数学应用到工作中。
现在首先让我们来看一看,怎样把我在此之前告诉你的所有知识用数学方式表达出来。
一个人工神经细胞(从现在开始,我将把“人工神经细胞”简称它为“神经细胞”)可以有任意n个输入,n代表总数。
可以用下面的数学表达式来代表所有n个输入:
x1,x2,x3,x4,x5,...,xn
同样n个权重可表达为:
w1,w2,w3,w4,w5 ...,wn
请记住,激励值就是所有输入与它们对应权重的之乘积之总和,因此,现在就可以写为:
a=w1x1 +w2x2 +w3x3 +w4x4 +w5x5 +...+wnxn
以这种方式写下的求和式,我在第5章“建立一个更好的遗传算法”中已提到,可以用希腊字母Σ来简化:
译注:
神经网络的各个输入,以及为各个神经细胞的权重设置,都可以看作一个n维的向量。
你在许多技术文献中常常可以看到是以这样的方式来引用的。
下面我们来考察在程序中应该怎样实现?
假设输入数组和权重数组均已初始化为x[n]和w[n],则求和的代码如下:
doubleactivation=0;
for(inti=0;i { activation+=x[i]*w[i]; } 图4以图形的方式表示了此方程。 请别忘记,如果激励值超过了阀值,神经细胞就输出1;如果激活小于阀值,则神经细胞的输出为0。 这和一个生物神经细胞的兴奋和抑制是等价的。 我们假设一个神经细胞有5个输入,他们的权重w都初始化成正负1之间的随机值(-1 表2说明了激励值的求和计算过程。 图4神经细胞的激励函数 如果我们假定激活所需阀值=1,则因激励值1.1>激活阀值1,所以这个神经细胞将输出1。 在进一步读下去之前,请你一定要确切弄懂激励函数怎样计算。 表2 神经细胞激励值的计算 输入 权重 输入与权重的乘积 运行后总和 1 0.5 0.5 0.5 0 -0.2 0 0.5 1 -0.3 -0.3 0.2 1 0.9 0.9 1.1 0 0.1 0 1.1 3.2 行,我知道什么是神经细胞了,但用它来干什么呢? 大脑里的生物神经细胞和其他的神经细胞是相互连接在一起的。 为了创建一个人工神经网络,人工神经细胞也要以同样方式相互连接在一起。 为此可以有许多不同的连接方式,其中最容易理解并且也是最广泛地使用的,就是如图5所示那样,把神经细胞一层一层地连结在一起。 这一种类型的神经网络就叫前馈网络(feedforwordnetwork)。 这一名称的由来,就是因为网络的每一层神经细胞的输出都向前馈送(feed)到了它们的下一层(在图中是画在它的上面的那一层),直到获得整个网络的输出为止。 图5一个前馈网络 由图可知,网络共有三层(译注: 输入层不是神经细胞,神经细胞只有两层)。 输入层中的每个输入都馈送到了隐藏层,作为该层每一个神经细胞的输入;然后,从隐藏层的每个神经细胞的输出都连到了它下一层(即输出层)的每一个神经细胞。 图中仅仅画了一个隐藏层,作为前馈网络,一般地可以有任意多个隐藏层。 但在对付你将处理的大多数问题时一层通常是足够的。 事实上,有一些问题甚至根本不需要任何隐藏单元,你只要把那些输入直接连结到输出神经细胞就行了。 另外,我为图5选择的神经细胞的个数也是完全任意的。 每一层实际都可以有任何数目的神经细胞,这完全取决于要解决的问题的复杂性。 但神经细胞数目愈多,网络的工作速度也就愈低,由于这一缘故,以及为了其他的几种原因(我将在第9章作出解释),网络的规模总是要求保持尽可能的小。 到此我能想象你或许已对所有这些信息感到有些茫然了。 我认为,在这种情况下,我能做的最好的事情,就是向你介绍一个神经网络在现实世界中的实际应用例子,它有望使你自己的大脑神经细胞得到兴奋! 不错吧? 好的,下面就来了... 你可能已听到或读到过神经网络常常用来作模式识别。 这是因为它们善于把一种输入状态(它所企图识别的模式)映射到一种输出状态(它曾被训练用来识别的模式)。 下面我们来看它是怎么完成的。 我们以字符识别作为例子。 设想有一个由8x8个格子组成的一块面板。 每一个格子里放了一个小灯,每个小灯都可独立地被打开(格子变亮)或关闭(格子变黑),这样面板就可以用来显示十个数字符号。 图6显示了数字“4”。 图6 用于字符显示的矩阵格点 要解决这一问题,我们必需设计一个神经网络,它接收面板的状态作为输入,然后输出一个1或0;输出1代表ANN确认已显示了数字“4”,而输出0表示没有显示“4”。 因此,神经网络需要有64个输入(每一个输入代表面板的一个具体格点)和由许多神经细胞组成的一个隐藏层,还有仅有一个神经细胞的输出层,隐藏层的所有输出都馈送到它。 我真希望你能在你的头脑中画出这个图来,因为要我为你把所有这些小圆和连线统统画出来确实不是一桩愉快的事<一笑>。 一旦神经网络体系创建成功后,它必须接受训练来认出数字“4”。 为此可用这样一种方法来完成: 先把神经网的所有权重初始化为任意值。 然后给它一系列的输入,在本例中,就是代表面板不同配置的输入。 对每一种输入配置,我们检查它的输出是什么,并调整相应的权重。 如果我们送给网络的输入模式不是“4”,则我们知道网络应该输出一个0。 因此每个非“4”字符时的网络权重应进行调节,使得它的输出趋向于0。 当代表“4”的模式输送给网络时,则应把权重调整到使输出趋向于1。 如果你考虑一下这个网络,你就会知道要把输出增加到10是很容易的。 然后通过训练,就可以使网络能识别0到9的所有数字。 但为什么我们到此停止呢? 我们还可以进一步增加输出,使网络能识别字母表中的全部字符。 这本质上就是手写体识别的工作原理。 对每个字符,网络都需要接受许多训练,使它认识此文字的各种不同的版本。 到最后,网络不单能认识已经训练的笔迹,还显示了它有显著的归纳和推广能力。 也就是说,如果所写文字换了一种笔迹,它和训练集中所有字迹都略有不同,网络仍然有很大几率来认出它。 正是这种归纳推广能力,使得神经网络已经成为能够用于无数应用的一种无价的工具,从人脸识别、医学诊断,直到跑马赛的预测,另外还有电脑游戏中的bot(作为游戏角色的机器人)的导航,或者硬件的robot(真正的机器人)的导航。 这种类型的训练称作有监督的学习(supervisedlearnig),用来训练的数据称为训练集(trainingset)。 调整权重可以采用许多不同的方法。 对本类问题最常用的方法就是反向传播(backpropagation,简称backprop或BP)方法。 有关反向传播问题,我将会在本书的后面,当你已能训练神经网络来识别鼠标走势时,再来进行讨论。 在本章剩余部分我将集中注意力来考察另外的一种训练方式,即根本不需要任何导师来监督的训练,或称无监督学习(unsupervisedlearnig)。 这样我已向你介绍了一些基本的知识,现在让我们来考察一些有趣的东西,并向你介绍第一个代码工程。 4.聪明的扫雷机工程(SmartMinesweeperProject) 我要向你介绍的第一个完整例子,是怎么使用神经网络来控制具有人工智能的扫雷机的行为。 扫雷机工作在一个很简单的环境中,那里只有扫雷机以及随机散布的许多地雷。 图7 运行中的演示程序。 尽管书上图形画成了黑白色,但当你运行程序时性能最好的扫雷机将显现为红色。 地雷,你可能已经猜到,就是那些小方形。 工程的目标是创建一个网络,它不需要从我们这里得到任何帮助,就能自己进行演化(evolve)去寻找地雷。 为了实现这一功能,网络的权重将被编码到基因组中,并用一个遗传算法来演化它们。 怎么样,很酷吧? 提示(重要) 如果你跳过前面的一些章节来到这里,而你又不了解怎样使用遗传算法,则在进一步阅读下面的内容之前,你应回到前面去补读一下有关遗传算法的内容。 首先让我解释人工神经网络(ANN)的体系结构。 我们需要决定输入的数目、输出的数目、还有隐藏层的数目和每个隐藏层中隐藏单元的数目。 4.1选择输出(ChoosingtheOutputs) 那么,人工神经网络怎样控制扫雷机的行动呢? 问得很好! 我们把扫雷机想象成和坦克车一样,通过左右2个能转动的履带式轮轨(track)来行动的。 见图案9.8。 图8 扫雷机的控制 扫雷机向前行进的速度,以及向左、向右转弯的角度,都是通过改变2个履带轮的相对速度来实现的。 因此,神经网络需要2个输出,1个是左侧履带轮的速度,另一个是右侧履带轮的速度。 啊,但是...,我听见你在嘀咕了。 如果网络只能输出一个1或一个0,我们怎么能控制车轨移动的快慢呢? 你是对的;如果利用以前描述的阶跃函数来决定输出,我们就根本无法控制扫雷机实际移动。 幸好,我有一套戏法,让我卷起袖子来,把激励函数的输出由阶跃式改变成为在0-1之间连续变化的形式,这样就可以供扫雷机神经细胞使用了。 为此,有几种函数都能做到这样,我们使用的是一个被称为逻辑斯蒂S形函数(logisticsigmoidfunction)[译注1]。 该函数所实现的功能,本质上说,就是把神经细胞原有的阶跃式输出曲线钝化为一光滑曲线,后者绕y轴0.5处点对称[译注2],如图9所示。 [译注1]logistic有’计算的’或’符号逻辑的’等
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 神经网络