返回上一页 文章阅读 登录

肖静宁:神经网络研究开辟了认识大脑与思维关系的新途径

更新时间:2019-02-25 11:51:29
作者: 肖静宁 (进入专栏)  

  

   自从1987年首届神经网络国际会议召开以来神经网络研究迅速发展,成为令人瞩目的世界性的重要科学前沿和多学科协作攻关的焦点。神经网络研究异军突起,其影响是多方面的,特别是对揭示大脑奥秘、阐明智能的本质带来新的曙光。

  

   顾名思议,神经网络是指神经元(神经细胞)构成的网络,理应是神经生物学的领地。但是,目前“神经网络研究”的真正含义是研究人工网络模型,它包括:神经生理的定量描述;神经网络模型的建立;对模型进行数学处理(包括学习算法)及其性能的研究;由此发展出的一些新技术及其应用的研究,即研究新一代的神经计算机。而大自然创造的各类真实的、生活着的神经网络,包括思维着的人脑网络则统称为生物神经网络。人工神经网络(Artical  neural  network)向生物神经网络(Biological  neural  network)学习、反过来又以揭示生物神经网络——人脑的奥秘为宗旨。这样,神经网络研究不可避免地要深入到人的智能与思维领域,为人脑与思维的关系带来新的认识,因此,这一领域的研究进展理应受到哲学工作者的关注。

  

   一、模型与神经网络模型

  

   “模型”概念在控制论的方法论中占有突出的地位。控制论的基本任务之一就是要在理论上找到技术系统与生物系统之间在功能或行为上的相似性,而撇开它们的本质区别。由于自然选择的作用和亿万年进化的结果,生物体比技术系统远为复杂,它是性能复杂的多级结构的大系统。人们往往把生物体作为原型,而建立一种在信息变换与信息控制方面具有相似性的模型。这就可以通过对模型的研究来揭示生物原型的某些功能,从而使问题大大简化而易于着手进行。

  

   神经网络研究的核心是神经网络模型的研究。要建立生物系统的模型,其途径是多种多样的,而以建立相应的数学模型最为重要。由于生物神经网络是极其复杂的,能用于建立神经网络数学模型的知识尚不够丰富,因而只能建立一种近似和简化的模型。神经网络模型虽然反映了大脑功能的某些特征,但绝非其逼真的 描写,因此神经网络模型对大脑功能的模拟难免带上人工斧凿的痕迹。由于计算机的发展,使得本来在数学上难以解决的问题,现在可以通过在计算机上进行计算而得到解决。这种计算机模拟经济方便,使用广泛,而只有在实际应用的场合才制造硬件模型(物理模型)。

  

   神经网络是新的一类技术系统,是由大量简单元件广泛互联而成的复杂网络系统。所谓简单元件又称神经元,是指它可用电子元件、光学元件等模拟,仅起简单的输入—输出变换的作用。每一单元相当于一双态判定器件,当对它的输入电压超过一个特定的阈值时,这一器件就从一个状态转变到另一个状态,因而它是人脑神经元的模拟。目前用非线性元件并行处理来模拟众多的人脑神经元,每一单元有许多输入、输出键,各单元间以连接键(又称突触)相连,用其间复杂灵活的联接关系模拟人脑神经元之间的突触行为。联接键决定各单元之间的连接强度(突触强度或权重)和性质(兴奋和抑制)。用Wij=0时,则表示神经元i到神经元j间连接强度或权重,当Wij>0时,表示i、j神经元间有兴奋性连接;当Wij < 0时,则表示i、j神经元间为抑制性连接;当Wij=0 时,等于两者无联系。这样将N个神经元(一般N很大)构成一个互相影响的复杂网络系统,这个网络的性能取决于全部连接强度和阈值,这也是全部信息所在。通过调整参数,使网络具有所需要的特定功能,称为学习、训练或自组织。这是神经网络系统改善自身性能的过程,通过此过程可在一定程度上模拟人与动物的学习功能。

  

   二、神经网络研究的历史进程

  

   纵观神经网络研究,它经历了兴起、低潮和重新崛起三个阶段。对大脑的认识水平以及对其模拟的多种学科条件制约着神经网络研究的进程。早在20世纪40年代,当维纳、罗森布拉特、麦克卡洛克、匹茨等科学家在酝酿控制论的时候,人们就把探索的目光投向了神经系统和思维问题。揭示大脑的奥秘、阐明智能的本质始终是神经网络研究追求的目标。

  

   1.神经网络的兴起与低谷——从M—P模型到结构主义的仿生学派

  

   1943年是神经网络研究历史上值得纪念的一年。这一年麦克卡洛克与匹茨发表了著名的“神经活动中所蕴含思想的逻辑运算”一文,一方面赋予神经元及其组成的神经网络以符号逻辑描述,对后来的神经网络研究产生持续的影响;另一方面,他们有关“通过神经联接和神经元适当的阈值,大脑内神经元的活动性可以表征外部世界的感官初始命题的一切有限的逻辑组合”的科学思想,提供了以后脑研究的理论发展与实验路线的基础。他们首次提出了神经元和神经网络的数学模型,后经修正为著名的M—P模型——阈值逻辑模型。模型的基本特点是模拟神经元扩布性峰电位的“全或无”性质,注意的中心是神经元的数学特性。模型把神经元看成逻辑元件,由此把脑的思维过程视为一个可操作过程,即认为任何复杂的思想都可以还原为基本逻辑电路的基本操作的组合。基于M—P模型,科学家制造了许多模拟人脑的人工系统,既能运算,又能处理逻辑问题。其中影响最大的是罗森布拉特的感知机(Perceptron).

  

   感知机的问世也是神经网络创始阶段有重大影响的事件之一,是脑模型研究的又一个里程碑。1958年罗森布拉特从特殊的途径,以对人脑结构与功能的初步认识为基础,模仿人脑处理信息的多层结构,制造出具有三层结构的感知机——视知觉的脑模型,实现了能够识别一些文字和模式的“电子眼”,激起了人们对神经网络研究的巨大热情。但这种纯粹用硬件结构来模拟人类智能的方法,即结构主义的仿生学方法很快陷入困境。由于当时对原型—大脑的认识并不清楚,技术条件也不能设想对已有认识去实现结构模拟,而且当时计算机的发展水平还难以对感知机网络进行仿真分析,加之权威人士对感知机的应用前景的尖锐批评,使结构主义的仿生学派受到极大挫折。罗森布拉特设计的“类人脑”的神经网络自然无法实现,人们对神经网络的兴趣大减,以致从20世纪60年代中期起,神经网络研究就进入了长达近20年的低谷。与此同时,则是数学计算机的大发展。

  

   2.数学计算机和人工智能的兴起与繁荣——从图灵机到冯 •诺伊曼计算机

  

   麦克卡洛克与匹茨的思想以及图灵(Turing)有关理想计算机的思想可以看做计算机人工智能研究的一个出发点。1946年世界上第一台电子计算机ENAIC应军事需要而问世,而1936年图灵设计的理想计算机则是现代计算机的原型。图灵机实际上是用数学方法加以精确定义的并能反映计算机程序的抽象系统。图灵是从对可计算性的研究提出图灵概念的。图灵机是一个有限长度的操作序列,任何可计算的问题都可以由图灵机化为最简单的串行操作。

  

   数学家冯 • 诺伊曼(Von  Neumann)被称为“计算机之父”,他在图灵理论的基础上,构成现代计算机的体系结构,提出了全新的存贮程序通用电子计算机方案,要点有二,一是采取了二进制,才发挥了电子元件高速的特点;二是实现了存贮程序的思想,即事先把编好的程序存贮于机器中,机器能自动地按照程序执行一条条指令。存贮程序新思想是属于冯 •  诺伊曼的,所以这种计算机也称为冯 • 诺伊曼计算机。

  

   与神经网络处于低谷相反,冯 • 诺伊曼计算机成就辉煌,几十年来不断更新换代,在硬件(减少体积、重量、消耗功率、提高速度)和软件(方便与扩大使用范围)方面取得惊人的进步,被誉为“电脑”。但其基本思想未变,其核心部分中央处理单元(CPU)仍然是以二进制串行运算为基础。但冯 • 诺伊曼计算机及其相应人工智能的成功却在相当长的时间内掩盖了神经网络研究的迫切性。而传统计算机有待新的突破,第五代计算机的目标远未实现,这就成了神经网络研究重新崛起的动力。

  

   3.神经网络的重新崛起——联结主义及其渊源

  

   神经网络研究经过了长达20年的低谷,终于在20世纪80年代东山再起,其标志为霍普菲尔德(Hopfield)神经网络模型的建立。1982年美国物理学家霍普菲尔德发表论文,提出一种互相联接的神经网络模型,并研究它的整个网络的动力学性质,并在优化计算等领域获得了重大的进展。除Hopfield 模型外,近年来还发展出许多新的网络模型。

  

   神经网络研究迅速形成世界性热潮,其原因是多方面的。其中有:神经科学的发展揭示了神经系统处理信息的一些普遍原则,这给神经网络研究带来新的启迪;一系列研究复杂系统的学科群,使神经网络的拓扑结构、学习算法,以及神经网络在超大规模集成电路上的实现技术等都取得了新的突破,使神经网络长期面临的困难局面豁然开朗。这集中表现在神经网络研究中出现的、作为神经网络结构基础的联结主义(Connectionism)这一崭新概念上。

  

   建立在联结主义基础上的神经网络在结构上都打破了原有模型“神经元数量少而且联结简单”的局限性,追求具有一定规模、特别是具有复杂灵活联结的网络。每个神经元都是一个多输入单输出的非线性运算单元,神经元之间的突触强度或权重大小可以根据需要在0到1之间调整:0表示不联结,1表示全联结,其它数值表示处于中间状态的联结强度。因此,只要调整这些权重就可以改变整个网络的实际拓扑结构与行为。这种通过调整权重来改变整个网络的联结关系,从而改变网络的功能,就是“联结主义”概念的基本内涵。研究者对神经网络研究中的联结主义持相当乐观的估计,希望能作为建立解决诸如知识表达、推理学习、联想记忆等复杂问题的统一模型的理论基础。

  

   联结主义的兴起是有其深刻的渊源的,从某种意义来讲,神经网络研究源出于大自然造化之精华——人脑,而神经网络的真正奠基者是西班牙著名神经学家卡哈(Cajal)。卡哈经过严密的研究于1906年创立了“神经元学说”,奠定了神经科学的结构基础。卡哈关于神经元通过突触进行机构上的联系,组成复杂的神经网络组织的精辟观点已为神经科学的发展所证实。在将近半个世纪之后,加拿大心理学家赫布(Hebb)发展了卡哈的思想,提出了“突触学习定律”,亦即著名的Hebb定律。Hebb定律是关于突触联系效率可变的定性假说。

  

Hebb的贡献在于,是他最早提出突触联系强度或权重可以通过学习自动进行调整,从而改变神经元的功能状态。Hebb规则虽很简单,但却是神经网络模型研究人员公认的规则,它体现了如何按照经验来改变网络组织相互联结问题,即网络学习问题。Hebb规则与上述的M—P模型相比,突出了突触强度的调变作用。在M—P模型中,假定突触权重是相对不变的,Hebb定律则突破了M—P模型的这种局限性。Hebb假说不仅通过神经生物学实验得到验证,(点击此处阅读下一页)

本文责编:川先生
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/115227.html
文章来源:作者授权爱思想发布,转载请注明出处(http://www.aisixiang.com)。
收藏