返回上一页 文章阅读 登录

郑南宁:面对人工智能挑战,人才培养的下一步该如何走

更新时间:2020-06-07 12:44:14
作者: 郑南宁  

   一、人工智能是一门什么样的学科

   在我们的星球上,生命诞生至今已有40 亿年,所有的生命是按照有机化学的规则改变或者进化,但是今天,由于人工智能出现,改变了这一规则。也就是说,我们今后有可能出现有机生命(就是我们人类)和人工智能共同构造的无机智慧型的生命形式并存,生命可以根据计算机智能设计,超越原先有机化合物的限制。这就给人类社会带来了巨大变革。

   人工智能作为一门学科独立存在,到今天已经历经60 余年了。我们从学术发展基本规律来看,已经经历了三个阶段,我们现在正在走向第四个阶段。从这四个阶段来看,最开始是20 世纪 60 年代到 80 年代,人工智能的一些主要研究是如何构建面向应用领域的专家系统,让机器掌握人类的一些知识、规则,在一定程度上替代人类思维或者完成任务。

   20 世纪 80 年代到 2000 年左右,由于神经网络的出现以及计算能力的提升,我们开始想到让机器帮助我们提取特征,或者说我们将特征、答案交给机器,让机器学习。进入2000 年以后,由于互联网的出现与普及,大数据的获取变得很容易,我们将原始数据和答案交给机器进行深度学习,在语音、图像等分类任务方面,机器的能力已经超过了人类。那么人工智能发展的下一个阶段是什么?我想应该是人类将目标交给机器,让机器去完成。

   也就是说它不是简单的一种感知或数据的计算,我们给它一个模型,它只是按照模型做;而是我们把任务的目标交给机器,机器去完成,并让机器具有“学习的学习”能力,像人一样去思考和学习。这是我们人工智能研究领域追求的一个理想目标。

   在60 余年人工智能发展过程中,学术上形成了各种技术流派。这里简单提一下较为主要的五个流派。符号主义不用多说,是形式化的,使用符号、规则和逻辑来表征知识和进行逻辑推理,其基本观点是认知即计算。之后又出现仿生学派(又称为连接主义),20 世纪 40 年代提出的单层感知模型,就是基于这样的思想技术, 这个流派的基本观点是认知就是网络。还有行为主义学派,主要基于“感知—行动”的行为智能模拟方法,或者说在行为中反馈,我们知道作为能够适应环境的系统而言,是需要有反馈的,反馈控制、遗传算法、蚁群算法、强化学习等属于这一类学派。还有贝叶斯方法,这也属于人工智能方法中的一大类,通过获取发生的可能性来进行概率推理,形成对不确定事件的描述。最后一类称之为类推学派,这类方法是采用SVM,支持向量机,根据约束条件来优化函数。以上五大流派能解决我们所有的问题吗?显然有其局限性。先看符号化人工智能的局限性,符号化人工智能首先要对问题本身抽象出一个数学精确意义上的模型,给出这个模型以后,我们还要给出一个确定的算法。显而易见,算法确定后,我们就没有办法去应对在我们建模的时候没有考虑到的问题,也没有办法去描述现实世界问题所固有的不完备性或测不准性。还有一点,图灵意义下的可计算问题都是可递归的,可递归意味着问题的描述是有序的。以上是我们称之为传统的人工智能或者说符号化人工智能时代的局限性,因为按照计算就是认知,它实际上把所有问题归结为一种形式化描述,或者我们换一种说法来讲,只要能够进行形式化描述,这个问题就可以得到解决。我们再来看深度神经网络的局限性,深度神经网络需要通过大量的标注数据来训练,过度依赖训练数据在一定程度上约束了网络的泛化能力。还有一点,当我们要构建一个拥有非常强大算力的深度神经网络,能够达到我们人类能力几乎不可能的分类,但是它缺乏人类认知的核心——推理——对事实的因果关联的表达能力,因此最近几年里,很多研究者致力于把符号规则引入深度神经网络,使其能够根据知识来建立对数据的因果关联。以上是从模型的意义上谈的,但是实际上从计算角度来看,我们还无法在这种架构下实现有效的注意力机制,进行高效的图像检索。现实世界中我们有很多问题需要基于一种事件的描述或者是通过事件的驱动来求解。因此,在处理的算法层面上我们希望有一种新的模型。例如,在计算过程中,如何把任务分成子任务或者在计算的过程当中使用一个注意力机制来表征数据或分配计算负载。注意力不仅仅是“看”,同时在导引计算的过程,它的路径就是通过引入注意力的机制来提高计算的效能。

   在现实生活中,我们所面对的许多问题具有不确定性、脆弱性、开放性,比如无人驾驶,就是这样一种非常典型的任务。今天的人工智能是建立在形式化和演绎逻辑基础上的,而我们为所有对象建立模型显然是不可能的。这个不可能来源于我们不可能枚举出一个行为所有的先决条件,也就是说我们不可能对一个问题具体描述出所有的边界条件。另外,也不可能枚举出一个行为的所有隐性结果,或者说我们要进行预测时,不可能在一个没有办法完全建模的情况下,让系统给出正确的解。

   因此,我们要研究或者发展一种受脑认知和神经科学启发的人工智能,这是非常有意义的研究方向,也是我们未来人工智能的发展方向。受脑认知和神经科学启发的人工智能,目标是实现具有泛化能力的人类认知信息加工机制。从2016年开始,中国工程院对新一代人工智能做了非常深入的战略研究和讨论,明确了人机混合智能是人工智能未来的发展方向。我们按照这样一个思路,在AI2.0 中把人机协同混合增强智能作为AI2.0 中非常重要的方向,而且它的重要性不仅仅是概念上的,它能够将多个学科交叉汇聚在一起,形成中国对人工智能未来发展作出重要贡献的一个方向。

   二、未来人工智能的形态是什么

   前面说得很清楚,无论机器的智能发展到什么程度,它总是需要人类来使用。人是智能机器的服务对象和最终“价值判断”的仲裁者,因此,人类对机器的干预是贯穿始终的。所以人机协同的这样一种混合智能必然会出现,它是人工智能或机器智能今后发展一种可行的、重要的成长模式。

   2018 年年初在美国新奥尔良召开了美国人工智能协会(AAAI)会议,大会主席做了一个大会报告,题为“Challenge of human aware AIsystems”,这个报告指出面对拥有人类意识的人工智能系统发展,我们人类面临着什么样的挑战。他提出,长期以来很多学者一直在研究人工智能是替代人类劳动还是增强人类劳动,这个问题现在基本明确是在增强人类劳动,因此现在人工智能系统需要与人类更好地协同工作,要设计出具有人类意识的AI系统,要构建人在回路中“心智”状态模型。这一观点与我们在 2016 年提出的观点可以说是不谋而合。

   人机协同发展这样一种新一代人工智能要回答两大基本问题:第一,什么是人类智力所独有的特征;第二,要做到像人类一样拥有智能,计算机需要什么能力。当然我们也经常讲,人类经常只用较少的数据,就能够在广泛问题上表现出智能的行为,其实我们的大脑在进化过程中已经经过了大数据的训练,只是这个训练时间比深度网络大得多,周期非常长。但是,通过计算可以把人类在某个领域长周期的训练在短短几个小时内完成,这就是机器的威力。机器具有可重复性,可以完成规范性的任务,同时因为现在的机器是以形式化语言来描述的,所以具有逻辑性;而人,具有想象和创造的能力,这是人类作为高级生物所独有的特征,正是由于想象和创造,使得大脑处于动态,想象与创造再加上动态就构造了一个非常复杂的系统。现在的问题是,我们应该用何种方式来描述大脑跟外界的交互。因为从计算的角度而言,首先我们要定义这个问题是可计算的,然后在可计算的基础上给出计算的复杂度,如果计算复杂度是机器难以承受的,那么这个问题实际上是得不到求解或者得不到应用的。因此我们探讨人机协同的混合系统,首先要看看模型怎么构造,然后在这个基础上,用什么样的物理形式来实现这个模型的计算。

   谈到可计算,我们还需要弄清楚大脑的工作机理。大脑是一种具有涌现性的复杂自组织巨系统,它拥有约860亿个神经元,每个神经元有数千个突触,神经元之间通过突触连接,构成了自然界一个极为复杂的网络。大脑的工作依赖于突触之间信息的传递,神经递质担当了突触传递中的“信使”。

   实际上人的学习发生在突触的间隙之中。我们知道有抑制性的神经递质也有兴奋性的,多巴胺是兴奋性的,而 γ- 氨基丁酸、去甲肾上腺素是抑制性的。我们现在把神经元看成一个物理计算过程,实际上人的大脑中突触之间的变化是一个极其复杂的电化学过程,因此在计算模型的构建上,我们不仅需要模型具有认知计算的机理,也需要模型满足神经生物学的保真度。现在的深度网络能够给出一个函数的优化拟合,大脑实际上不是通过统一的、没有分化的神经网络来实现单一的全局优化,而是通过各个独特且相互作用的子系统来实现认知。

   从研究角度来看,从以上的讨论我们能够提出什么样的科学问题?其实进行大的研究项目,首先是要凝练科学问题。这里所讨论的科学问题我们可以这样看:第一,大脑是如何实现优化的?在计算的层面如何实现这样的优化?第二,脑网络监督训练信号从哪里来?它们体现不同任务的成本函数?另外,在不同神经功能连接区域中,存在什么样的有效连接来约束和优化与任务相关的成本函数,以有效寻找特定问题的解决方法。(大脑存在三种连接:结构连接、功能连接、有效连接。所谓“有效连接”,是指在执行任务中,在功能连接区神经元的连接是抑制还是兴奋的变化。)

   前面我们谈到了神经生物学,从脑的神经网络结构来看,脑网络连接的变化表现为人的认知行为。人类理解或描述物理世界时,大脑总会形成一种对时间的“可视化”图像,能够抽象出概念,形成常识。常识往往是我们日常生活当中判断事物的一种出发点或者衡量标准。因此现在我们需要思考怎么能够在一个人工智能系统中引入常识,把符号规则引入一个神经计算之中。我们在日常生活当中大量使用常识,但我们现在还没有迈进怎么使机器具有常识这样一个门槛里面。近年来直觉推理的研究已经开始有一些算法出现了,包括AlphaGo实际上就是一种直觉推理。使用代价空间、决策树、认知地图、模型匹配迭代,我们就可以给出一种直觉推理的简单的机器实现。直觉推理从数学解析空间来看,是人能够在复杂问题的解空间当中寻找全局的最优解,我们称之为最好的“猜”。

   前面谈到了直觉推理,下面简单说一下认知推理。认知推理可分为物理层面的认知推理和心理层面的认知推理。物理层面的认知推理可以使我们能够跨越时间与空间追踪事物的发展轨迹;心理层面的认知推理是学习方向受到心理状态的引导。认识推理对事物或者数据的因果关联分析,这是人工智能研究面临的一大挑战。因果模型既要满足认知任务中的物理因果关系产生的物理约束,又要满足以机器为“本我”,理解在当前认知任务下设计的因果关联。

   直觉推理、认知推理乃至因果关联分析,这三者怎么构建一个可计算的智能机器?使机器像人一样对物理世界直观理解。实现物理层面的推理主要有三个基本要素,首先对物体或对象的特征进行识别,并形成记忆,然后给出物体之间相互关系与作用的直观理解,就是建立相关和因果关联。这两者完成以后,我们需要预测怎么能在一个不完整模型下,给出一个适合当前约束和先决条件的合理行为,这就要构造一个基于想象力的行为模型。这样一种计算框架可以应用于无人驾驶和自主停车等多种场景。

当前我们正在研究怎样把视觉深层神经网络模型和语义学的吸引子网络模型相结合,使得网络能够同时实现物理外观的识别和物体属性的语义理解。这个研究方向很有意义,包括自然语言理解,可以使视觉属性与更抽象的语义信息相互作用。前面已谈到,我们构造模型既要有生物的保真性,同时也要有认知的保真性。欧洲的蓝脑计划在生物保真性方面做得很好,但是缺乏在认知层面上的可解释性。我们需要把对认知计算的研究以及以数据驱动的生物计算模型结合起来,这是人工智能未来的新方法。 (点击此处阅读下一页)

本文责编:yangjiaxin
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/121622.html
文章来源:中国大学教学 2019年第 2期
收藏