返回上一页 文章阅读 登录

陈小平:人工智能的历史进步、目标定位和思维演化

更新时间:2018-11-15 01:33:48
作者: 陈小平  

   【内容提要】 阿尔法狗”、深度学习等人工智能新进展引起广泛关注,一种观点认为人工智能即将大功告成,另一种观点认为人类社会即将大祸临头。本文分析表明,这两种看法不仅没有科学依据,而且与事实不符。人工智能有两种经典思维——暴力法和训练法,都不能有效应对不确定性问题,因此人工智能在不确定性问题领域依旧面临根本性科学挑战,同时也存在重大机遇。“阿尔法元”是两种人工智能经典思维的融合与超越,代表着人工智能在确定性问题领域的历史性进步,预示着人工智能应用的新局面。本文进一步分析表明,“全能型人工智能”是没有科学基础的,人工智能需要反思其目标定位,也需要加快推进思维演化。针对不确定性问题,本文介绍一种人工智能新思维——容差性思维,以及一种机器人灵巧性技术路线。

   【关键词】 人工智能,智能机器人,思维,精确性,容差性

  

   据说人类下围棋已有几千年历史,而人工智能“下”围棋只不过几十年,可是一个人工智能程序“阿尔法狗”(AlphaGo)却轻而易举地远远超过了人类的围棋水平。于是人们纷纷推测:围棋是人类最难的智力活动之一,现在被人工智能一举超越,那么,人工智能普遍超越人类智能岂不是为期不远了?由此引发两种极端看法,一种认为人工智能即将大功告成,一种认为人类社会即将大祸临头。然而,这些推测是不成立的,因为它们隐含的一个前提假设是根本错误的。这个前提假设是:对人类困难的事情,对人工智能也困难;对人类容易的事情,对人工智能也容易。

   为什么这个假设不成立?因为人工智能“思维”和人类思维是根本不同的。那么,什么是人工智能思维?当前人工智能发展水平到底如何?人工智能现有技术能解决哪些问题,不能解决哪些问题?当前人工智能面临的根本挑战是什么?人工智能的真正目标应该是什么?未来人工智能思维应如何演化?本文尽量采用通俗的语言,尝试对以上问题进行梳理和回答,以期促进对人工智能更加真实、更加深入、更加全面的把握和理解。

  

一、人工智能的进展和挑战


   在中国,“阿尔法狗”的获胜出乎绝大多数人的预料。在西方国家,大多数人知道的最复杂的棋类博弈是国际象棋,而在1997年“深蓝”就战胜了国际象棋十年棋王卡斯帕罗夫,所以西方大众对人工智能的“感觉”比中国大众早20年。那么,20年来人工智能有什么重大进步?“阿尔法狗”与“深蓝”有什么根本不同?这些不同会不会带来翻天覆地的变化?

   2001年,“深蓝”项目负责人许峰雄博士到我的实验室访问,我问他:“‘深蓝’的技术能不能下围棋?”他说“不能”。后来我去他实验室访问时又问他,他还是说“不能”。为什么不能呢?因为围棋比国际象棋复杂太多了。在人工智能中,通常用两个指标估计博弈问题的复杂度:一是状态空间复杂度,用来衡量棋子在棋盘上有多少种不同的合法摆法;二是搜索树复杂度,用来衡量一种棋类博弈可能下出多少盘不同的棋。国际象棋的博弈数复杂度大约是10123(10的123次方),围棋大约是10300。10300可以从围棋的博弈树推算出来,博弈树的第一层(顶层)代表黑棋走的第一步,理论上共有361种走法,对应于博弈树上的361条树枝;第二层对应于白棋的第一步,有360条树枝;以此类推,一直到棋局结束。这棵树的底层结点代表围棋总共有多少种不同的棋局,总数大约是10300。

   当一个问题的复杂度为指数量级时,比如10123或10300,在计算机科学中称为“指数爆炸”。10300有多恐怖?让我们对比两个数据:一是地球上的海水,一共有大约13.86亿立方千米,折算为大约7 × 1034滴水;二是一瓶500毫升的矿泉水,大约有2.5 × 104滴水。一瓶矿泉水和地球上的所有海水,在直观上是不可比的;但是以水滴为单位,折算到10的幂指数,只不过是4次方和34次方之比,可见“指数爆炸”是极其恐怖的。过去的人工智能技术法无法突破大规模(比如10300)指数爆炸,而“阿尔法狗”却在围棋问题中首次取得了突破,这是一个了不起的进展。

   大规模行业应用是任何一个研究领域获得真正成功的标志。今天走进任何一家汽车制造厂,都会看到技术原理相同的自动化生产线在承担着制造工作,而不采用自动化生产线的车企几乎消失殆尽。因此,没有人会否认自动化和工业机器人技术的成功。那么,“阿尔法狗”代表的人工智能技术进步会不会带来类似的大规模产业化应用?

   本文分析表明,在确定性问题领域,人工智能的大规模应用是完全可能的;而在不确定性问题领域,人工智能仍然面临深层挑战。为了阐明这个判断,有必要考察人工智能涉及的三层空间:现实层、数据层和知识层(见图1)。

   底层是现实层,就是人类的现实世界,是非常复杂、含糊和具像的。中间层是数据层,其中的数据是通过各种数据采集手段,包括人工采集和机器感知(如摄像机)而从现实层获得的。数据是抽象的、格式化的。经过数据采集过程,一部分信息被收集起来,同时现实中无限多信息被丢弃了,这个事实非常重要,但往往被忽视。在现实层和数据层上,经过人工建模,或者通过机器学习,可以得到知识。知识是结构化的、包含语义的。在知识层上,人工智能研究内容包括自然语言处理、推理、规划、决策等等。

   智能机器人自主地感知现实世界,获得数据,从中抽取知识,并利用知识进行理解、推理、规划、决策等,产生机器人行动,并在现实层中加以执行。智能机器人的运行形成一个完整的闭环——从现实层到现实层,所以现实层包含的不确定性会对机器人产生不可忽视的影响。其他种类的大型人工智能系统是从数据产生决策,提交给用户使用,所以不形成完整的闭环。即使如此,现实层中的不确定性仍然会渗透到这些人工智能系统中。

   一个真正实用化的人工智能系统需要满足两方面要求:第一,能够正确处理它的预期输入;第二,能够正确处理它的非预期输入。目前,这两方面要求对人工智能系统的建造都具有挑战性,而第二方面的要求更难一些,一个人工智能系统面对非预期输入,往往产生错误结果,甚至崩溃(见图2)。例如,对一个皮肤病诊断人工智能系统而言,预期输入是皮肤病案例,非预期输入是非皮肤病的案例。现有皮肤病诊断人工智能系统的内部模型只包含皮肤病的知识,如果这个模型足够好,那么输入任何皮肤病案例,它都能够提供正确的诊断;但是,如果输入不属于皮肤病的信息让系统进行诊断,这就超出了模型覆盖范围,这时人工智能系统就会产生错误的结果。有人曾做过一个测试,将一辆生锈旧卡车的信息输入一个基于规则的皮肤病诊断系统,得到的诊断结果是:得了麻疹。①这种现象在基于规则的人工智能系统中普遍存在。

   以深度学习为代表的人工智能新进展是否已经克服了这个困难?最近,美国麻省理工学院的研究人员做了一个“定向对抗攻击”(targeted adversarial attack)试验。②试验攻击的对象是一个著名的商业机器学习系统,该系统训练得到的人工神经网络可以从照片中识别各种对象,并达到很高的正确识别率。实验人员人为修改了原来照片上的少量像素,使得对人眼没有影响。实验结果表明,同一个人工神经网络完全不能正确识别修改后的照片。

   有人认为,对抗攻击是人为造成的,所以只有理论上的影响。这个看法是严重错误的。一旦进入现实层,作为不确定性的表现之一,感知噪声是无处不在的;也就是说,天然的对抗攻击在现实中是不可避免的。这就表明,人工智能在现实层仍然面临极大的挑战,而最大挑战来源于不确定性。因此,本文从知识、数据和现实三个层面考察人工智能的基本问题,并重点讨论不确定性对人工智能的挑战。

  

二、第一种人工智能经典思维:基于模型的暴力法


   人工智能研究有几千种不同的技术路线,其中大部分技术路线可归结为两种人工智能经典思维,每一种思维之下的人工智能技术路线都遵循相同的基本原理,也共享相同的局限性。这两种人工智能思维在很大程度上代表了人工智能的主流发展。

   第一种人工智能经典思维是“基于模型的暴力法”。这种思维主要是针对知识层的,依赖于精确性和人工编程。人工智能中的暴力法肇始于人工智能初创期,继承了发源于古希腊的传统数学思维,这种思维在科学史上有诸多代表性学者和成就,如亚里士多德(公理化逻辑)、莱布尼兹和牛顿(数学分析)、伯努利(概率论)和司马贺(Herbert A. Simon)(有限理性决策论)等。

   传统数学思维假设有一个解析模型,同时考虑到有些问题的解只能是近似的,这时就用数学近似方法处理。例如,假设一个解析模型在数学里表达成一个公式,这个公式很长,甚至有无穷多项,为了近似,根据模型知识把它改写成一个等价的新公式,使得新公式中前面的几项是容易计算和容易获得数据的,后面的项都舍弃了。因为有精确模型,能算出所有省略项的累积误差,并设法保持为一个足够小的值。这种经典数学思维的根本特性是:假设精确性模型是完全的——不仅提供完全的理论知识,而且提供完全的误差知识,即理论与现实之间的全部偏差的完整知识。

   暴力法的基本原理是:第一,根据问题的精确模型,建立一个搜索空间;第二,压缩搜索空间;第三,在压缩空间中枚举所有选项,找出问题的一个解。“暴力”表现为在压缩空间里把所有可能解都算一遍,找出其中一个“最好的”。暴力法的基本前提是:待解问题存在一个良定义的精确模型,且该模型默认为某种符号模型,以逻辑形式化、概率形式化和决策论形式化为主导模型。

   暴力法的代表性工作往往提到下面几个。1956年,纽厄尔(Allen Newell)、肖(John Shaw)和司马贺发明了一个称为“逻辑机器”的人工智能系统,并对它做了一系列实验测试。在其中一个测试中,逻辑机器自动证明了罗素、怀特海所著《数学原理》中命题演算部分的37条定理,引起轰动。此后,各种通用“推理机”如可满足性(SAT)问题求解器和回答集编程(ASP)求解器不断地研发出来,并不断地换代升级,以它们作为通用问题求解的基础工具(而数学定理证明并非人工智能的一个基本目标),用来解决各种问题,如同杨立昆(Yann LeCun)评论的那样,“人脑就是推理引擎”。③

   另一个代表性工作是知识工程,这是20世纪七八十年代人工智能“第二个春天”的主导方向。这个阶段的工作重点是,在第一阶段研究出来的通用问题求解机制之上,增加表达专家知识的符号模型(又称知识库),试图通过二者结合解决大规模实际问题。这个阶段研制出多个性能出众的专家系统,如医学诊断专家系统“霉素”(MYCIN)可帮助医生对住院的血液病感染患者进行诊断,化学分析专家系统“丹卓”(DANDRAL)可根据质谱仪数据推测分子结构。直到90年代初,世界各地的一些化学家还去美国使用“丹卓”,而且要排队等半年,所以那个时候是非常成功的,某种意义上可能比现在的深度学习更加成功。

1997年,“深蓝”战胜了国际象棋棋王卡斯帕罗夫,这是一个里程碑式的贡献,也是暴力法的一个高峰。“深蓝”的技术手段是往前看至少14步棋,然后用专家知识评估这些棋局的优劣,从中选取一个对己方最有利的,就往那个方向走。但是,国际象棋每一步棋平均有35种走法,(点击此处阅读下一页)

本文责编:陈冬冬
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/113425.html
文章来源:《开放时代》2018年第6期
收藏