返回上一页 文章阅读 登录

周剑铭 柳渝:机器与“学习”——寻找人工智能的幽灵

更新时间:2016-04-06 15:30:46
作者: 周剑铭   柳渝  

  

   摘要:“机器学习”是不同于“算法”的Agent,这与NP与P的相对性相同。人工神经网络(ANN)的“异或”逻辑是由多层大规模阵列的门电路构成的真值表系统的机器表达。“机器学习”是对“人的模仿”能力的模仿,对人的“模仿”是机器本质的“学习”;机器可以模仿“学习”、自己学习,但本质是机器,人的最高“模仿”是人对自己的学习。

   1.算法的机器性质

   2.P与NP:Agent

   3.几个术语的内涵和性质

   4.机器、逻辑、模型

   5.作为“学习”的人工智能

  

   1.算法的机器性质

  

   “算法”是一个简单但却是不容易完全理解的概念,从直觉上说,算法最终都是通过“机械步骤”完成的,即以某种规则指导下的一系列机械步骤完成的“计算”,历史上很早就有人开始了模仿人的计算过程制造计算工具或计算机器的尝试,现代人最终脱离了机械形式的限制,创造了电子计算机,但是计算的机械步骤性并没有改变,计算机理论中的0和1 这两个符号和电子计算中的电子脉冲(或存貯状态)就是具有这种“步骤”本质的非机械形式,而制约这些符号或电子脉冲的组织的方法就是被称为“程序”(算法)的那些东西。

  

   1936年,图灵模仿人们用纸笔进行计算的过程提出“图灵机”这样一种符号化的机器模式,在图灵机模式中,计算的对象(数据)和计算的规则分别用纸带和机器内态表达,而当时实际制作的计算机则把程序存贮在纸带上,1945年,冯·诺依曼( John Von Noumann,1903-1957)提出存储程序原理,程序和该程序处理的数据同样存储在机器中,并确定了这种存储程序计算机的五大组成部分(运算器、控制器、存贮器、输入设备和输出设备)和基本工作方式,到目前为止,这都是现在广泛使用的电子计算机的通用模式。

  

   “冯·诺依曼机”(Von Neumann computer)是物理化的计算机模式,又叫“冯·诺依曼机结构” (Von Neumann architecture);与此相关还有二个术语:“普林斯顿结构”(Princeton architecture)和“哈佛结构”(Harvard architecture),实际上,这两者都是“冯·诺依曼机”,但它们具体地指计算机的中央处理器CPU的物理体系架构的分别,这两种物理体系构架不同在于数据与指令是在一个存貯器中或者是分开为两个存貯器,普林斯顿结构将程序指令存储器和数据存储器合并在一个存储器中,并使用同一总线通道,只是程序指令存储地址和数据存储地址在同一个存储器的不同物理位置;哈佛结构则把程序存储器和数据存储器分开,并有不同的进出总线。普林斯顿结构和哈佛结构具有不同的技术优、弱势,普林斯顿结构紧凑,但哈佛结构程序存储器和数据存储器由于采用不同的总线,提供了较大的存储器带宽,减轻了冯?诺伊曼数据瓶颈(von Neumann bottleneck)。但现在通常将冯·诺依曼结构称为普林斯顿结构。

  

   在现代电脑中,CPU中的数据流量与CPU的程序指令工作相比差距非常大,CPU常常在巨大的数据量上只执行一些简单指令,数据流量就成了CPU工作效率的严重的限制,瓶颈问题越来越严重,虽然在CPU性能、编程语言、算法和编程方法上不断得到了改进,但面对今天的更大的数据形势,问题依然存在,并更具有本质性。提出“冯·诺伊曼瓶颈”的约翰·巴科斯在1977年ACM图灵奖得奖致词时就说到:……确实有一个变更储存装置的方法,比借由冯·诺伊曼瓶颈流通大量资料更为先进。瓶颈这词不仅是对于问题本身资料流量的叙述,更重要地,也是使我 们的思考方法局限在‘一次一字符’模式的智能瓶颈。它使我们怯于思考更广泛的概念。……

  

   2.P与NP:Agent

  

   如何处理人类当前面临的巨大数据量,已经成为了对图灵机或冯·诺伊曼机的机器能力以及算法形式的巨大挑战,实质上这是这个“问题”本身的性质问题,就是说,人们用字符表达数据的机器处理方法已经成为了新的问题。在算法基本理论中,这个问题早已被人们觉察到了。

  

   在经典意义上,宇宙只有唯一的时间,实时时间没有并行性,所以可计算意义上的算法具有线性本质性,在这种线性关系中,事物的复杂性以递归、迭代的方式多重相嵌,但最终还是线性的,这实际上是“算法”这个概念所具有的“能行可计算性” 的本质,人们所理解的算法的“机械性”实质就是指这种基本意义上的线性。线性问题的可计算性在数学中是以“递归函数”精确刻画的,在计算机理论中,这种线性性质是以“多项式时间”(Polynomial Time)这个概念表达的,“多项式时间”不仅是指数据与机器的性质各自都是线性的,而且强调的是这二者之间的相对增长的能力是多项式的线性关系,即机算机的线性能力能够胜任数据的线性增长。(注意,求解问题的“确定性”与求解的“精度”是不同性质的问题,前者是由问题或算法的本质决定的,后者则是可以由人控制的。)

  

   图灵机或冯·诺伊曼机是可以确定性地求解确定性问题的计算机,这种计算机以算法(程序)在逻辑电路构成的机器中求解,这种算法求解的方式以下称为“算法计算”。(这个基于“算法”的概念在人工智能领域的用法,比“符号计算”等更能表达相对于“仿生计算”、“人工神经网络计算”、“智能计算”等诸多名称的特征性。)

  

   但是可以算法计算(线性计算)解决的问题只是我们的问题世界中极少的部份,非线性问题是我们所面对的自然和人类社会、包括人类自身是更重要、更直接的部份,一般来说,事物或问题的非线性关系表现为多元性质对象的多重组合的高层次复杂性,这种复杂性被人们直觉到并以特殊的词汇表示出来,计算机理论和人工智能研究中,大量使用的“agent”这个词就具有这种广泛又而特殊的使用意义, 日常语言中的agent的基本意义是“代理”,Agent作为人工智能的基本术语是由明斯基(Marvin Minsky,1927-2016)在1986年提出的(”The Society of Mind”),明斯基认为社会中的某些个体(Agent)具有协商解决复杂问题的能力,这种具有社会交互性和解决复杂问题的能力用到人工智能上,就是人工智能的“智能性”。Agent的术语化就把一种不同于传统算法的智能性的特殊性表达了出来,并得到广泛的使用,在人工智能领域,Agent的意义大体相当于“专家”,但这区别于基于数据库的“专家系统”,而是指不同于“算法计算”的人工神经网络模型(ANN)的人工智能模式。

  

   基本意义上,Agent是具有自主性和交互性的一个实体和实体性过程,虽然曾把一些算法计算环境中的一些具有独立性的过程称为Agent, 如计算机中独立运行在被管理单元上的自主进程SNMP就被称为一个Agent,但真正能体现Agent意义的是实体的环境中的具有自主性和交互性能力的一个实体,如机器人、无人驾驶汽车、无人机等都被称作Agent,这也就是Agent这个术语今天到处可见的原因。

  

   这种基于对机器能力的要求的交互性和独立性,是人工智能机器的所面对问题的性质决定的,所以在Agent的核心意义上,是指人工智能的“智能性”,这样才能本质地区别一种与“算法计算”不同的计算形式,并理清与此相混乱的一些概念,比如,在算法计算机中建模的Agent与电脑中的“虚拟机”(Virtual Machine)都是“算法计算”,“虚拟现实”(Virtual Reality)的虚拟实体却不具有Agent的本质,而一个ANN无论是算法建模的或是实体的,都是Agent。

  

   从纯理论的意义上说,非线性的“复杂性”问题的求解实际是由另一个与Agent本质相关的术语Matrix所表达的。Agent这个概念具有中间层次的转换者的特别意义, 而multi-agent就是指多种、多次的或重复的出现的一种更高层次的整体性的意义,这种意义的上的变换或计算就是matrix。 matrix的基本意义是母体、基体、间质等,它的特殊意义是多重静态或动态的复合组织和变换过程,数学中矩阵就是一个纯粹的例子,数学矩阵可以是任意维数组的几何化组合,“矩阵代数”就是这种线性几何数组发生变换的严格非线性关系,所以也可以称为“计算”,但很明显,这种“计算”具有完全不同于“算法计算”的性质,相对之下Agent形式的“机器代理(Agent)”和“代理变换(Marix)”则强调复杂组合的选择性和最优性。这种多重组合的整体性和变换关系不是线性形式能表现的,用术语说就是这种问题的增长性质是“指数型”的。这种相对于“多项式型”的或“线性”的“非线性问题”是因问题的整体性质或内在性的不确定性所决定的, 称为“不确定性问题”(Nondeterministic Problem,NP),NP的本质决定了不可能期望得到一个确定的解答,实质上不存在确定性意义上的表达函数,比如所谓的“拟合函数(fitting function)”就只是一种近似,对NP只能有最优的近似的解决,我们称为NP-algorithm(NP-算法),定义是:the optimal algorithm to get the best fit approximation value of NP(对不确定性问题的最优近似求解算法)[2]。

  

   3.几个术语的内涵和性质

  

   为了以下叙述的方便,在尽可能继承的基础上,精细地区别使用一些术语。

  

   “图灵计算”(Turing Algorithmic Compute)与“算法计算”(Algorithmic Compute)同义,也就是算法理论中的“多项式时间”(Polynomial Time)的意义,与数学理论中“递归函数论”本质一致,“能行可计算性”概念和“丘奇-图灵论题”表达了这个本质性;

  

Agent 或“机器代理”,也就是“机器智能”,是“人工智能”这个术语的核心意义。“机器智能”典型就是ANN(Artificial Neural Net)的“人工神经网络模型”。(点击此处阅读下一页)

本文责编:zhenyu
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/98475.html
文章来源:作者授权爱思想发布,转载请注明出处(http://www.aisixiang.com)。
收藏