返回上一页 文章阅读 登录

吴小安 张瑜:人工智能与因果语言

更新时间:2021-10-28 09:44:02
作者: 吴小安 (进入专栏)   张瑜  

   摘要:对因果的理解是人类认知最普遍也是最不可或缺的一环。如何让蠢笨的机器人理解因果、进行有效的因果交流是实现智能的关键一步。图灵奖得主 Judea Pearl 给出了因果“推断引擎”的蓝图,而这个蓝图最关键也是最初始的设想就是因果语言的构建。首先,本文将阐述因果语言的源起;其次,通过与物理语言和概率语言的比较,来说明因果语言的特点;再次,通过与随机对照实验相比较说明因果语言作用为何;最后,说明引入因果语言的意义及其应用价值。

  

   关键词:图灵测试;推断引擎;随机对照实验;结构因果模型

  

   一、“迷你”图灵测试

  

   人工智能的先驱之一艾伦 图灵曾提出这样一个问题[1]:怎么才能说一个计算机像人一样在思考?他给出了一个称为“模仿游戏”的测试方法(后来人们称之为“图灵测试”)。即向一个计算机提问,如果它对于问题的回答让我们不能区别,和我们交谈的是计算机还是人,那么这一台机器就可以算是一个思维机器。当然要模仿一个成人的智能是困难的,随着教育和阅历,她的智能水平也一直在发展和推进。很自然的想法,不妨从模仿孩子的智能开始(“迷你”图灵测试),再循序渐进,最终实现成人的智能。

  

   在 Pearl and Mackenzie[2] 看来,对因果的理解是人类认知最普遍也是最不可或缺的一环。只有所造的机器人要理解因果,才能把我们对于这个世界所知教给它们。 具体而言,在制造出一个理解因果的机器人之前,至少有两个疑难要面对,只有解决了它们,一个思维机器才是可实现的。首先,人们是如何从环境中获取因果知识的?其次,人们是如何处理因果信息的?第一个问题并不是Pearl关心的,他的主要贡献和努力在于回答第二个问题,即给出如何表征因果知识的方式,即因果贝叶斯网络,并说明这种表征方式如何使得我们能够快速地访问必要的信息,正确地回答因果的问题。

  

   所以姑且把如何获取因果知识的困难放在一边,姑且认为已经预存了如下的因果知识和模板(Pearl认为孩子的大脑并不像有些人所理解的那样是白板一块,而是已经有了丰富的机制和预存的模板)。图(1)表示了我们对于世界的因果认知和表征,季节的变化( 取值 ,分别对应春夏秋冬)会影响洒水器的开关( 取值1和0对应洒水车的开关),也决定雨水的丰沛与否( 取值1和0,对应雨水多与少),而不管是开洒水器还是雨水都会使得路面潮湿( 取值1和0,对应路面潮湿与否),从而使得路面变滑( 取值1和0,对应路面滑与否)。

  

  

   图1:表示五个变元之间依赖关系的因果图

  

   让我们从Pearl所谓“迷你”的图灵测试开始,一个“理想的”思维机器应该能圆满地回答如下问题:

  

   问题1:如果此时正值秋季非常干燥的北京,但是有一处路面却很滑,这说明了天下雨了吗?

  

   回答:并不太可能,更可能是洒水器被打开了,还有一种很小的可能性,路滑并不是因为路湿。而是因为其他原因。

  

  

   问题2:如果我看到洒水车是关着的,那能说明天下雨了吗?

  

   回答:那就很有可能了。

  

  

   问题3:你的意思是如果在现实中我打开了洒水器,那么下雨就更不可能了吗?

  

   回答:并不是这样的,你打开洒水器与否都不会影响是否下雨。

  

  

   问题4:如果你看到洒水车是开着的且路面是湿的,那么设使洒水车关了,路面还会是湿的吗?

  

   回答:路面将会是干的,因为当前是一个干燥的季节,下雨的几率很小。

  

   上述因果图,以及以之为基础对于上述问题的回答,为真正智能的实现提供了思路。 我们栖居在这个世界之中,在“烦”与“畏”中与之砥砺,慢慢地,对于这个世界如何周转运行,对于事物如何发展的内在理路和模式就有所掌握,对于上述问题的回答实质上就是以上述预存模式为基础,以新情况为根据对模式做必要之修正而得出的。但是如何让蠢笨的机器人能像人一样思考,回答起因果问题从容不迫,在因果交谈中游刃有余,在 Judea Pearl 看来就必须给它们装备 因果推断引擎(Pearl 在 Pearl [3]57,Pearl and Mackenzie[2]12,以及Pearl[4]160 中具体阐述了“推断引擎”) ,装备了这个引擎的机器人,才能获取存储因果知识,并以之为基础做因果推断,进行有效因果交流,这个引擎中最关键的一环以及所有工作的初始就是:因果语言。

  

   本文的大体框架如下。 首先,阐述因果语言的社会科学源起(第2节); 其次,通过与概率语言、物理语言的比较来说明因果语言的特点和特殊性(第3节);再次,通过与随机对照实验方法的参照来说明因果语言所力图实现之鹄的(第4节);最后,将说明因果语言的理论意义和价值(第5节)。

  

   二、因果语言的源起

  

   从一个颇具思维革命意味的、“测量金字塔”的例子来说明因果语言的意义和必要性是有帮助的。 当别人问你“金字塔有多高?”,假定你没有其他途径能查到金字塔的高度,我相信你不会想着造一个金字塔高的巨大尺子来垂直度量它,因为这样实在辱没了我们的教育,任何一个受过小学教育的人都知道欧几里德几何,都知道五条公设,并因而都证明过“相似三角形的对应边成比例”,如果你知道这个结论,那么测量金字塔的高度就不会那么耗时费力了。

  

  

   你只要找到一个杆子,测量出杆子的影长( )、杆子高( )和金字塔的影长( ),再根据“相似三角形的对应边成比例”这个定理,就可以很轻易地计算出想要的结果。你会疑惑,这样一个人类在数千年前就知道的方法有什么值得大书特书的呢?这种方法的意义在于它昭示了人类思维的巨大胜利,只要倚赖创造的数学,就可以超越一些之前无法跨越的局限,只要在纸上计算一下,就可以得到在之前需要耗时费力才会得到的结果。

  

   而今我们同样也面临这一类异常困难的问题:“吸烟是否导致肺癌”,或者“宏观政策的实施是否会导致通货膨胀”?对于这类问题的一个标准解决:良好设计的随机对照实验(randomized controlled trials)。在一个恰当的随机化对照实验中,除了一个因素(比如这里的吸烟变量或者政策变量),那些影响结果变量的其他因素,要么被固定,要么随机地变化,于是结果变量的改变必然是因为那唯一因素所致,以此求出我们想要的因果关系。

  

   但是这个方法并不是包治百病的良方。首先,在很多时候,随机对照实验是不可能实现的(法律上、实践上、道德上、医学上,甚至经济上不可能)。比如下面这个实验在伦理上就不可行:随机抽样拨人,随机指派为两组,一组拼命吸烟,一组完全不吸烟,然后观察个几十年,看最后哪一组患肺癌的概率更大一些;或者如果想要知道增加税收对于国家经济的影响,也不可能拿一个国家来作为实验对象,通过加税或者减税来观察对于国家经济状况的影响,代价太大,风险太高,也有太多的不确定。著名的1944年的明尼苏达饥饿实验(Minnesota Starvation Experiment)在今天的伦理标准之下是断然不能进行的。其次,在执行随机对照实验的过程中,现实的复杂也远超我们的想象。比如研究观看暴力电视节目和学校霸凌之间的关系,很难有效地控制一个孩子看多少的电视节目,也近乎不可能知道是否有效地控制了看电视的时间。

  

   所以,很自然的问题,我们是否有其他的方法或者程序,可以从 可观测性研究(observational studies)中推导出想求的因果关系?在这种研究中,研究者只是记录数据,并不对研究本身进行任何干预或者控制,即只有数据集 P(X,Y,W,…)。上述的讨论可以总结如下:

  

  

  

  

   表1:金字塔高度度量的启示。

  

   从上表(1)中的比较知道,对金字塔高度的度量我们有两个问题是需要解决的:

  

   1.     需要一个相应的语言来表达需要表达的问题,在金子塔的例子中,把金字塔高度用抽象的符号 来表示;

  

   2.          还需要一个数学理论,能够以在手的数据求出因果关系,正如在金子塔的例子中,通过欧式几何,把金字塔高度的问题还原为通过一些相对容易可得的量( )而计算出来。

  

   与之对照的两个问题在 Pearl[5] 中都给出了回答。他给出了因果语言来表征相关的因果问题,发展出结构因果模型来表征具体的情境,并通过干预概念把因果模型和刻画因果的反事实联系在一起(对于因果的反事实理论介绍与讨论,可以参看:裘江杰[6]; 何朝安[7]),进而讨论诸多因果概念。

  

   三、物理语言和概率语言

  

当然,因果从来不乏讨论。我们熟知的“穆勒五法”就是前现代因果研究的主导方法论。 韦伯在《新教伦理和资本主义精神》中对新教伦理和资本主义精神之间因果关系的探讨(为什么资本主义在欧洲发生了,而没有发生在世界的其他地方?),所使用的方法就是穆勒归纳法中的“差异法”,这种探讨更多地依赖于作者本人的勤学苦读、广泛涉猎,形成的对于问题本身的直觉,然后再论证这种直觉的合理性。(点击此处阅读下一页)


爱思想关键词小程序
本文责编:陈冬冬
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/129298.html
收藏