返回上一页 文章阅读 登录

周剑铭 柳渝:智能哲学:AlphaGo Zero与围棋文化

更新时间:2017-11-07 11:39:45
作者: 周剑铭   柳渝  
)正是由于AlphaGo Zero具有这种“先天”的学习能力它才能一开始就可以自己学习自己。

  

   DeepMind在AlphaGo Zero建造中使用了包括AlphaGo在内的很多精练的算法。因此实际情况是非常复杂的,AlphaGo Zero开始工作时并不是一台“裸机”,也不是只有操作系统的“纯净机”,而是一台“智能机”。这里不仅有传统图灵计算的算法,也有人工神经网络“代理”计算能力,即有机器本身的操作系统,也有功能计算能力和解决具体问题的功能算法或智能代理能力,这些高能力算法不是AlphaGo Zero自己学习得到的,而是人类赋予的“先天”性的人工智能,这也是AlphaGo Zero一开始就能向自己学习的原因。

  

   二、围棋盘棋上的棋理

  

   今年的法国科学节上,儒勒·凡尔纳公立综合大学(Université de Picardie Jules Verne)第一次以科学介绍方式向公众展示中国围棋和包含其中的文化因素(http://blog.sciencenet.cn/home.php?mod=space&uid=2322490&do=blog&id=1083368),在向完全不懂围棋为何物的观众简单地演示如何学下棋时,采用了两种现场教学方法。第一种是先介绍最基本的下棋规则,然后让学习者下子,这时参与者每下一子要费周折,第一粒棋子放在什么地方是很大的困惑;第二种方法是先让观众任意下子,然后在教学者的陪练中亦步亦趋地学习可行的落子方法。很明显,后者不但使事前完全不懂围棋的观众能够马上下棋,而基本上知道了什么是围棋,领会他任意落下的棋子都充满了奥秘,对围棋产生了兴趣。这个情况引发了我们进一步的思考,围棋的规则虽然简单,但与棋盘上的直接经验相比,对新手的认知、学习具有很大的区别。围棋的规则是围棋作为游戏的设计性思想的体现,而棋盘上的直接落子则是在现成的游戏世界中的经验行为,前者是人类知识的体现,而后者是作为游戏角色的经验,对于一个新手来说,后者是在棋盘上的经验中的学习。为此,我们研究作为围棋棋盘的特殊性。

  

   围棋是在平面直交空间上的占领游戏,这对不懂围棋的人特别是西方人有一种困惑:是不是只要将棋盘上放满棋子了就可以决定胜负了?这样几乎等于没有规则,这也就没有游戏的意义了。与一般游戏规则不同,下围棋不仅是按游戏规则的“以棋行事”,而且是对弈过程中对棋盘与棋子所形成的“局面”不断地认知更新与决策,围棋的“局面”就建立在棋盘的平面直交网格的几何特殊性上。

  

   围棋的棋盘是一种简单的平面直交网格,是平面几何空间上最基本的形式结构,围棋就是在这种最简单的直交网格上占领对弈。平面直交网格实际就是欧氏几何平面上的坐标系,在这种平面直交网格上的游戏的形成或设计实质就是对欧氏平面的基本性质甚至是潜在性质的利用和开发,中国围棋内涵的丰富性正是基于这种几何性质的深刻性。首先,在围棋中,棋盘上的直交网格的每一位置被赋予非几何的意义:空或占有、死或活、0或1,实现了几何性和数学性的人为超越结合,这是围棋棋理研究的理论基础。

  

   以数学眼光对围棋进行过精深研究的英国数学家 John Horton Conway 发明的“生命游戏”(Game of Life)或称“元胞自动机”(Cellular Automaton)就是在直交网络上进行的一种位置格局迭代过程,每一格局的迭代由一个选定位置与其邻接位置的相互控制关系决定。这种迭代过程是算法能行的(可以程序化),但这种迭代产生的平面复杂格局可以表现为一种有规则的图形,这种事前无法预见的复杂现象就像生命现象的涌现和演化一样引人注意(注意这里有一种错觉,屏幕上生命游戏中的图案仍是由机器以算法形式产生的)。但由于平面上的位置组合是指数增长的,现有设计的可以实现的生命游戏的算法程序都无法穷尽,这种情况造成一种误解,只要有无限的空间和时间,生命游戏就可能演化出任意复杂事物,但实际上并没有进行这样的大规模研究的意义。生命游戏就是平面直交网格的几何性质表现为图案形式的算法的一个范例,但作为电子“游戏”,只能说是一种知识性的娱乐。

  

   与“生命游戏”的图案迭代变化不同,围棋不是棋子与盘面之间的简单占领关系,围棋对网格位置的占有是对抗性的,即在直交网格上已经人为的赋予基本结构性意义的情况下,再以黑、白落子表示对抗性地占有,因此围棋的盘面是双方对抗性布子所形成的“局面”,就是说,围棋的“局面”形成既不是由程序(递归)决定的,没有如生命游戏事前的变量设定产生的算法制约性,而是不断的认知更新和决策的对抗游戏,任何“局面”不只是棋盘上的棋子与棋盘网格的占有关系,更是双方对潜在盘面的认知、信念和决策。因此弈棋不是上一局面的算法的连续迭代,而是双方棋手独自看局的直觉判断和策略的博弈,同一个盘面各人所看的局面并不相同,在双方的视野中可以有具有很不同的意义,因此围棋能体现个人的智力直觉,围棋规则简单但“易学难精”,就是对人的直觉的自然性与自觉性的超越要求。对同一个盘面双方对抗性地具有不同的理解和控制的智力竞技才是围棋表现为一种高级游戏的原因。相比于象棋等各自组织攻防战术的游戏,围棋具有更强的不完全格局和盘面全局性关系直觉与理解能力的要求。

  

   人类围棋的高手是经历了自己的长期实战和对历史棋谱的无数揣摩而形成的,每一盘棋从落子“开局”起是在弈棋过程中个人与历史经验的综合后的再实践。而AlphaGo Zero之所以能够从白板开始(实质是“随机”开始,区别于“监督学习”喂入人类棋谱)学习,是因为它已经具有的人工赋予的人工智能的先天性。

  

   AlphaGo Zero真正的区别性应在两方面考虑,1。区别于人,人类心灵的“白板”是指人类和知识来源于经验,人类棋手是有了围棋的规则和历史经验的知识,不同经验者之间的对抗性竞争。2。区别于AlphaGo的“监督学习”,AlphaGo Zero是在包括AlphaGo研究、设计、建造和实用所有经验基础上的围棋游戏的算法重建。

  

   AlphaGo Zero的随机性“白板”开始实际是受其内置的人工性智能和盘面上直交网格的几何——数学性质两方面约束的。AlphaGo Zero本身就是“智能机”,能够在棋盘这种有限世界中重建一种机器对机器的对抗性。AlphaGo Zero真正的进步是作为人工智能的“机器学习”的“强化学习”(reinforcement learning)的一次成功实现。

  

   我们可以看到,AlphaGo Zero并没有创造一种不同于现有围棋的新规则的围棋,只是在不断的自我对弈中重建了已有的围棋系统。AlphaGo Zero凭借并其巨大的机器时、空能力,以超过人的生物时空能力而取得对人的全胜,以对以往AlphaGo版本研究经验的综合和提高取得对以前的AlphaGo的全胜。

  

   三、围棋的职业化与技术化

  

   围棋在中国诞生,大约七世纪在日本流行,围棋的中国文化性与日本文化之间的混合具有很特殊的文化研究价值。

  

   据有关记载,奈良时代(公元710—794)围棋开始在日本宫廷盛行,并有出入于宫中的职业棋师。镰仓时代(1185—1333),围棋在习惯于战场生活的武士中传播开来,几大封建领主(大名)织田信长、丰臣秀吉、德川家康都具有相当的棋力,民间出现围棋大家,如先后侍奉于织田信长、丰臣秀吉和德川家康的僧人日海(1558—1623),被誉为围棋“名人”、“棋所”,享有优厚俸禄,得到“官命”,并总理围棋事务,指导将军弈棋,垄断围棋等级证书的颁发等权力。1644年幕府建立了“御城棋”制度,参加“御城棋”被看作与武士们在将军面前比武同等高尚,这样,围棋对弈植入了武士道精神。日本武士道崇尚正直、信义、忠诚、礼节、廉耻、简朴、坚毅、胆识、诚实等种种美德,武士道精神以个人荣誉立命,一但丧失个人荣誉,武士不得不进行切腹自杀以保全最终武士荣誉。因此,职业化的围棋赛事程式、规则、棋手段位、个人棋风等等都与荣誉相关,正式赛事中战败者被迫降低交手棋分,这种在赛事中的降格被视为棋手的奇耻大辱,因此棋枰上的血腥之气迎面扑来,正式棋赛中的棋手几乎是押上自己一生名誉和身家性命作孤注一掷,甚有在对局中口吐鲜血或当场死亡的事例。

  

   围棋的职业化使围棋成为一种正式的社会活动,吸引了广泛的社会参与。以当时的“棋所”四家(本因坊、安井家、井上家、林家)为核心,民间和名门望族的六段棋手均可参加棋赛,日本在职业化的道路上进一步成为日本社会生活的一部份,一直影响到以后围棋在日本社会生活中的地位。

  

   进入现代以后的日本围棋文化受到商业和新闻业的强力支持,大体以棋院形式组织起了所有的围棋活动,围棋文化进一步普及化,全国和国际赛事成为了重要的社会性事件。围棋的职业化使棋赛的胜负之争成为主要目的,日本围棋的某些规则也与中国围棋不同,段位等级的激烈棋赛和社会强烈关注使围棋的职业化更加突出,也就使正式的围棋活动成为了竞争技术和职业化的高级技术训练。

  

   围棋界的高手都不同程度地强调下棋的心态、境界,这主要是为了得到对棋盘局面的深度理解,由于围棋局面的形成是平面几何空间中的直交网格结构的深度重组,落子意味着对棋局发展趋势的决策,是历史经验与当前态势的偶合,因此棋手必须专心致志,使经验与个人气质结合而形成个人的棋风,棋赛中要排除一切杂念,凝集精力于直觉(棋感),使个人形成特殊的风格在当前不确定性的棋局上产生偶合,以期得到“妙手”、“鬼手”、“神之一手”,使一子之后产生一个全新的局面。所以这种基于战杀的心态培养和训练仍然是一种心理性的技术性的准备。

  

   围棋的职业化使棋手把下棋作为社会生存的方式或手段,从而在本质上使围棋与个人的一般生活区分开来,成为某种个人的社会生存方式,同时,围棋职业化、专业化也就使职业化围棋必然走向技术化的道路。正是这种围棋的职业化和技术化使AlphaGo成为了今天人工智能研究项目中最大的成功,这也就是AlphaGo和AlphaGo Zero完胜人类的必然性前提。

  

   四、围棋的棋艺与棋道

  

围棋在中国文化中大体是文人雅士的修性、娱情的文化活动,中国的古棋优雅、自由、超越,弈棋轻松、理性互动、无言而喻,故称“手谈”、“坐隐”。 “坐隐不知岩月乐,手谈胜与俗人言” (黄庭坚,弈棋二首呈任公渐),虽然偶尔以兵喻棋(“略技”),但非以棋为兵,更没有争命的意义,相反,常以棋局喻世态而求超然,(点击此处阅读下一页)

本文责编:川先生
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/106762.html
文章来源:爱思想首发,转载请注明出处(http://www.aisixiang.com)。
收藏