AlphaGO 棋 与 路
闻听如今历史上首个获得公民身份的沙特籍机器人——索菲亚即将来到第七届“碧桂园杯”象棋赛,第一个反应并不是正在全世界闹得沸沸扬扬的沙特记着生不见人,死不见尸事件,而是前两年就热得发烫人的工智能棋类程序——阿尔法狗。
一,阿尔法狗和棋
2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2017年初,该程序在中国棋类网站上以“大师”(Master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平。2017年12 月7日,阿尔法狗的升级版——阿尔法零,通过自我对弈强化学习,约2小时击败日本将棋顶级人工智能程序,4小时击败国际象棋顶级人工智能程序,8小时击败战胜韩国棋手李世石的“阿尔法-狗”。
此次索菲亚之行据说还对象棋提出了质疑:“下象棋只是运算推演的过程。AlphaGO打败人类,足以说明人类没必要再继续学习、研究棋路。” 虽然我们清楚这只不过人类自身的疑问,只不过借以索菲亚之口的炒作,意在引起更多人的关注,但是,我们不得不承认索菲亚之言不无道理。
早在1997 年 5 月 11 日,超级计算机“深蓝” 战胜国际象棋世界冠军的时候,就已经震惊世界,惊呼“人类尊严不再”。当时,围棋界还在窃喜,认为计算机下围棋想战胜人类还需要100年以上,短短的二十年,人工智能让人们刮目相看。这不,索菲亚言语里已经有啦嘲笑的味道!
嘲笑也不得不听,现实就在我们面前。中国象棋虽然没有与阿尔法狗沾过边,但是早在2006年国内的象棋程序“天梭”的水平早已在所有顶级大师之上,自从那以后,棋软与大师们很少在接触,因为已经再无悬念。
问题在究竟哪里?如今我们要在我们制造的机器面前感到脸红?有难么多人在惊呼“人类智慧的最后堡垒被攻破”、“象棋发展的根基遭到撼动”、…….,这到底是什么原因?
也有一部分人认为,人和人工智能下棋,就像人与汽车赛跑人输了是再自然不过的事情,没是什么大惊小怪、没什么可惊呼慨叹的。这种认识表面上不无有道理,过去本人也经常用这个比喻,但是细想起来并非如此。
其一,人与汽车赛跑,汽车是人控制的,即便自动驾驶也是人设计的程序支配,还是相当于与人赛跑,只是双方并不在一个平台,显失公平而已。其二,这是很重要的以方面,人们容易忽视,造成认识的偏差。这就是,汽车跑需要的必要条件——路。没有合适的路,汽车寸步难行,这是不公平的另一个重要方面。
二,路
路,“世界上本没有路,走的人多了便成了路”!可见,路不是自然的,我们人类所处的环境本来没有路,是我们人类的创造。也就是说,路的形成过程早已经体现出人类的智慧。你看我们为了让汽车跑起来,逢山钻洞,遇水架桥,路要比汽车宽,比汽车长,还有尽量平整不刮底盘····,大量的辛劳。修好了路,在想方设法给它加上强劲动力,然后我们和汽车玩赛跑,我们一败涂地后,又震惊、又慨叹、还悲哀·····,一切的不高兴都来了。我们不是自虐是在干什么吗?汽车赢了我们吗?不是,它的一切都是我们给的,是我们战胜了自然。其实保持它的动力(虽然也是人给的),只要一起“回到自然”的环境中,汽车不一定比过人的腿。在自然环境下,我们随便找个沟坎,汽车就完蛋。因为,它虽然有动力,但是,如果没有合适的路,寸步难行。
恰巧,围棋19路,象棋9路。和汽车同样的“路”,本身在原始意义上应该没有多少区别,现实中也是如此,二者都是我们人类已经修好的路。一块棋盘加上行走的规则,就形成了完整的路线,计算机就好比有强劲动力的汽车,人和计算机下棋,就像在修好的路上与汽车赛跑,就是自虐。
我们能不自虐吗?当然能!上面所说的“回到自然”玩比赛就是一个方法。汽车战胜我们原因之一是以为我们修好了路,给它解决掉了前进路上的所有危险,战胜它要回归自然。那么,下棋如何可以回归自然而使我们不自虐呢?
象棋等一般棋类都属于“完全信息博弈”,对弈中的所有信息都可知的,什么地方可以走、什么地方不可以走都是可以看得出的,实质上就是早已经修好的路。现在还有人探讨“为什么棋谱不给版权”?不给的原因就在于:“棋谱的走法是固有的,是发现不是创作”。简单的讲,电视上正在转播的一盘棋,说不定古人已经下了无数次,也说不定在哪个穷乡僻壤之地两个老翁、两个小孩也正在下同样的棋。
完全信息的环境并不是人类生存的环境,我们的自然界存在着太多的未知、太多危险、太多新奇、太多的奥秘······,我们人类的大脑始终在这个又有已知又有未知、既有确定又有不确定信息的环境中进化成长,假如只能应对确定信息,人类早已经灭绝了,因为那相当于应对不了环境的变化。所以,“完全信息博弈”人类只能部分发挥自己的智慧。还用路来做比喻,只有规定好合适的路况,汽车才可以和人比赛。同样,只有定好了棋盘和规则,人工智能才可以和我们人类下棋。
我们与自己研究的机器下棋,还要不被虐,怎么办?回到自然环境,回到我们人类智慧生长的环境,这就是“不完全信息”环境,来到“不完全信息博弈”。
“不完全信息博弈”,对弈过程存在着诸多的“不可知” ,“路”具有不确定性,对于我们人来讲分析判断以及决策不成问题。但是,对于人工程序来讲会有一定困难,因为同一局面有多种认识,而且会以为棋手、环境、舆论等等的变化而变化,程序本身不能提前设定,假如运用概率解决提前设定的问题的话,又出现“何时运用的问题”,程序可能会乱下。“不完全信息博弈”不只是信息是否完全的问题,还有个“时机问题”,随着环境、时间的变化总在变,刚才确定,一会儿又否定,刚才认为是真,随后认为是假。一个棋手一个感觉、一个棋局一个想法。
三 象棋发展之路
象棋就像一种乐器,美妙的乐曲要靠乐器的丰富表现力。如今,象棋发展中那么多的不如意,我们不能把注意力全部放在和棋问题、关注度下降、爱好者群体老化上····,要想一想象棋本身。 就像乐曲的不动听,不能只盯着作曲、演奏上也要想想乐器的问题一样。
任何的文化,任何的艺术都是必须有它的“载体” ,没有这个载体人类任何美好的设想、任何美好的情感只能停留在人的大脑之中。这个载体就是这个文化的“质” ,文化的“量”由这个“质”的出现而产生。 象棋本身是象棋文化发展的“质”的所在,而我们古往今来的任何关于象棋的人物、事件、古籍、研究成果以及所有的社会活动,都这象棋文化的“量”的表现。
我们为什么要确认象棋文化的“质”与“量”?因为我们只有知道这些才能认识象棋文化的发展规律,只有明了它的发展规律,我们才可以找到正确的象棋发展之路。
任何事物的发展,都遵循着“质量互变规律”,象棋文化的发展也理应如此。象棋定型于北宋,距今已经有千年的历史,就是说象棋已经千年不动了,这个“质”已经稳定了上千年。那么是不是长时期的稳定就必须“动”呢?当然不是,要看了“量”的发展情况。这就像人两条腿走路,只有稳住一条腿另一条才能迈进,只有迈进的一条腿有了足够的步幅,稳住的一条才到了迈进的时候,不然就会跌倒或原地打转。从发展的角度看,象棋文化的“质”与“量”状况非常清晰,一个千年未动,一个积累千年。从现实的角度看,就是原地打转的状况。我们有理由相信,如今应该是“质”变得时候。
象棋发展之路已经走到了一个发生质变的历史时期,这是事物发展的规律,但愿我们没有认识错误。
四,探索之路——奇袭象棋
奇袭象棋实际上已经有了30多年,由于种种的原因一直没有几个人知晓,现在在广东象棋网和象棋大师网都有详细的介绍。奇袭象棋的最大特点就是对象棋有“全面的继承”和“开创象棋的不完全信息博弈”。希望关心象棋文化发展的人士多加关注。
奇袭象棋: