AlphaZero上了《科学》封面,有关的论文正式发表,又一次引起世界的关注。这两年中Alpha系列棋类人工智能程序可谓出尽了风头,火的不得了。尤其是AlphaZero竟然不用人类的知识,只凭棋规就可以自学国际象棋、围棋、日本将棋,并且战胜他们的顶级棋软,人类棋手已经到了望尘莫及的地步。
AlphaZero虽然如此风光,但并非就无所不能,实际上它的天敌30多年以前就已经诞生,这就是奇袭象棋。目前的AlphaZero如果和一个几岁的孩童比赛下奇袭象棋,失败是大概率的事情。
在AlphaZero的文章中有这样两句话:1,“DeepMind说,现在AlphaZero已经学会了三种不同的复杂棋类游戏,并且可能学会任何一种完美信息博弈的游戏”,2,“为了创建能够解决各种现实问题的智能系统,它们需要更加灵活,能够适应新情况。虽然目前在实现这一目标方面取得了一些进展,但AI的通用化问题仍然是研究中的一项重大挑战,经过训练的AI系统面对特定任务时能够以极高标准完成,但任务只要稍有变化往往就会失败。”这两句话可以说明, AlphaZero不会下如奇袭象棋这样的“不完全(完美)信息博弈”的棋类。
完美信息博弈,是一种明确的、可知的、不需要进一步判断就能确定的信息,AlphaZero的算法实质是将这些海量(短时间内大量的自我对弈,人几辈子不可能作到)的对弈信息,根据规则和求胜的目标进行记忆和挑选,留下最正确(胜利)的储存起来,名曰:深度学习。假如信息不是完美(完全)的,信息是不确定的,那么就不可能有确定的对应。这就应了这第二句话,“但任务只要稍有变化往往就会失败。 这里的稍有变化不是指下棋中的各种招数的变化,指的是同一局面下任务不一定一样,任务并不确定,可能是A也可能是B还可能都不是,或根本就是完全虚假的诱惑,这个时候AlphaZero将不知所从,它所储存的信息再多与当前的判断也无关联,最多只能以某种概率瞎蒙来决策,此种状况下程序还可能会死机(有报道称让人工智能机器人去取一束花,假如这两只花一模一样又和机器有同样的距离,它就会死机,不知所措)。当然,这不是AlphaZero,或许它会先进些,但是这说明了程序的特点——必须有所提前规定。而《孙子兵法》曰“近而示之远,远而示之近,能而示之不能········此兵家之胜,不可先传也”。打仗,哪有提前做出过细规定的?
以上情况下,如果是人类棋手下棋,人的表现将是人工智能无法比拟的,因为人的大脑本身就是在“不完美(完全)信息”环境下不断进化而来的,人的智慧很大程度上体现在对未知的判断、对危险性问题的处理。即便是一个几岁的孩童,它也能察言观色,能够以棋手的神态举止、下棋习惯等等因素做出判断,虽然判断不一定正确,但是人可以从中不断增长经验,不断增长自己的洞察能力,最后形成一种正确率比较高的对未知判断的能力。也就是说一个小孩下棋,他可能也瞎蒙,但是瞎蒙时面对不同的个体、不同的人,不断的增长自己的能力。这些与人的阅历、文化、性格、修养等等东西都是的联系,是一个人综合素质的体现。这一切一切,想要以程序的方式固定下来作为判断的依据,简直是不可能,因为还有时间、时机的差别、还有环境的、欲望的、情绪的、舆论影响的、······差别。程序不可能把这些都提前都输进去,因为这是时刻都可能变化的东西。能够迅速了解这一切并能够迅速进行分析的只有人才能做到。
奇袭象棋一款“不完全信息博弈”象棋,他与象棋的区别只有车、马、炮六只棋子,也只是在这六只棋子的暗面又布置了隐蔽的双车、双马、双炮,用翻转的方法实现明暗的转变,达到隐蔽意图的目的。六只棋子之间,体现出万事万物之间的对比关系:表同里也同;表同里不同;里同表不同;表里都不同,这是一种开创性的、革命性的设计,使象棋变化暴增且更符合人的智慧的发挥,悬念重重、和棋大减、趣味横生,压制棋软的不当使用,摆脱人工智能程序对人类棋手的无情肆虐。
AlphaZero确实风光,但是,在这里30年前就给你预备好了敌人!