阿尔法狗的上帝

2016年挑战人类理性的阿尔法狗，究竟会给人类带来祝福还是灾难？

文/郭暮云

2016年初，阿尔法狗（AlphaGo）VS李世石的人机大战，赚足了眼球，引爆了舆论，并且以4:1的比分和荡气回肠的棋局证明，硅基生命似乎已经胜过了碳基生命。2016年尾，升级后的阿尔法狗以“Master”再次约战中日韩围棋大师，并取得60连胜。

那么，2016年挑战人类理性的阿尔法狗，究竟会给人类带来祝福还是灾难？

为了探讨此问题，恐怕还要先从它的运行机理说起。

贝叶斯网络

征服东方围棋的Deep Mind与征服国际象棋的Deep Blue的区别，恰如牛顿与牛二的区别。国际商用机器（“IBM”）公司的深蓝，是一台暴力穷举“机器”，它利用强大的CPU，遍历8×8的棋盘，给出每种局面下的最优应对，从第一步开始就抢占先机，并就此冷酷到底。但这种方法，面对19×19的棋盘就不再有效，因为后者的变化至少是10的600次方，而全宇宙的原子数目也不过才有10的70次方。面对浩瀚的围棋宇宙，任何蛮力都会被这张有361个节点的天元巨网无情消弭。

于是谷歌另辟蹊径，不再尝试毫无意义的穷举法，而是祭出了“深度学习神经网络”这一最先进的人工智能体系，以“归纳”和“概率”这些貌似不够精密不够冷血的方式，迂回逼近了围棋之道的终极真相。

不得不说，两种方式的不同也恰恰体现出网络时代和PC时代的境界落差。

落实为阿尔法系统的AI体系，由四大子系统组成，即“策略网络”“估值网络”“快速走子系统”，以及“蒙特卡洛树搜索（MCTS）”。对这些具体系统的分析网络上到处可见，本文不再赘述。需要提及的反倒是阿尔法狗甚至一切人工智能的重要基础——“贝叶斯网络”。

何谓贝叶斯网络？沐阳浸月在《从马文•明斯基到AlphaGo，人工智能走过了怎样的70年？》一文中如此定义：“贝叶斯网络是一个加权的有向图，是马尔可夫链的拓展。马尔可夫链保证了网络中的每一个状态只跟与其直接相连的状态有关，而跟与它间接相连的状态没有关系，那么这就是贝叶斯网络。在这个网络中，每个节点的概率，都可以用贝叶斯公式来计算，贝叶斯网络因此得名。贝叶斯网络极大地克服了20世纪60年代和70年代概率推理系统的很多问题，它目前主导着不确定推理和专家系统中的人工智能研究。而且这种方法允许根据经验进行学习，并且结合了经典人工智能和神经网络最好的部分，所以极大地推动人工智能领域走向现在我们正处的这个巅峰时代。”

而贝叶斯网络的理论体系奠基人是18世纪英国的一位长老会牧师兼数学家，托马斯·贝叶斯（Thomas Bayes，1702-1763）。

先验的核心奥秘

贝叶斯在为其论文《论机遇理论中一个问题的解决》的引言中说，他的目的是“发现一个方法，借此我们能够确定某事件在给定环境下发生的概率，对此环境我们一无所知，仅知在这个环境下，该事件曾经成功了几次，又失败了几次”。在身为牧师的贝叶斯看来，事件M的概率确定而不能确知，它似乎是上帝的箧中秘珍，人们只能以某种方式接近它。

后人常常把根据以往经验和分析得到的概率叫做“先验概率”，相应地，把已有经验证据条件下推算的概率叫做“后验概率”。其实，在贝叶斯的思想中，并没有这种能与“先验概率”相提并论的“后验概率”。只有“先验概率”是存在的，确定的，但只是对无限的上帝而言；有限的人充其量只能根据经验做出某种推测，因此，“后验概率”并非对“先验概率”的修正，而是人在无可解脱的束缚下追求先验概率唯一可行的方式，是对先验概率的后验测算。这种追求永远达不到目的，因此，人只能限于了解先验概率位于某一区间的可能性有多大。

贝叶斯的好友普赖斯指出，贝叶斯定理能直接用于“从最终因论证上帝的存在”，他写道：“它（贝叶斯定理）直截了当并且毫不含糊地向我们表明，事件不管以怎样的次序或周期发生，都有理由认为是来自自然界的稳定原因或规则性，而非源于无规则的机遇。”这里明显地透露出牛顿世界观的影响，但也在扩大着牛顿的世界观，因为“先验概率”并非由于无知，也并不象征无知，相反它倒是只能属于上帝的知识。（《上帝怎样掷骰子：因果性、概率与归纳》，陈克艰著）

贝叶斯思想的实质，便是首先承认，先验的核心奥秘（无论叫做“先验概率”还是“必胜策略”）只属于上帝，人类只能采用后验的迂回方法，用统计、归纳、试错、反馈等手段尽可能逼近它。也就是说，阿尔法狗其实也是被贝叶斯牧师“驯化”过的，它不过是用超高效率将这种大巧不工的方法在棋盘上实现了出来。所以在此意义上，完全可以说它的每一次胜利，都是在向贝叶斯，以及贝叶斯的上帝致敬，因为它是在发现而非发明围棋之道。

如果发现者都得到这么多夸奖，那么创造者又当得怎样的赞美呢？

并非围棋上帝

在对弈中，阿尔法狗全不在意一城一地之得失，因为它的设计目的是为了全局获胜而不是局部争先。这是对近年来围棋界重计算、轻格局的功利主义思潮的提醒，某种意义上的确体现出“围棋上帝”的风范。它堂皇弈出的那些貌似业余的“愚型”，最终却用胜利证明，都是人类暂不理解的妙招，正如同历史中上帝的作为，虽也常常被人类视为愚拙，至终却显出人类理性的自负。

不过围棋天使当然并非围棋上帝，这样说的理由至少有3个。

第一，它仍有漏算。阿李大战的第4盘，阿尔法狗出现了错误。而若是上帝来下围棋，他显然会在每一个局部都做到完美，掌握每一种情况下的最优策略。

第二，它仍得下棋。这是说，如果上帝来下围棋，他根本不会给人类具体展开棋局的机会。意思是：只要贴目规则一确定，上帝就可以根据理论极限贴目值（这个值目前只有上帝知道，并且在有限的将来恐怕也很难得出精确解析值）立刻判定棋局胜负，而无需具体展开。换句话说就是：猜先完毕，胜负已分。

第三，它仍旧有限。阿尔法虽然可以借着不断改进算法和升级硬件，将它对人类的领先优势不断扩大，最终绝尘而去，但它的全部境界仍在有限界，而再大的有限也不是无限。

阿尔法狗击败人类的2016年，只是证明并且淋漓尽致地向人类展示了人类理性的局限，正如日本围棋棋士藤泽秀行所说：“棋道若一百，吾只知其七。”职业棋手甚至整个人类都理应访问古道，如雅比斯般祈求上帝：“甚愿你赐福与我，扩张我的境界。”（参《历代志上》4:10）从此升华棋道，定睛胜负却又超越胜负；渴慕真理，不断追逐却又不致僭妄。

1月3日Master战胜柯洁后，聂卫平表示：“Master改变了我们传统的厚薄理念，颠覆了多年的定式。围棋远不像我们想象的那么简单，还有巨大的空间等着我们人类去挖掘，AlphaGo也好，Master也罢，都是‘围棋上帝’派来给人类引路的。”

诚哉斯言。

阿尔法是“始”的意思，而我们还远远看不到围棋的“终”。不过，正如常话所说，“人的尽头就是上帝的开头”，又如经上所说，“敬畏耶和华是智慧的开端，认识至圣者便是聪明。”（《箴言》9:10）人类若真能借着这一次在围棋天使面前的失败，认识到究竟应当如何寻找和认识创造宇宙的上帝，这便是最大的祝福。

作者是教会传道人。