撰稿|刘姝钰。
可曾记得两年前那场被载入史册的棋局?
2017年5月27日,中国乌镇,棋盘一端是柯洁,另一端是阿尔法狗。聚光灯下,意料之中,柯洁零比三输掉了这场人机对弈。
可曾记得二十二年前,还是人机对战,同样地,人类输。1997年,棋王加里·卡斯帕罗夫与计算机程序“深蓝”对弈国际象棋,最终棋王以2.5:3.5的战绩输掉了比赛。
围棋的复杂性要远大于国际象棋,也曾被认为是人类最后的智慧堡垒,现在却因人工智能的侵入变得摇摇欲坠。
计算机赢了,胜利者还是人类。
从古至今,未曾出现过两盘一模一样的棋局。因此,通过暴力穷举法的手段预测所有可能出现的情况,并不适用于灿若宇宙星辰的围棋世界。围棋是一个博弈的过程,双方都企图寻找到全局最优解。
人类所采取的方法就是在不断的实战与死活题中寻找并积累经验。阿尔法狗也“仿制”了这样的经验录入方式,借助深度神经网络、监督/强化学习、蒙特卡罗树搜索三大秘诀,既可以像人类一样,通过实战不断录入经验,根据海量结果生成新范式,优化每一步落子,又因其强大的信息存储和计算能力超越人类,并能进行仿真运算,不断模拟可能性直至最终胜利——一句话,比你优秀的人,还比你努力。
但其实,阿尔法狗只是还原了围棋的本质,围棋是一项决策游戏,目的是寻找最优解。人类受传统经验的限制,对一些固定套路深信不疑,对一些奇招、险招不敢轻易尝试。而一心只想取得最终胜利的人工智能,通过无数次模拟可能出现的最终局面,往往会采取当局人无法理解的走法。
这一现象也出现在柯洁与阿尔法狗的对战上。与阿尔法狗的战斗无疑也开启了柯洁新的围棋思维。在此后的一场比赛中,柯洁对战韩国世界冠军元晟溱时火力全开,各种“阿尔法狗流”的招法跃然盘上,最终取胜。柯洁用“震撼”来形容阿尔法狗带给围棋界的感受,但同时也表示人类还会变得更强,而他也通过自己的不断蜕变,印证着这句话。在人机大战赛后,已经加入DeepMind团队的棋手樊麾宣布,DeepMind将公布阿尔法狗50盘自我对战棋的棋谱。
毕竟,追求更强,比追求胜利本身更加动人。
阿尔法狗赢了,可惜它体会不到愉悦。
如果单纯把围棋当作一项只有胜负价值的竞技项目,那人工智能的胜利将永远变成笼罩在围棋上空的乌云。
在AlphaGo强势打入围棋世界后,我们反而可以回头审视初心,更清楚地看到在无情的厮杀下,却是百转千回的对战思绪,在高超的技术背后,我们还需要艺术的浸淫。
我们常说,“人生如棋,棋如人生”,对于阿尔法狗而言,每一场对战的胜利只是丰富了它进一步学习总结的数据库。与此相反,人生无法仅用几个数据概括,围棋就像微缩的人生,你在这个四方天地经历种种选择,每一种选择都可能导向一个截然相反的结果。
磨砺与求胜,就是棋手的修行。