1997年,国际象棋AI第一次打败专家级人类选手。曾经我们以为,必须要花上几十年的时间,计算机才能达到人类专业围棋选手的水平。因为对计算机来说,围棋比象棋的挑战更大:每个回合可能存在的走法数量多得多,没有一个简单的方法能来测算。
但是就在昨天,国际顶尖期刊《自然》报道了谷歌研究者开发的新围棋AI??Alpha Go,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。
AlphaGo与欧洲围棋冠军樊麾的5局较量
这是人类历史上,围棋AI第一次战胜职业选手。Alpha Go的下一个挑战将是世界顶级围棋选手之一,李世?,比赛将于三月份在首尔举行。奖金是由Google提供的100万美金。李世?表示很荣幸自己将与电脑公平对弈。“无论结果如何,这都会是围棋史上极其有意义的事件。”
李世石与以往不同,这次不让子
在以前AI与人类的就比赛中人类都会让子,而且AI主要是和业余段位的棋手比赛。2014年东京围棋擂台赛上,Crazy Stone(基于蒙特卡洛树搜索,这是一套能够从本质上对每一步走法的所有结果都进行分析的系统)就是通过让子以微弱优势战胜人类棋手的。而这次 Alpha Go 对战樊麾的比赛完全是公平的,没有让子。
Alpha Go 也和其他的围棋AI进行了较量,在495局中只输了一局,胜率是99.8%。它甚至尝试了让4子对阵Crazy Stone,Zen和PachiI这三个顶级AI,胜率分别是77%,86%和99%。可见Alpha Go是真的很强大。
不了解围棋的人可能不清楚围棋对于AI来说有多难。就拿国际象棋来说,平均每回合有35种可能,一盘棋可以有80回合;而围棋每回合有250种可能,一盘棋可以长达150回合。这是一个几何级的数字,足以让那些倾向蛮力计算者望而却步。所以研究者们选择了模仿人类大师的下棋方式。
谷歌的DeepMind
开发Alpha Go的团队是Google的DeepMind,这是2014年Google在英国收购的一家人工智能公司。这个团队使用的是一种非常流行和成功的机器学习方法,叫做深度学习(这是2013年MITTR的十大突破技术之一,见附录)。
深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。
DeepMind团队表示,Alpha Go的关键在于使用的深度神经网络。实际上,在Alpha Go中有两种不同的神经网络,第一种叫做政策网络(policy network),用来预测下一步;第二种叫做价值网络(value network),用来预测棋盘上不同的分布会带来什么不同的结果。
Alpha Go所使用的神经网络结构示意图
Alpha Go使用它们的方法是,把非常复杂的搜索树减少到可操作的规模。所以,它并不是在每一步都要考虑几百种步数,而只考虑政策网络提供的几十种最有前景的步法,价值网络的作用是减少搜索的深度。所以,它的搜索深度并不是特别深,它并不是一下子搜索出直达比赛末尾的300多步,而是搜索更少的步数,比如20多步,并评估这些位置,而不是一路评估到底,看谁最终能赢。搜索并不是靠蛮力,而是与某种与想象力很相似的东西。
领导这项研究的另一位Google研究者David Silver说:“围棋有着巨大的搜索空间,用蛮力很难解决。Alpha Go的关键在于,将搜索空间缩小到可以操作的范围。这个方法让Alpha Go比以前的方法都更像人类。”
谷歌的人工智能设计师,DeepMind创始人Demis Hassabis表示,通过战胜樊麾,我们的程序赢得了长期以来一项重大人工智能挑战的胜利。而这项技术在Google的首个用途将是开发更好的个人助理软件。这样的个人助理能够从用户在线行为中学习用户偏好,并对产品和事件作出更符合直觉的建议。
谷歌用来创造Alpha Go的技术,也正是他的团队努力开发强人工智能的尝试。他说:“最终,我们想要将这些技术应用到真实世界的重要问题中。因为我们用的方法是通用的,我们希望有一天,它们能延伸得更广,帮助解决最紧迫的社会问题,从医药诊断到环境模型。”
Demis Hassabis
正如TR君在2013年公布十大技术时的预言:“在一个要尝试深奥如模拟人类大脑之事的领域中,单单一种技术必然不能解决所有挑战。但现在,这种技术在人工智能领域中走在最前方。深度学习是一个真正强大的对于解世界的比喻。”
Facebook表示不服,网友回应:谷歌与Facebook来赛一场
就在外媒对谷歌这篇论文大规模报道前,Facebook人工智能实验室负责人Yann LeCun也非常“巧合”的在自己的主页表示,Facebook刚刚在arXiv.org上发表了一篇针对围棋问题的论文。
在论文中,Yann LeCun解释了Facebook为什么要研究围棋,并表示Facebook FAIR的一位科学家田渊栋在几个月前就开始独立研究围棋项目,他开发了一款叫做「黑暗森林」的机器人。它使用了卷积神经网络和蒙特卡洛树搜索的结合。这个程序已经在KGS服务器上运营了一个多月,并取得了成人组第五的排名。这个排名意味着它已经成为全美国最好的前100名选手之一,也步入了世界最顶尖围棋机器人之列。
就在TR君准备发稿前,Facebook 的AI科学家田渊栋在知乎上对“谷歌人工智能击败欧洲围棋冠军”做出回应,网友们强烈希望谷歌与Facebook赛一场。
附录:2013年麻省理工科技评论十大技术·深度学习