阿法狗2.0版来了!这次AI要正式摒弃人类棋谱

  • 时间: 2017-02-10 08:28:16

谷歌高层拜会聂卫平。

  据@央视 CCTV5 报道,谷歌旗下 Deepmind 公司近日在德国慕尼黑的 DLD 创新大会上正式宣布,将推出真正的 2.0 版 AlphaGo。

  新版“阿法狗”将正式摒弃人类棋谱,只靠计算机自身深度学习的方式成长——即探索“深度学习”方式的极限,臻至“围棋之神”的境界。

  2. 0 版的 AlphaGo,将通过数学模型下的自我对局和深度学习,下出真正属于人工智能(AI)的围棋。

柯洁微博。

  在 2017 年开年,化身 Master 的阿法狗风卷残云完成 60 胜,唯一一场平局还是因为对弈者掉线。

  当时“棋圣”聂卫平就表示:“围棋远不像我们想象的那么简单,还有巨大的空间等着我们人类去挖掘。阿法狗也好,Master 也罢,都是‘围棋上帝’派来给人类引路的。”

  而柯洁则说他一夜无眠,“人类千年的实战演练进化,计算机却告诉我们,人类全都是错的……”

  既然人类的围棋智慧如今落入下风,那么人工智能会带来怎么样的围棋变革呢?

  DeepMind 公司其实早已有过设想——抛弃人类棋谱套路,走 AI 自己的路。

阿法狗之父:哈萨比斯

  该公司创始人哈萨比斯此前在一次采访中曾透露,他们的团队正在尝试训练一个没有学习过人类棋谱的人工智能。

  而当 Master 大杀四方后,也有外界猜测,Master 是否也未曾研习人类棋谱。

  但无论是人类套路还是自成一派,阿法狗更可怕的还是它的学习能力。

  在 2015 年 10 月,阿法狗在与欧洲冠军樊麾的对弈中就在公平的情况下以 5 比 0 完胜。樊麾在接受媒体采访时认为,阿法狗的可怕在于“从不犯错”。

聂卫平和 Master 对弈。

  在樊麾与阿法狗的五盘大战棋谱被放上网络后,就有不少围棋业余高手在网络上发表评论,其中不少人认为樊麾这次的棋下得并不出色。

  但当时《自然》杂志就写道,“人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩 1000 局,但机器一天就能玩 100 万局。”

  “围棋 AI 的学习能力非常强大,就像当初‘深蓝’第一次输给了卡斯帕罗夫,但不到一年第二次对弈就赢了比赛。”

韩国棋院给阿法狗颁发名誉九段证书。

  据《自然》杂志介绍,阿法狗的核心是两种不同的深度神经网络:“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋。

  更恐怖的是它的“进化”深度学习能力,用了 2000 万局的对子对弈进行训练,每一次都能提升棋力。