Connect with us

谷歌人工智能连赢人类围棋冠军5局,它怎么做到的,如何评价它?

产业风云

谷歌人工智能连赢人类围棋冠军5局,它怎么做到的,如何评价它?

假装FBI

 

163523777186
  一石激起千层浪。当人工智能战胜人类……这个原本看似遥远的事情真正的发生了,在2015年10月5日,全程没有让棋。

1月28日,《金融时报》援引《自然》杂志的报道,由谷歌伦敦子公司DeepMind开发的AlphaGo机器,以5:0的战绩击败了欧洲围棋三届冠军樊麾(出生于中国,现籍法国)。DeepMind是2014年被Google以4亿英镑的价格收购的人工智能团队。

在1月27日,DeepMind团队发表的《Mastering the game of Go with deep neural networks and tree search》作为《自然》(Nature)封面论文上线。团队创始人Demis Hassabis表示,他们开发的围棋程序AlphaGo融合了高级树状查找和深度神经网络。

同一天,Google在官方博客中表示:“我们很骄傲地公告天下,我们的科学家已经搞定了围棋,并攻克了人工智能领域的一项重大挑战。”

今年3月,AlphaGo将在首尔与过去十年全世界最顶级的围棋选手李世石对决。

谷歌AlphaGo是怎么赢的?——双大脑工作

 

19.png
  通过对神经网络进行的3000万步训练 (所有棋谱均来自人类专业棋手的比赛),AlphaGo预测出人类对手下一步走法的正确率已经达到了57%,之前的纪录是44%。

AlphaGo使用两个不同的神经网络“大脑”,通过两者合作得出移棋决定。

根据微信公众号《人工智能学家》对上述论文的编译得知,AlphaGo的两个大脑分工如下:

大脑1:“监督学习(SL)政策网络”。着眼于棋盘中的位置,并试图决定最佳的下一步。实际上,它用来估计每个合法下一步行动为最好的一步的可能性,其顶层猜测就是具有最高概率的那步。该团队通过几百万个优秀的人类棋手在KGS上的下棋选择,训练这个大脑,其目的仅仅是复制优秀的人类棋手的移动选择。它一点也不关心赢得比赛,只下那步顶级人类棋手会下的那步棋。 AlphaGo的下棋选择器有57%的概率可以正确匹配优秀的棋手下棋选择。

大脑2:“价值网络”。它不猜测具体的下一步怎么走,而是通过设想的棋盘分布,估计每个玩家赢得比赛的概率。它通过提供整体的位置判断来配合“监督学习(SL)政策网络”。这个判断只是近似的,但它对加快阅读速度非常有用。通过将未来可能的位置分为“好”或“坏”的分类,AlphaGo可以决定是否要沿着一个特定的变化进行更深的阅读。如果位置评估器说某个具体的变化看起来情况不妙,那么AI可以跳过阅读,不沿着那条线继续发挥。

据论文介绍,当只使用一个大脑时,AlphaGo大概和目前最好的电脑围棋AI实力相当,但结合两个大脑是,它可能达到人类职业棋手的水平。

专业围棋手是怎么看的?

2013-2015年三度欧洲围棋冠军樊麾,也是本次人机大战的主角之一,他表示:

在中国,围棋不仅是一项比赛,它还是生活的一面镜子。我们说,假如你的棋下得有问题,那很可能是你心性的问题——棋如其人。

输棋确实很难过。和AlphaGo对战之前,我觉得我能赢。在第一局失利后,我改变了战术,增强了进攻,但还是输了。问题是人类有时会犯致命的错误,因为我们是人。有时我们会疲惫,有时我们求胜心切,我们总有这样那样的压力。电脑程序不会这样,它非常强,也非常稳定,简直就像一堵墙一样。对我来说这是很大的差别。我知道AlphaGo是个电脑,但如果没人告诉的话,我可能会觉得它是个有点陌生却又非常强大的对手,是个真人。

当然,输掉比赛让我不太开心,不过作为职业选手,我们输过很多比赛。所以,失败了就从中学习,也许会有所收获。总之从长远来讲这是一件好事。

随后在一个微信群里,樊麾说:“一切都是真的,因为一直在保密中,所以大家都不知道。我没有放水,不过下得确实不好。只能告诉大家,这个系统确实很强!拭目以待和李世石的棋吧!这是去年10月下的,还有些条款在保密范围之内的,我不能告诉大家,不过我觉得跟李世石的棋会很精彩!”

曹大元九段:昨晚就看到了,所以睡不着觉了,压力很大啊!

孟泰龄:我认为樊麾布局有三盘占优,另两盘劣势。我觉得电脑确实有职业水准。感觉电脑棋风稳健,酷爱实地,如果后半盘它真的可以滴水不漏的话,那距离顶尖真的只有一层窗户纸的距离了。显然电脑大局观差一些,但局部棋型的感觉及计算已经有相当水准了。

业内人士怎么看?

DeepMind创始人Demis Hassabis:

AlphaGo正在突飞猛进,甚至会超越最棒的人类选手。能够看它在围棋规则内去创造新的东西,感觉很神奇。我们对自己创造的这个系统有种很密切的感情,特别是它被创造的方式——它会学习,我们也会教它,它的风格就像人一样。和其他编出来的程序不同,你不知道它到底都会什么,因为它能够自己学习。

阿尔伯塔大学计算机科学家、Chinook设计师 Jonathan Schaeffer:

我想这还不是围棋版的深蓝时刻。真正的成就是这个程序能作为选手在顶级比赛中较量的时候。深蓝从1989年开始就常常战胜各路大师,最后登顶则是八年之后的事情。但就目前情况来看,我认为AlphaGo和顶级人类选手之间的差距被大大缩短了。可能只需要再进行一点努力和改善,再提高一点计算能力,不出一两年,它就能打败人类。

就今年3月份的比赛来说,不是打击AlphaGo团队,我还是看好人类。我们可以把AlphaGo看成是少年天才。它突然学了一手好棋,进步神速,但毕竟还是经验有限。从国际象棋和西洋跳棋来看,经验还是很重要的。

国际围棋联合会秘书长Hajin Lee:

当我知道那个电脑要挑战职业顶尖棋手李世石的时候,真的很吃惊。我当时觉得这个挑战者绝对对顶级选手有多强完全没概念。但实际上,可能我才是那个不知道这个电脑有多强的人。现在我对这个比赛非常兴奋。

谁会赢呢?我不知道。李世石自己也觉得可能那电脑跟他一样强。可能是我听到了太多AlphaGo的消息,我现在惊讶于它的强大。同时我也非常了解李世石的水平,所以我认为他们双方五五开吧。

我觉得围棋是个很有内涵的竞技,我不觉得如果电脑AI击败了人类会对围棋造成什么伤害。我想人们会接受自己被电脑技术超越这件事。

最后,让我们通过下面五张GIF图回顾一下这五局棋,樊麾是怎么输给谷歌AlphaGo机器的(来自微信公众号:棋文弈事):

 

13.gif
  第一局

 

14.gif
  第二局

 

15.gif
  第三局

 

16.gif
  第四局

 

17.gif
  第五局

理性投资 成熟创业 尽在GPLP

www.gplp.cn

微信ID:GPLPCN

gplp二维码

Click to comment

Leave a Reply

电子邮件地址不会被公开。

更多关于 产业风云的文章

  • 产业风云

    流量入口、用户图谱、AI引擎,赤子城的信息分发三部曲

    By

    移动互联网时代的信息爆炸,推动了信息分发方式的变革。信息作为价值的载体,其连接效率决定了价值的流动效率。

  • 产业风云

    感觉链家被掏空

    By

    2003年,顺驰一路狂飚的时候,孙宏斌突然创立了一家名为融创的公司,专做高端楼盘。 融创与顺驰同样激进,一年之后,销售额就达到了25亿。孙宏斌甚至认为,5年后,他将拥有两个顺驰。 两年后,孙宏...

  • 产业风云

    马斯克能否“连任”董事长前夕,特斯拉突爆订单退潮?!

    By

    文/璎珞   GPLP 2018年6月4日,据科技媒体Recode报道,在美国市场,特斯拉的大众车型Model 3的预订车主中已经有23%的人选择退回订金,并且退订行为大部分发生在今年4月,就...

  • 产业风云

    董事长不保 股东将投票决定是否让马斯克下课

    By

    文/璎珞   GPLP 发射得了火箭,设计得来超级隧道,“上天入地无所不能”的马斯克是外界眼中的红人,也是特斯拉对外的形象代言。就是这样的一位明星企业家,却极有可能被投票剥夺特斯拉董事长头衔。...

  • 产业风云

    三星再遭中国反垄断调查,国产存储芯片厂商发展契机?

    By

    文/意卿   首席创业官 5月31日,中国反垄断机构派出多个工作小组,分别对三星、海力士、美光三家公司位于北京、上海、深圳的办公室展开“突袭调查”和现场取证。 6月3日,三星中国公司相关负责人...

To Top