@ 2017.10.19 , 22:05
38

零号机突破——AlphaGo围棋大师

零号机突破——AlphaGo围棋大师
视频截图

# 这费是法 投递(不是译稿)

人类在数千年年间累积了围棋的知识,总结提炼为定式,棋谚和书籍。在数天的时间内,阿法狗零号机能够从一张白纸开始重新发现大部分的围棋知识,以及对这一古老游戏有着深刻洞见的新策略。

DeepMind在自然上新文章——《无人类知识的情况下精通围棋》的最后一段,如同科幻小说的开篇。某种意义上说我们低估了人工智能特定领域的发展速度,毕竟在五年前,绝大部分人的预期是我们仍要一代人的努力才能够创造出能够接近人类水平的电脑围棋选手。

零号机突破——AlphaGo围棋大师
对战过程

零号机和樊号机(和樊辉下棋的第一代)以及李号机(和李世石下棋的第二代)的差别在于,后者是通过监督学习完成的。亦即通过人类已有的围棋棋谱训练策略网络和价值网络(两个深度卷积的神经网络),最后通过蒙特卡洛树搜索结合确定落子。这样的训练效果受制于已知的专家数据(之前的围棋棋谱)。零号机的网络训练是通过强化学习完成的。亦即通过随机的初始状态进行大量的情景模拟,并驱动网络朝着最优化的方向发展。原有的两个分离的价值网络和策略网络被整合成一个残差网络(这个应该是上年计算机视觉领域的一个大突破,微软研究院的成果),最后通过蒙特卡洛树搜索来完成对局的模拟并进行学习。

抛开细节不谈,我们看一张论文中的图片,对于一个经典的角部定式,零号机的学习和变化过程。真正让人觉得激动的是中间的时间轴。50多个小时的时候我们看到了常见的定式,70个小时的时候便已经是人类未知的领域了。

相关的强化学习微软研究院也有一篇《强化学习的混合奖励架构》的文章,提出的深度强化学习的做法,利用多个代理的混合决策玩吃豆人游戏。拿到了超过人类最强玩家的分数。

这一次零号机的突破可以说非常直观的展示一个AI在特定领域越过“奇点”后的状态。人类数千年累积的知识,在AI面前只需要数小时。

# 这费是法:作为一个蛋友,容我虚妄的做出一些建议。我们可能需要更加疯狂的运用我们的想象力,为即将到来的巨变做好更多的准备。毕竟塞内卡说过“折磨我们的往往是想象,而不是真实”。

# dodww 发在无聊图的对战图(GIF):
零号机突破——AlphaGo围棋大师


给这篇稿打赏,让译者更有动力
支付宝打赏 [x]
您的大名: 打赏金额:

4.5
赞一个 (21)

TOTAL COMMENTS: 38+1

  1. 无极yaya
    @1 month ago
    3591271

    中盘胜负已分,却还要继续填。

    [21] XX [1] 回复 [0]
  2. HydE大侠
    @1 month ago
    3591274

    看不懂哦

  3. 3591275

    看看上面列出的五局棋谱,胜负已经很细了,和无聊图那个GIF里的水平差距非常明显。GIF里应该是AI刚开始自学时下出来的棋,只有人类初级水平。

    [12] XX [4] 回复 [0]
  4. lbSeevdo
    @1 month ago
    3591280

    人类20年训练的水平,这货3天就超越了,40天超越了之前所有的AlphaGo,不过大卫席尔瓦也说了它的出现说明算法比数据和计算量更重要,其实也为人类挽回了尊严。

    [17] XX [2] 回复 [0]
  5. lbSeevdo
    @1 month ago
    3591281

    @无极yaya: 这是棋力只有小白水平的时候的对局

  6. 3591287

    快点.再快点.时间不够了

  7. 鬧鐘
    @1 month ago
    3591290

    说不定我们已经见证了某种历史的开端,却毫不自知呢

    [29] XX [2] 回复 [0]
  8. 挣脱地平线
    @1 month ago
    3591292

    立帖为证:我全心全意支持AI

    [39] XX [1] 回复 [0]
  9. 正直者
    @1 month ago
    3591296

    这次的零知识训练在途中和人类的定式达成一致,说明人类在围棋上探索的方向是正确的,事实上是对人类智能的一次肯定吧

    [13] XX [0] 回复 [0]
  10. 3591310

    今天是新纪元的第一天

  11. ‮向反‭
    @1 month ago
    3591322

    具有人格的初号机 , 不远了吧

  12. 3591323

    最后感觉是填色游戏

  13. 3591329

    让这货自己跟自己再对局下去是不是有必胜下法?

  14. 3591341

    2017的前十年根本无法想象信息科技爆炸式发展的速度可以这么快,现在我觉得在对有生之年能穿越时空之类的事情发生已经不会感觉到惊讶了!

  15. 3591347

    很多特定领域,机器本来就比人类强,继续加油吧

  16. 星术师
    @1 month ago
    3591353

    阿老师下棋的 风格就是如此天马行空

  17. 3591357

    那先手到底价值几目

  18. 3591376

    看完这篇文章忍不住要喷,这样的文章也能算是论文?不如说是欺骗弱智的手段,尤其是里面不断的提到“超越人类千年”“超过人类最强玩家”如果作为一个娱乐新闻是可以的,但是作为一个论文,一个懂AI的人写出来这样的话,我可以怀疑他就是故意误导大众,故意隐藏AI的本质,只是引导大众去看AI哗众取宠的表面,然后说我比你们强,你们赢不了AI。这种人!简直是下流。你去看AI是怎样写出来的,你会发现AI很简单,简单到都没有自行车复杂,而这篇论文,就是一定要在自行车上面套上汽车外壳,不让你看清AI的结构。我来告诉你AI从最简单的角度来说,就是操作录制。只是AI录制了很多操作,然后将操作截断成小段,使用在特定的场合,就是这么简单的AI原理。论文还要提到AI跟人相比,有什么可比较的?你每天打开电脑操作的步骤就是听歌,打开网页上网,打开电影看电影。但是今天是星期一,你打开电脑的顺序就变成了1,打开网页。2听歌。3看电影,AI就记录了你的操作,星期一的时候就会按时完成你的步骤。就是这么简单,那么为什么围棋的时候会有AI下的好,有AI下的差?原因就是围棋的步骤有10的19次方,就算全世界的电脑加起来也不可能筛选的完,所以才要人的辅助,帮助它筛选,一旦筛选完,有必要跟人类围棋历史比较?AI已经筛选完全部数据,你还要叫人类去跟他比赛?你还要吹嘘AI筛选的有多快?电脑程序设置的就是要帮你打开网页,打开音乐,打开电影,你还要惊讶的大叫,哇AI竟然知道帮我打开电影,而且还要写篇论文出来,你是不是傻子?

    [7] XX [136] 回复 [3]
  19. 3591378

    @i3: 这篇不是论文啊,是投稿者自己写的

    nature 的论文在这里:
    https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
    https://www.nature.com/articles/nature24270.epdf

    [17] XX [0] 回复 [0]
  20. sarcophile
    @1 month ago
    3591389

    @i3: 瞎扯。。。皮毛都不懂还敢言之凿凿。至少也讲讲bp过程的本质吧?这个就是入门第一步,本科知识。你说那些,根本 不沾边啊亲,还筛选。。。简直了

    [26] XX [1] 回复 [0]
  21. 3591390

    零号机对零号机谁能淫

  22. highwindmx
    @1 month ago
    3591450

    AI的价值判断函数输入以后会越来越有意思。。。

  23. 木哈哈
    @1 month ago
    3591481

    @鬧鐘:
    叫喊几十年的人工智能威胁论,还叫不自知?这种撂爪就忘的特性,太有趣了吧

  24. 3591508

    @i3: 我要是你导师,当场就让你退学了。无知还瞎jb吹牛。

    [11] XX [0] 回复 [0]
  25. 3591549

    @pony: 这个是围棋的终极问题啊,不过也许这个值是一个无限非循环小数,就像圆周率那样……

  26. 3591550

    @DFT: 上面五局棋谱不是和樊辉下棋的第一代么

  27. skilrg
    @1 month ago
    3591560

    …感觉以后人工智能NB了,对人类应该没什么兴趣吧。

  28. 脑子坏掉了
    @1 month ago
    3591564

    @i3:
    你说到底为啥?

    为啥你每次出现我会想叫你去升级你的芯片

  29. 猪的呢喃
    @1 month ago
    3591568

    “AlphaGo Zero通过称为“树搜索”的过程来确定要下一步走法。该程序从当前局面开始,并考虑后续可能的动作。并加入考虑其对手可以在未来棋路中施加的影响因素,最后找到可以应对的措施,……如此这般,创建一个分支树形图,模拟出不同组合的局面演化,从而导致不同的应对策略。”———记得有人说过,如果要成为某一乐器领域的专家,至少需要一万小时以上的练习。放在围棋领域,人类学习的三要素则是下棋盘数的积累,对每一步棋的下法的探索,对每一盘棋的每一步棋去进行归纳找出最优下法。然后人类的缺陷很明显,一是人类无法下如此多的棋来进行演算;二是人类对于每一步棋的下法搜索(梳妆搜索)都无法达到狗的水平;三是人类无法将之前所有的经验都毫无偏差的进行记忆。人类在这三点上是一点胜算都没有。狗的所谓深度神经网络,确实是在模拟人类下棋时所需要的三要素。最后表个态,我360°全方位的支持AI,还望今后能够给我颁发一张良民证。

    [17] XX [0] 回复 [0]
  30. 脑子坏掉了
    @1 month ago
    3591570

    “我们可能需要更加疯狂的运用我们的想象力,为即将到来的巨变做好更多的准备。”

    谢谢提醒

  31. 神的波纹
    @1 month ago
    3591643

    祈求AI也没用,现在我们的这副肉体是肯定会消亡的,还是迎接生命3.0吧。

  32. 牛牛oo
    @1 month ago
    3591662

    说到实质,不就是数据库的建立和检索么。。

  33. cesium
    @1 month ago
    3591673

    最后的动图展现了零狗老师天马行空的想象力。

    开局白棋第4手石破天惊,下在了一路上,第46手更是直接点在了A1。传统上我们认为三四线是地势的分割线,下在一路效率太低。但是在这里白零狗老师是以这两手棋为诱饵,引诱黑棋在左侧投入过多子力,降低子效,自己赢取左上方广阔空间。但这一战略意图被黑棋识破,通过一系列佯攻弃子的手段,将右下方白棋大龙赶尽杀绝,最终逼迫白棋中盘认输。

    从这盘棋里面就可以看出来,人类的定式、布局理论完全是陷入局部最优解的表现,真正的围棋是自由、奔放的,没有一个位置不能下,没有一个形状不好看,胜利才是唯一的标准

    [12] XX [0] 回复 [0]
  34. dogisacat
    @1 month ago
    3591687

    @edwin:
    只有足够的时间,他就可以超越自己。然后超越了的自己又会被自己超越,直到永远。
    当有一天我们再度探望他时,又会变成怎样?

  35. dogisacat
    @1 month ago
    3591695

    @i3:
    为什么你觉得自己可以定义AI?人工智能的智能到底是什么,现时根本定义不到。连人类对自身的智能都是似懂非懂的状况下,还想去定义AI?

  36. 脑子坏掉了
    @1 month ago
    3591710

    @dogisacat:
    AI还真是人类“定义”出来的,只是不像这个i3瞎几把说的那样

    本质上AI是用于寻求问题答案的计算方法。现在最火的就是各种神经网络算法。只懂点皮毛,打算抽空学习下。

  37. FUxxER
    @1 month ago
    3591795

    AI学习证明了中国古典还棋头的合理性。

  38. 作大死
    @1 month ago
    3592451

    假如把“下棋”看成是“与人对话并说服他”,这样的超强AI出现的时候世界会是什么样子呢?
    另外“下棋”也只是计算机在人指定的”学习的规则“下不断迭代,如果计算机能自我迭代”学习的规则“的话。。。人工智能离我们真的就不远了

发表评论


24H最赞