@ 2015.01.14 , 21:44
41

双人限注德州扑克已被程序破解

[-]

如果你认为 IBM 的国际象棋超级电脑深蓝(Deep Blue)很牛逼,那下面这个可要颠覆你的认知了——双人限注德州扑克玩法已被破解!在于世界上真正的德州扑克高手面对面切磋时,这个名为“仙王座”(Cepheus)的电脑程序可从不会输,不信你可以自己试试挑战它。

仙王座由芬兰的开发者 Oskari Tammelin 联合由计算机科学家 Michael Bowling 领头的,来自加拿大阿尔伯特大学(University of Albert)的研究组开发的,它的设计初衷就是为了打败所有前来挑战双人限注德州扑克的玩家。研究成果在很多方面都令人惊讶,其中最大的成就就是这个叫做“虚拟条件反悔最小化”("counterfactual regret minimization")的算法。在扑克人工智能领域,虚拟条件反悔最小化(以下将简称为 CRM )指的是电脑程序通过评估分析之前犯的错误而重新校准游戏策略的能力。德州扑克中的重要技巧,也是 CRM 中在最优化游戏策略时用到的一招就是诈唬(Bluffing)。

研究组的另一个成就则是他们的压缩方法(compression method)。在双人对战德州扑克中有 3.16 × 10的17次方种玩家可能碰到的局势以及 3.19 × 10的14次方种玩家需要做出选择的情况。要记录所有这些情况,在过去需要调用大约 262T 的存储空间——研究组将所需存储压缩到了 11T,这让程序真正流畅运行有了可能,只有在这时候算法才能真正帮助计算机实时调整出牌策略。

从每一局的概率上来说,仙王座偶尔还是会输(概率永远都存在,拿到一手烂牌加更烂的公牌,偶尔的败仗是难免的),但从长远来看,仙王座基本都是胜局。援引自《自然》上的文章:

这意味着,德州扑克中的双人限注德州扑克算是被破解了...程序开发者的游戏策略时分接近完美,基本上未来已经没有必要再这上面再做文章了...破解扑克游戏比跳棋之类的难。国际象棋和跳棋是典型的完全信息博弈(perfect-information games),玩家很清楚对手之前的一切动向和目前的局势,而扑克则相反:有很多信息玩家无法掌握,其中最致命的当然就是你不知道对方手中拿着什么牌。博弈论学者和经济学家历年来对这种不完全信息博弈很感兴趣,因为这其中的理论可以解决很多现实问题,比如拍卖场与谈判桌上的最优策略。

卡耐基梅隆大学的计算机科学家 Tuomas Sandholm 说这是目前被破解的最复杂的不完全信息博弈。猛击我可以进入项目主页亲自挑战仙王座!

[keep_beating via io9]


给这篇稿打赏,让译者更有动力
支付宝打赏 [x]
您的大名: 打赏金额:

0.0
赞一个 (14)

TOTAL COMMENTS: 41+1

  1. 2661472

    斗地主我都不会玩,,,

    [144] XX [4] 回复 [0]
  2. 2661473

    煎蛋以前好像写过一个澳大利亚数学教授经常去赌场提款的故事

    [121] XX [3] 回复 [0]
  3. 嗷嗷
    @3 years ago
    2661474

    这只是统计学上的胜利吧,怎么避免人类神抽?(即便仅存理论上的可能性)

    [8] XX [25] 回复 [0]
  4. 一杯酒
    @3 years ago
    2661475

    这个是致富信息吧

    [20] XX [2] 回复 [0]
  5. 2661476

    好了 我们去亚游刷钱去

  6. 2661484

    两台对战会产生黑洞么?

    [246] XX [7] 回复 [0]
  7. 2661485

    @iused:
    是一群澳大利亚数学家开了一家赌场,逃税被查.
    http://jandan.net/2012/07/09/mathematician-gaming.html

  8. 哎呦爷是您呐
    @3 years ago
    2661489

    点击之后:
    Service Unavailable

    The server is temporarily unable to service your request due to maintenance downtime or capacity problems. Please try again later.

    Apache/2.4.7 (Ubuntu) Server at poker.srv.ualberta.ca Port 80

    [20] XX [8] 回复 [0]
  9. 湿太请留步
    @3 years ago
    2661496

    Service Unavailable

    The server is temporarily unable to service your request due to maintenance downtime or capacity problems. Please try again later.
    要挑战这位电脑,我先要战胜矗立在我面前的一道

    [61] XX [11] 回复 [0]
  10. liangzi
    @3 years ago
    2661502

    这个错误应该不是gfw的错。

    [28] XX [1] 回复 [0]
  11. 胖东尼
    @3 years ago
    2661503

    @伊藤开司

  12. 痴汉
    @3 years ago
    2661509

    “……一招就是诈唬(Bluffing)……”有没有感觉到小编害怕被吐槽翻译而惶恐不安的小心灵?

    [16] XX [7] 回复 [0]
  13. 拜一刀
    @3 years ago
    2661517

    @iused: 我已经看了好几遍壳中少女了,现在跃跃欲试想要赌钱←_←

  14. 捂脸
    @3 years ago
    2661526

    @嗷嗷: 不仅是概率啊,还有要不要加注,猜你可能的胜率

  15. 十三
    @3 years ago
    2661528

    我猛击你了 但是
    Service Unavailable

    The server is temporarily unable to service your request due to maintenance downtime or capacity problems. Please try again later.

    Apache/2.4.7 (Ubuntu) Server at poker.srv.ualberta.ca Port 80

  16. OTLorzon
    @3 years ago
    2661530

    如何对付神抽狗协会是这个机器的下一个课题…

  17. 须臾飘渺
    @3 years ago
    2661533

    Cepheus Poker Project
    Details
    Blog
    Preflop
    Strategy
    Play Cepheus
    CPRG
    ……
    能进去但不会玩

  18. 2661541

    拉斯维加斯已经在筹钱购买这个软件了

    [10] XX [2] 回复 [0]
  19. 2661558

    11T,算法还是太差了。人脑存储可差远了,一分钟回想10kb的文字都不可能。

    [11] XX [19] 回复 [0]
  20. 小黑马
    @3 years ago
    2661572

    那两台对这下会怎样?

  21. 萌猫卖萌喵
    @3 years ago
    2661593

    从没懂德州扑克是什么的我路过~~

  22. 勿使惹尘埃
    @3 years ago
    2661598

    @iused: 不可能,赢多了赌场就不让你进门了。

  23. 2661610

    @amaia 你知道人脑的随机读取和快速检索能力有多吊吗,秒所有计算机跟硬盘

    [14] XX [8] 回复 [0]
  24. 恬家小人物
    @3 years ago
    2661613

    电脑都会唬人了,离终结者的剧情不远了。。

    [11] XX [4] 回复 [0]
  25. 2661648

    “程序开发者的游戏策略时分接近完美” 十分接近吧。

  26. 2661675

    “从不会输”? 不可能吧。要是对手每盘一开始就all in, 只要跟了就有一定输的概率。

  27. 2661677

    @勿使惹尘埃:

    看成 不可能,赢多了赌场就不让你出门了。

  28. 2661691

    发现回复的人里没有一个是懂扑克的。。

  29. gooooooog
    @3 years ago
    2661743

    @嗷嗷:

    遇到神抽最多小赌注输一把,德州哪有一把showhand就结束的,又不是电影

  30. ferraripower
    @3 years ago
    2661747

    加拿大ip可以访问

  31. lemonbox
    @3 years ago
    2661755

    不是说必胜吗!那找两个程序互相拼,总有一个赢一个输吧!

  32. cynics84
    @3 years ago
    2661756

    有点意思,看了一下网站这个counterfactual regret minimization算法大体是这个意思:
    The concept underpinning the program that built Cepheus is, in a sense, relatively simple. A ‘dummy’ AI is generated and begins playing poker against a copy of itself, exploring the ways it might play each hand. It then reviews the hands, and every time that it discovers an action it regrets it reduces the frequency with which it takes that action, implicitly increasing the likelihood that it takes some other action.

  33. 费二房东方
    @3 years ago
    2662023

    个人觉得德州扑克的难点是加注过程中的风险控制,说白了就是风险控制。二对二的德州扑克在博弈上来说应该是最容易的,电脑在投注时控制风险也最容易。

  34. BatteryMan
    @3 years ago
    2662094

    没什么了不起的,玩了半个小时我才输给仙王座两套房子。

  35. blu10ph
    @3 years ago
    2662126

    @amaia: @llll: 就是就是,回想文字和定制策略是两码事~

  36. aaaaaaaaaaaa
    @3 years ago
    2662161

    首先我不相信这个研究结果。
    hold’em算概率那些都是很容易的,高手之间的对决就是如何识别对手的策略和避免对手识别自己的策略。
    也就是说,hold’em不是比谁计算的好,而是在斗心,这方面你有再大的数据库也没有。

    其次,即便这个结果真实,这种表述方法也是瞎扯。
    hold’em从根本上说是赌博,运气成分极其重要。
    就算你是赌神,也要大量的局数来抵消运气的成分,所谓“止赢不输”那就不是赌博了。

    最后插一句话,这是limit hold’em,不能一上来就all in的,unlimit 的可能性和围棋差不多,不是现在的电脑有可能解决的。

  37. sophia
    @3 years ago
    2662258

    @amaia: 你不能把人脑跟电脑的传输模式混淆,给你举个例子,你人脑回忆一副图片是多少 KB 呢?回忆一段动态 画面 是多少 MB 呢? 人眼一秒传输多少 TB 像素呢?

  38. ftosimon
    @3 years ago
    2662600

    其实人脑根本不是计算机,也不用二进制,那也就不存在字节。

  39. 美食家18
    @3 years ago
    2662760

    仅以本文敬贺 疑犯追踪第四季下半季强力回归!两个强力AI大战USA

  40. 三坟五典
    @3 years ago
    2662763

    应该可以带谷歌眼睛+仙后座到外面小试身手一番

发表评论


24H最赞