@ 2021.03.13 , 22:23

脑力小体操:国际象棋特级大师的6张牌puzzle

上一期 股票下车的最佳时间点和扑克游戏

将一副(52张)纸牌混洗,然后面朝下放在桌子上。一张一张地翻转。

规则:

如果出现黑牌,您将赢得$ 1.00;

如果出现红牌,您将损失$ 1.00。

您无需花钱就可以开始游戏,可以随时叫停拿钱走人。现在的问题是,为了最大获利,您有啥最佳的停止策略吗?

答案

最先给出结果的wwt

动态规划:f[i][j]表示剩余i张黑牌j张红牌最优策略下期望能获得的收益,则有f[i][j] = max(0, i / (i+j) * (1 + f[i-1][j]) + j / (i+j) * (-1 + f[i][j-1])),即选择跑(收益为0)或跟(收益为期望值)。计算得f[26][26] = 2.624476

非常细心,把各个回复里的方案统统模拟了一遍的 鱼鱼鱼葱卷

我总结下吧。#28 的 simulate 函数可以模拟上述所有策略(除了出千):

一、只在第一张是黑牌时跑(#23):simulate(n, (1:52) .< 2),期望收益是 0.50 元。 二、有赚就跑(#1、#3、#9):simulate(n, (1:52) .< 52),期望收益是 0.96 元。 三、翻完第 13 张黑牌且有赚时跑(#7):simulate(n, max.(0, 26 .- (1:52))),期望收益是 1.66 元。 四、赚够 4 元就跑(#6,在 #11 修正):simulate(n, ((1:52) .< 52) * 4),期望收益是 2.18 元。 五、赚够 4 元或剩余黑红比例小于 3:4 时跑(#26),期望收益是 2.50 元。 六、#8、#11–12、#15 的策略(三者等价),期望收益是 2.62 元。 出千(#22)也是个有趣的策略。我把这个理解为透视眼,直接在最大值处停下。用 sum([maximum(cumsum(shuffle(deck))) for i = 1:n]) / n 计算,期望收益是 4.04 元。要是厉害到能换牌,那就保证能赚 26 元了。


《智者为王》第三季,小明和小红杀入年度决赛。两人比分非常接近,下一局任何一位拿到100分就能赢下年度冠军。

主持人抽到了下一轮的竞技游戏。

规则如下

桌面上一共扣有6张卡片(背朝上)。卡牌正面是数字1-6。双方每人选一张(按两人积分大小排先后)。

开牌之后,数字大的一方获胜。赢家积分+100——等于直接夺冠。当然,这里还有个特殊的规则。

两个选手面前有用来答题的数字板。抽到牌后,数字答题板会出现一个交易按钮。在45秒的思考时间内,任一方可以点击交易,提出交换双方手牌。另一方可以点确定,也可以点击拒绝。如果点击确定,则双方手牌就会被交换——然后就直接开牌比大小。

现在实际局势如下:

小明抽到了2!

然后在45秒的分析时间内,小红提出了交易。现在问:如果你是小明,你会点击同意吗?

ps 前两天先在往期ted上看到国际象棋大师Maurice Ashley提出了这个问题,然后又在微博上看到了…上天在反复提示我用这个…YouTube上一位著名的数学科普作者Presh Talwalkar说,这个问题集中展示了博弈论为什么不是概率论。

赞一个 (12)