人工智能在单挑无限注德州扑克中击溃人类玩家

人工智能在单挑无限注德州扑克中击溃人类玩家

星期一对参加人机对战的玩家而言又是失败的一天,不过好消息是终于结束了。

在12万手牌之后,Carnegie Mellon(卡耐基梅隆)大学研制的人工智能Libratus在和人类玩家的对局中赢得了1,776,250筹码,不过人类玩家还是获得了他们与有史以来最强扑克AI对战的报酬:瓜分20万美元。

人类队员之一、职业牌手Jason Les在赛后的一次采访中开玩笑说:“我们没得到钱。我曾经想过有很大可能会输,但是我想的结果应该是双方差距比较接近。这真是人工智能历史性的一天。”

Les输掉了880,097,是人类玩家之中战绩最差的。Jimmy Chou则是水下522,857,而Daniel McAulay 输掉了277,657,在20天的历程中亏损最少的Dong Kim输掉了85,649筹码。

“我们真的被击败了” McAulay说。

170万筹码也就是1.7万个大盲,也就是每100手输掉14个大盲,接近90个买入,人类玩家和AI对战的初始筹码是2万,也就是200个大盲。

Libratus的设计者是Sandholm和他的博士生Noam Brown。

“单挑无限德州是难以捉摸的。” Sandholm在接受采访时说。“这是人工智能游戏的一个里程碑。”

“职业扑克玩家是真的运动员。” Sandholm在接受采访时说。 在每天的对战结束之后,玩家团队会在一起讨论战术,试图发现Libratus的弱点。遗憾的是他们并没有发现太多。

Libratus也在自我进化,每天人类玩家都会发现人工智能比前一天变得更强。 “他从我们这里学习,而且第二天我们发现它之前的弱点消失了。” Chou说。

之前的人工智能Claudico在2015年输给了人类玩家, 当时人工智能输掉了7300大盲,不过这个结果被认为是“统计学意义上的平局。”

Sandholm称今年的结果 “非常令人满意。”

“从AI研制的早期开始,打败人工智能就是衡量成败的重要标准。” Sandholm说。“1997年是国际象棋,当时是深蓝!去年是阿尔法狗。相比之前的项目扑克是一个更加困难的项目,他需要一台能够进行极度复杂运算的计算机,而且这些计算是基于不完全信息作出的,通过运算来比较诈唬,慢玩以及其他行动的优劣。”

尽管Libratus可以在200大盲的无限德州扑克单挑中战胜人类,但是还不能在增加玩家的对局中解决问题,而在超过200大盲的对局中,情况又会变得完全不一样。

Libratus使用了一种十分平衡而且有效的河牌超底池下注策略,他们的超底池下注中诈唬和价值做的非常好,总是让人类玩家疑惑。

因为AI的研制和运行花费了数百万美元,线上玩家还不应该担心类似于Libratus会很快影响他们的线上扑克体验。而且线上扑克公司对抗机器人的监测系统非常复杂。还有,在牌局进行到后面一些街,人工智能的思考时间会比较长,这在真实的线上扑克中是不允许的。

扑克资讯 ,版权所有丨如未注明,均为原创丨,转载请注明本文固定链接
喜欢 ()or分享