+ z8 \4 p I" t, J1 Y+ X; ]' Z
; l2 _/ i* n. [+ h6 c- v- Y
4 S( O6 _. R6 r8 P星期一对参加人机对战的玩家而言又是失败的一天,不过好消息是终于结束了。 ( U% P3 ^4 Z' ]9 I) s9 T/ W6 z3 @6 h
在12万手牌之后,Carnegie Mellon(卡耐基梅隆)大学研制的人工智能Libratus在和人类玩家的对局中赢得了1,776,250筹码,不过人类玩家还是获得了他们与有史以来最强扑克AI对战的报酬:瓜分20万美元。 ! s6 z$ |3 Q* ?, M9 x* p
人类队员之一、职业牌手Jason Les在赛后的一次采访中开玩笑说:“我们没得到钱。我曾经想过有很大可能会输,但是我想的结果应该是双方差距比较接近。这真是人工智能历史性的一天。”
5 a4 p# p" Y5 h
Les输掉了880,097,是人类玩家之中战绩最差的。Jimmy Chou则是水下522,857,而Daniel McAulay 输掉了277,657,在20天的历程中亏损最少的Dong Kim输掉了85,649筹码。
8 ^- w% L5 F5 z& ~4 s
“我们真的被击败了” McAulay说。 170万筹码也就是1.7万个大盲,也就是每100手输掉14个大盲,接近90个买入,人类玩家和AI对战的初始筹码是2万,也就是200个大盲。
* q2 e. y' v& L3 ^
Libratus的设计者是Sandholm和他的博士生Noam Brown。 “单挑无限德州是难以捉摸的。” Sandholm在接受采访时说。“这是人工智能游戏的一个里程碑。” “职业扑克玩家是真的运动员。” Sandholm在接受采访时说。 在每天的对战结束之后,玩家团队会在一起讨论战术,试图发现Libratus的弱点。遗憾的是他们并没有发现太多。 Libratus也在自我进化,每天人类玩家都会发现人工智能比前一天变得更强。 “他从我们这里学习,而且第二天我们发现它之前的弱点消失了。” Chou说。 之前的人工智能Claudico在2015年输给了人类玩家, 当时人工智能输掉了7300大盲,不过这个结果被认为是“统计学意义上的平局。” Sandholm称今年的结果 “非常令人满意。”
" ?/ R. W, O" s5 B
: R# v- t4 x- h- ~
“从AI研制的早期开始,打败人工智能就是衡量成败的重要标准。” Sandholm说。“1997年是国际象棋,当时是深蓝!去年是阿尔法狗。相比之前的项目扑克是一个更加困难的项目,他需要一台能够进行极度复杂运算的计算机,而且这些计算是基于不完全信息作出的,通过运算来比较诈唬,慢玩以及其他行动的优劣。”
8 c$ R4 {% q* x) s( J
尽管Libratus可以在200大盲的无限德州扑克单挑中战胜人类,但是还不能在增加玩家的对局中解决问题,而在超过200大盲的对局中,情况又会变得完全不一样。 Libratus使用了一种十分平衡而且有效的河牌超底池下注策略,他们的超底池下注中诈唬和价值做的非常好,总是让人类玩家疑惑。 0 e# l2 G' h" I. G* e; x
因为AI的研制和运行花费了数百万美元,线上玩家还不应该担心类似于Libratus会很快影响他们的线上扑克体验。而且线上扑克公司对抗机器人的监测系统非常复杂。还有,在牌局进行到后面一些街,人工智能的思考时间会比较长,这在真实的线上扑克中是不允许的。 # t) h8 v+ H7 a/ `$ e# {) L# e2 m
: x6 w7 f* W5 M5 d" u4 t( g& H |