中扑网cpf德州扑克论坛

 找回密码
 注册

中扑网商城软件购买书籍获取竞技币
扑克学院扑克视频竞技币充值

德州扑克新手入门游戏休闲中心
看穿底牌别对我说谎无限德州扑克理论与实践
职业牌手训练指南网页版扑克赔率计算器

德州扑克资料区意见反馈
天天德州德堡扑克
联众德州扑克口袋德州扑克

查看: 5081|回复: 10
打印 上一主题 下一主题

[求助] 关于纳什均衡的一些问题

[复制链接]

11

主题

170

帖子

413

积分
竞技币
1009
威望
0
经验值
413
注册时间
2013-1-16
最后登录
2017-6-3
QQ
跳转到指定楼层
庄家
发表于 2014-8-3 10:15:42 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
最近论坛关于GTO讨论得很激烈,然后去百度了下纳什均衡。下面是百度出来的一个例子。大家先来看一下吧。$ `5 j# p- t& R4 `7 z" c0 o
你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?& I. |" P8 I# T& ^
每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。
  q  g7 ~2 p. o3 S( s% {$ }/ x1 a) P
你\美女/ a- ~9 V( U! e8 A
美女出正面- T" {7 W9 f- y: t7 W$ ]
美女出反面' |1 a5 B/ N, [
你出正面
$ w; A' o/ A( V4 i
+3,-36 ~( N; S% C5 F: r% d0 F5 W6 v0 \- S" s
-2,+2
+ E2 {( l( G( g3 m6 k- o  p$ z: b' V; J
你出反面
: c% F) D8 K- v5 l+ e: G
-2,+2
# ~, R1 C& m$ c4 K/ k- y
+1,-1, _) a) G& z4 [$ S
假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由此列出方程就是
  g) t% P; O+ h# x: j6 S- H3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
- J* i1 Q, M* p3 W解方程得x=3/8。8 u& z9 z( n  X/ n( L6 w
同样,美女的收益,列方程+ U+ C% c# R7 R
-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)
9 P/ ], s( ~- f/ v+ q解得y也等于3/8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。
4 Q7 w! |, Z! f9 P" [其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。
* |( v+ o/ y4 Q9 G# X
; E* U' h& v8 ?% w/ N. W) H+ O6 @; o* S2 ?$ C+ C: \
我的问题是当美女采取了(3/8,5/8)这个方案,我们是不是真的不能获胜了呢。如果扑克对手抓住了,3,5这么一个类似的平衡点,我们是不是只能避开他?想法很多,写得很乱。欢迎大家来一起讨论。$ b! Y/ I6 P# D: j; W; f" S2 h+ Q

* Z- D9 X9 |$ Z/ w0 L+ o5 C$ X# a

20

主题

527

帖子

797

积分

竞技币
1873
威望
0
经验值
797
注册时间
2014-3-6
最后登录
2015-8-31
小盲注
发表于 2014-8-3 11:07:31 | 只看该作者
纳什均衡应该就是这个意思,每一方都采取无论对方什么选择,对自己来说都是最优的选择策略,这样双方就会都在多次博弈里找到那个均衡点。

21

主题

352

帖子

1325

积分

竞技币
2349
威望
0
经验值
1325
注册时间
2010-10-12
最后登录
2017-10-13
大盲注
发表于 2014-8-3 11:23:18 | 只看该作者
楼主是学霸 鉴定完毕

11

主题

170

帖子

413

积分
竞技币
1009
威望
0
经验值
413
注册时间
2013-1-16
最后登录
2017-6-3
QQ
枪口
 楼主| 发表于 2014-8-3 12:50:07 | 只看该作者
xuefengxx 发表于 2014-8-3 11:07  M# w) ^( W" N1 D9 O
纳什均衡应该就是这个意思,每一方都采取无论对方什么选择,对自己来说都是最优的选择策略,这样双方就会都 ...
8 O' k/ k3 q- }
问题在于我们打扑克是需要赢啊,GTO,不输不赢,输反水肯定不是我们想要的结果吧、当你发现对手有偏移漏洞的时候,你势必要采取压榨打法,才能产生利润吧。那时候对于其他的reg来说,你的策略也出现了偏移。就像石头剪刀布,或者硬币一样,最后演变得还不是人跟人,除非就是HU?不太懂。。

11

主题

170

帖子

413

积分
竞技币
1009
威望
0
经验值
413
注册时间
2013-1-16
最后登录
2017-6-3
QQ
5
 楼主| 发表于 2014-8-3 12:52:01 | 只看该作者
我的意思,简单来说,当美女用3.5这个策略的时候,他的对手马上意识到了,然后刚好用相反的,不是每把都赢?到那时候,美女又应该怎么办?

20

主题

527

帖子

797

积分

竞技币
1873
威望
0
经验值
797
注册时间
2014-3-6
最后登录
2015-8-31
6
发表于 2014-8-3 13:01:45 | 只看该作者
kdurrr 发表于 2014-8-3 12:50
$ Z* J* q4 Z4 _! F问题在于我们打扑克是需要赢啊,GTO,不输不赢,输反水肯定不是我们想要的结果吧、当你发现对手有偏移漏 ...

8 Z1 U4 i, I/ c7 h. E我也不太懂,只是理解些基本概念,也看过极简化的扑克模型经过数**算得到的均衡策略而已,顶多只是个思路,具体到德州怎么找到这个均衡不得而知。
. F0 A; C! Z+ X5 b
& O' V) D% i  o- R7 O但我的理解是,随着扑克水平的普遍提高,有一天所有的对手都博弈到基本不犯错误,每个人都找到首先立于不败之地的策略时,那时候真的均衡了。% x+ _" G& r2 f6 v
( A, e* e* p6 o7 w+ y& L
我认为这种境况不可能发生,但掌握这个策略率,遇强不输,遇偏离就去挤压。
2 ~! M- e9 {" v! K4 m$ l2 p; d& ^& t5 z; s
) F! L, v$ E9 h& w& r扑克确实可以演化到极度策略均衡吧。  x, U7 F: v/ y2 w
( d9 o+ `- u" ?7 g$ }9 w2 P
我现在还是输输赢赢呢,这只是自己理解的GTO
, @% R8 Q) T3 F2 H# A% [# Y
- P& _6 j5 W% V, h8 b' Z0 d9 s( T1 \3 j/ b7 u; C$ l
  l. I  a2 a' g1 z; }/ w

20

主题

527

帖子

797

积分

竞技币
1873
威望
0
经验值
797
注册时间
2014-3-6
最后登录
2015-8-31
7
发表于 2014-8-3 13:10:10 | 只看该作者
本帖最后由 xuefengxx 于 2014-8-3 13:20 编辑 : K6 G! L# I; s; j8 D* @% E# c. s, U
kdurrr 发表于 2014-8-3 12:52
5 I7 j2 A' Y" T: E" b% v我的意思,简单来说,当美女用3.5这个策略的时候,他的对手马上意识到了,然后刚好用相反的,不是每把都赢 ...

3 n) b5 T- ?2 p& A0 Q" s& Q把纳什具体应用到德州不得而知,但纳什均衡是一个确定占有策略,是不管对手如何变化,预期收益都绝对稳定的选择,在不断反复博弈中,对手也必然会选择相应的测率。  感觉上到这境界已经是程序化的出牌了。
/ M& ?0 b) R) W' @你的例子里美女要是采用了这个策略,那结果就像1+1永远等于2那样结果确定了。
" h" r7 n9 a1 @) T' b# q" u, t; u8 U( i3 L
当然美女是人,有血有肉有欲望活,会有失误,会有TILI.当对手不按相应的策略应对,她可以有很多调整吧。  
' x! L6 }' S2 h  a# Y1 q' q2 C9 u9 ?* _( k& r; p
纳什均衡不是一定会赢,定义是绝对稳定的博弈结果——
/ M. M4 G  T# ]6 j+ n; f- r# ^1 Z0 @# p
这不是也等着,高手们再往下细说呢。# E* q9 V6 ^1 H' v3 Z' h  X
1 _! U. `* R: e5 p& u+ h

11

主题

170

帖子

413

积分
竞技币
1009
威望
0
经验值
413
注册时间
2013-1-16
最后登录
2017-6-3
QQ
8
 楼主| 发表于 2014-8-3 13:22:51 | 只看该作者
xuefengxx 发表于 2014-8-3 13:10
+ u! g7 {$ `; w. ?7 J2 b" K把纳什具体应用到德州不得而知,但纳什均衡是一个确定占有策略,是不管对手如何变化,预期收益都绝对稳定 ...

3 c' v- l1 M7 |3 N+ U简单来说,。如果GTO是面对其他所有策略不输不赢,我们现在假设扑克上所有对手的策略(reg fish都包括),你都做到不输不赢,然后,你就输了反水。。。。?。你面对其他的选手,做出偏离,就不再是GTo啦。

10

主题

122

帖子

261

积分
竞技币
291
威望
1
经验值
261
注册时间
2014-8-1
最后登录
2015-12-7
9
发表于 2014-8-3 13:25:51 | 只看该作者
本帖最后由 南山一只狐 于 2014-8-3 13:27 编辑
5 X1 c" ]# E  O' L! o6 c6 x) G
+ @* V) a1 e' C是啊,你不能获胜,因为你这个游戏的模型,就是一方有优势的。但是,在这个例子中,当你把的损失降低到最小的时候,也是一种变相的赢了。你至少战胜了自己。

20

主题

527

帖子

797

积分

竞技币
1873
威望
0
经验值
797
注册时间
2014-3-6
最后登录
2015-8-31
10
发表于 2014-8-3 13:28:05 | 只看该作者
本帖最后由 xuefengxx 于 2014-8-3 13:36 编辑 4 H" c' B; k. G9 t: X: M4 n
kdurrr 发表于 2014-8-3 13:22
, c8 k# ^; m3 ?" p$ R简单来说,。如果GTO是面对其他所有策略不输不赢,我们现在假设扑克上所有对手的策略(reg fish都包括) ...
! o. V6 d: ?* }$ _
我认为要是把GTO定义的狭窄的话,应该是的. Y3 a9 N! R: a6 f% z; g/ {
GTO对GTO结果应该永远已经确定 1 M) E1 `" ?& I) U3 A. t0 R) i

1 q% y8 T  ~7 A: O- H相互偏离,博弈无绝胜,谁赢谁输就不确定了
5 ~! r' X" `# I% P/ S-----------$ Z/ x0 M2 i  V2 X* B: Q
我不能理解的是,德州牌型组合那么多,即使有GTO策略。毕竟是人脑怎么做到,大量的记忆,坚决的执行,不可以想象。。。
. v) \% q0 A8 s! D& q; d9 k& F) `! K+ z
智商捉急,静等下文
. z" g; q# X" E

17

主题

192

帖子

398

积分
竞技币
764
威望
0
经验值
398
注册时间
2014-4-10
最后登录
2015-7-26
11
发表于 2014-8-3 20:59:10 | 只看该作者
恩,看了以上讨论又对扑克恢复乐观了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

重要通知!!上一条 /7 下一条

QQ|小黑屋|Archiver|中扑网cpf论坛 ( 桂ICP备18004948号-4 )

GMT+8, 2024-5-3 03:27 , Processed in 0.089400 second(s), 23 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表