- 竞技币
- 1009
- 威望
- 0
- 经验值
- 413
- 竞技币
- 1009
- 威望
- 0
- 经验值
- 413
- 注册时间
- 2013-1-16
- 最后登录
- 2017-6-3
|
最近论坛关于GTO讨论得很激烈,然后去百度了下纳什均衡。下面是百度出来的一个例子。大家先来看一下吧。$ `5 j# p- t& R4 `7 z" c0 o
你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?& I. |" P8 I# T& ^
每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。
q g7 ~2 p. o3 S( s% {$ }/ x1 a) P你\美女/ a- ~9 V( U! e8 A
| 美女出正面- T" {7 W9 f- y: t7 W$ ]
| 美女出反面' |1 a5 B/ N, [
| 你出正面
$ w; A' o/ A( V4 i | +3,-36 ~( N; S% C5 F: r% d0 F5 W6 v0 \- S" s
| -2,+2
+ E2 {( l( G( g3 m6 k- o p$ z: b' V; J | 你出反面
: c% F) D8 K- v5 l+ e: G | -2,+2
# ~, R1 C& m$ c4 K/ k- y | +1,-1, _) a) G& z4 [$ S
| 假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由此列出方程就是
g) t% P; O+ h# x: j6 S- H3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
- J* i1 Q, M* p3 W解方程得x=3/8。8 u& z9 z( n X/ n( L6 w
同样,美女的收益,列方程+ U+ C% c# R7 R
-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)
9 P/ ], s( ~- f/ v+ q解得y也等于3/8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。
4 Q7 w! |, Z! f9 P" [其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。
* |( v+ o/ y4 Q9 G# X
; E* U' h& v8 ?% w/ N. W) H+ O6 @; o* S2 ?$ C+ C: \
我的问题是当美女采取了(3/8,5/8)这个方案,我们是不是真的不能获胜了呢。如果扑克对手抓住了,3,5这么一个类似的平衡点,我们是不是只能避开他?想法很多,写得很乱。欢迎大家来一起讨论。$ b! Y/ I6 P# D: j; W; f" S2 h+ Q
* Z- D9 X9 |$ Z/ w0 L+ o5 C$ X# a |
|