- 竞技币
- 291
- 威望
- 1
- 经验值
- 261
- 竞技币
- 291
- 威望
- 1
- 经验值
- 261
- 注册时间
- 2014-8-1
- 最后登录
- 2015-12-7
|
本帖最后由 南山一只狐 于 2014-8-1 17:14 编辑
% a# `5 q t3 }* N: L8 v8 g3 x/ v5 A- N
我找了一下,我看到的那几本书,请问在哪一章,哪一节里面是这个例子。
! z$ W: G5 R p& d3 K% [, w
0 w: h: A l0 S( q* I8 l我个人的理解,按照博弈论理论上来说,你的这个例子。
6 L! q3 O: j ~实际上存在着若干个nash 均衡:0 D* u; H e) [! Z
我们可以列出来 玩家1,与玩家1 不同策略的 收益。7 U7 ]' O/ T- b# M0 S' m
我想尽可能简化所需要用到的数字,更能帮助我们理解。" b5 v$ d" p/ e- G% m% J" P
假设底池中有1块钱,我们都剩余10块钱,抽水很重有10%。, l9 q% |# T T
我们依然用行动结束后的筹码量作为参考,这个是 will tipton 那本书中介绍的一个参考方法,比较容易让人理解。你既然推荐那本书,你应该也是支持的。8 ]7 w" I, E+ c
我主要打husng,我忘记抽水到底怎么计算了,我假设 当某位玩家赢下这个底池的时候, 这个底池就被抽掉10%
! [; l' A9 X9 L+ t% c4 R. d
/ D( j$ ?% ]# ?4 K那么玩家1 push ,玩家2 fold 。 各自的筹码会变成: g. x2 K) c6 C- P1 Y
玩家1 = 10+1*0.9 = 10.9- ?! ]1 i: F; j ~) V: `
玩家2 = 10
) `- B) {9 K& y, f4 S- o( F, N
3 M' A; Y0 z- ]1 r如果玩家1 push ,玩家2 call 。各自的额筹码量会变成:, L x5 [; ?( A* |3 X
玩家1 = (10 + 10 + 1) *0.5*0.9 = 9.45
2 t4 S! g; c+ ]" y8 U0 o5 f1 k玩家2 = 玩家1 = 9.45; {, w: h7 m, B8 n' L( k0 [) t
' Z' E5 Z& Y; X
如果玩家1 check , 玩家2 push,玩家1 跟注。 各自的筹码会变成:% F- `! z: y6 i x
玩家1 = (10 + 10 + 1)* 0.5*0.9 = 9.456 B2 ~* A7 f) r. n
玩家2 = 玩家1 = (10 + 10 + 1)* 0.5*0.5 = 9.45+ J J, z! z9 J3 ]
( l7 V* [/ M0 i ^, F
5 B) ^, Q4 B! }! t, C
如果玩家1 check ,玩家2 push ,玩家1 fold。各自的筹码会变成:
[* E+ Y6 J/ I玩家1 = 10; b7 j, V8 M" ]
玩家2 = 10 + 1*0.9 = 10.9
4 I' M2 ]7 y/ z2 y! _' n9 r6 ]
8 A# r& _4 l7 G- \3 `* _; }如果玩家1 check ,玩家2 check 。 各自的筹码会变成:
4 {* }. A& g8 K0 y" f5 L L玩家1 = 10 + 1*0.5*0.9 = 10.45, @; x' [8 p( Q
玩家2 = 玩家1 = 10.45
, l- u/ n n2 H! U& K( s
1 m5 n: J- h9 k- s5 b3 X我们可以把这些收益输入到一些博弈论的相关软件中去找到结果。
& d, u! e4 G) R# M0 lGambit . 这个东西那位作者也提到过,我们就使用他。
1 z* L3 k" H6 f3 l0 c软件模拟后,给出我们8种 nash 均衡:
% T+ g* l+ `% B+ t, w; t* o/ {6 }8 t4 J. ~7 n
nash 1:8 e% K9 c- b3 r
( M. L- n2 `) h' w
" F! `- K& q9 S5 g$ U1 r1 P7 z$ t& y A8 p1 t% X8 [; U
nash 2:( F9 F! \1 u6 m, R: P/ S1 H a( K
+ p7 c& }$ z6 Z' B/ a4 n V
* ]; g+ r0 x3 f: @$ T$ `/ \
" a- W6 ~) `; k) Hnash 3:
# {9 m( o2 }3 i# k: l. X u$ k; U% z0 c/ e8 K, c
7 V7 d6 a. v; R+ r/ |* W: z) C
nash 4:
8 V) S* C% [7 _ Q, y
& W6 ]. u& b. H& `8 O$ |# d$ D4 q6 S5 B" `
nash 5:5 q- F8 r& p/ g0 h7 `2 B
4 F' R5 G) a6 w8 d, `6 n' W g
+ W# o5 \7 V- G; J. V& x6 S
& ^; }# o1 C- o, ^; d/ j
/ K4 \! c$ s1 ~nash 6:
1 e p. x3 e2 s1 a$ x1 w! g/ }6 T4 z6 ]
* b: U' e3 H+ R. Z) J$ K
3 m2 ]; l. D* Q% r; ?3 ?4 Y我的论坛权限只能上传这些图片了,7和8 就不传了。
2 A9 N: G7 Y+ O# h+ h$ f. R) d7 H7 F
' q/ ?4 O% A, [. T& h* V4 i由于nash 1 与 nash 2 中,玩家1 是不存在check 的,因为他的频率是0% 。 所以他无法计算出,玩家1 check 之后,玩家2 push 的频率。
3 P+ l, e1 ^2 x3 D- e& h所以在那个红色的玩家1的面对玩家2push 选择中 call 与 fold 用星号来表示。
. ]! |+ w' T3 N' i# L这个是我自己理解的,我自己去google 查了一下,实在找不到答案。如果你对软件方面研究比较透彻麻烦告诉我一下。
# m0 V7 v! L& A9 ]& Z
; L! n7 x# k. K) A6 Q出现多个 nash 均衡我并不觉得奇怪,因为 一些 博弈论专业的课程中的很多例子,都是存在多个均衡的。4 r8 Q3 V! t) T( a( l* b. R1 q
我想你也是知道的。4 e* d9 g, _0 V& V
9 T& D: ~0 }9 E& C7 l
而且你例子中的这个玩具游戏本身,就是这样。长期 run 下去,是会有人开始调整的。不可能永远处于一种均衡。1 W; c. \- V2 H- p& ~" ^
( _9 Y) t: o, z
我想请问你,如何看待这种多均衡。6 W1 c, b! i% n( B: a1 E8 x( p
你是否依然坚持,书中作者所说的观点。
% h. s" Y% ?+ P, Z" Q/ L他所指的那里是GTO了。 就一定是GTO了。
' I" z/ b4 l- [' |1 ^0 l% T
2 |3 C+ z7 w. G8 r/ D% L" g9 j因为,我想到了一点,既然我们在现实游戏中的对手,在面对我们抢先 push 以后, 绝大部分的时候,都会 call 的。
2 N0 W2 @ _) U" U那为何,玩家1,还会依然毫不犹豫的 push ,去坚信这就是GTO策略,就一定要这样做。; u( J w. L8 @/ _
+ T; g$ G6 x. h8 o
我想,你既然写了那么多东西,思考的如此深入,你有没有想过你自己举例的问题中的这些反例,并用相关的软件去模拟。
' o! I, k( o' X" D- x或者自己做一些手工的数**算。
9 e' r* D7 K; k; @, P, m& w3 D4 w4 c
另外人工智能在扑克中的应用究竟是什么 能否科普一下。+ j* Q+ w3 ^5 h z0 d6 J8 w
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|