- 竞技币
- 291
- 威望
- 1
- 经验值
- 261
- 竞技币
- 291
- 威望
- 1
- 经验值
- 261
- 注册时间
- 2014-8-1
- 最后登录
- 2015-12-7
|
发表于 2014-8-1 17:11:28
|
显示全部楼层
本帖最后由 南山一只狐 于 2014-8-1 17:14 编辑 2 F4 a5 H6 _' R: J3 b! W* S6 A
# g5 Q' I, a O. J/ i3 i, V
我找了一下,我看到的那几本书,请问在哪一章,哪一节里面是这个例子。
5 a- M2 C+ D5 ^* Y
/ Y; c8 P$ |; {4 i$ _我个人的理解,按照博弈论理论上来说,你的这个例子。
" {) I H) m$ Y. Q实际上存在着若干个nash 均衡:
' }: X; o8 Z2 `3 Z8 B6 {: x1 Y8 A我们可以列出来 玩家1,与玩家1 不同策略的 收益。
6 @; O6 d: P1 h- e& _& b我想尽可能简化所需要用到的数字,更能帮助我们理解。
1 u* P( N' J% L9 h7 `假设底池中有1块钱,我们都剩余10块钱,抽水很重有10%。1 @- d4 Y; ~6 a( g% ?: E9 y& C
我们依然用行动结束后的筹码量作为参考,这个是 will tipton 那本书中介绍的一个参考方法,比较容易让人理解。你既然推荐那本书,你应该也是支持的。
2 b. ]0 ?5 w8 C% O我主要打husng,我忘记抽水到底怎么计算了,我假设 当某位玩家赢下这个底池的时候, 这个底池就被抽掉10%. j6 f# ~, R! W! z: H- j3 O
$ f# k6 [, g1 R那么玩家1 push ,玩家2 fold 。 各自的筹码会变成: ! E; s9 q+ Y1 d$ M/ L
玩家1 = 10+1*0.9 = 10.9, q* v" J9 Z: ^5 N) j
玩家2 = 10
6 F! `' e2 D: o' d7 G' k$ }# i( d1 `. f @" I1 a" ~9 P6 w6 o0 ^/ V9 ]
如果玩家1 push ,玩家2 call 。各自的额筹码量会变成:
- X, X- G1 R6 [ N" c+ [玩家1 = (10 + 10 + 1) *0.5*0.9 = 9.45, l' a4 |; v3 r. c( Y" X
玩家2 = 玩家1 = 9.45
) S. Z' D+ |7 P$ a
7 h" j" X0 `3 u0 d# `8 |$ h如果玩家1 check , 玩家2 push,玩家1 跟注。 各自的筹码会变成:, b" U4 K) d8 S; O
玩家1 = (10 + 10 + 1)* 0.5*0.9 = 9.45' V4 V2 k5 s, y1 F
玩家2 = 玩家1 = (10 + 10 + 1)* 0.5*0.5 = 9.45
) l, E8 g0 ]5 e% H, k
3 @; h! k' \( o
! a$ E! b/ H, b7 m如果玩家1 check ,玩家2 push ,玩家1 fold。各自的筹码会变成:
7 l) @+ C5 {9 }玩家1 = 10+ r1 E- L( N" ^
玩家2 = 10 + 1*0.9 = 10.94 z5 d. ^. J! \" X
' g8 x8 `+ G, H+ M9 H; d- ?如果玩家1 check ,玩家2 check 。 各自的筹码会变成:
& |; x5 m7 {# g6 E玩家1 = 10 + 1*0.5*0.9 = 10.45
# P, X q2 a8 T+ @1 s玩家2 = 玩家1 = 10.45: Y, o- S% @' i# Y9 e, U: a* c
; k! W9 `5 o3 R/ N2 s我们可以把这些收益输入到一些博弈论的相关软件中去找到结果。/ J, z3 V( D& Z
Gambit . 这个东西那位作者也提到过,我们就使用他。
& [ S1 y7 N) j# ?3 h软件模拟后,给出我们8种 nash 均衡:/ T) ~2 ?$ C* L; I
& i' O# e/ ?5 p+ ^
nash 1:6 t! x, |9 O! U6 N- }
: y- ^4 Y8 @2 L7 G
1 [9 C& K; K1 T! ^8 _
8 C/ l" H3 o/ Y1 d# H6 t
nash 2:8 x% B- r1 H# T
/ T# v/ d' l& E* H3 @$ F* c* ?! T$ |1 n1 S* h
4 ~4 e5 }2 J8 T* O* g8 }
nash 3:
; i$ a4 _% {( y3 T8 d" T$ x) A0 P" a+ @7 n
" t& X" B7 X3 K" D9 ^6 X* knash 4:
$ R) B. y4 D6 O' D; D+ f/ s$ f. l% {$ G
, W7 s N' @& B3 [ n' ^nash 5:) J: q7 P+ Y3 M; J0 j4 y8 d
& |" r) o0 U9 R% @8 j! K& l
) i; o; ~: I0 P, j
0 d2 I3 t9 f) ^! t+ @0 E0 p+ c: h3 H
nash 6:
. m: d y0 x+ s* J7 Z* t1 t/ V1 e% T5 H' Y
h8 q6 r' G3 i4 d6 K" V" _# J6 ?- m4 H, v0 N2 z* k0 @
我的论坛权限只能上传这些图片了,7和8 就不传了。
4 C" O7 W* w, Y2 M8 V% c9 g
3 z+ f0 ~: Z3 \) |由于nash 1 与 nash 2 中,玩家1 是不存在check 的,因为他的频率是0% 。 所以他无法计算出,玩家1 check 之后,玩家2 push 的频率。3 D) ~. |% B4 f) i! O% `% V
所以在那个红色的玩家1的面对玩家2push 选择中 call 与 fold 用星号来表示。
+ w7 c0 F. z# g这个是我自己理解的,我自己去google 查了一下,实在找不到答案。如果你对软件方面研究比较透彻麻烦告诉我一下。
' ]/ H8 U. |1 G+ C2 Z# o v) @3 @# O& H1 Z) J! V6 s. [+ x' L
出现多个 nash 均衡我并不觉得奇怪,因为 一些 博弈论专业的课程中的很多例子,都是存在多个均衡的。
[4 V) g, ~2 T% w A/ t我想你也是知道的。
) I1 j5 a5 z! ^$ Y( j V# d1 O3 j' K! |& d" r* e
而且你例子中的这个玩具游戏本身,就是这样。长期 run 下去,是会有人开始调整的。不可能永远处于一种均衡。
/ f' O3 X# t ]) z# U( |& W6 |8 e) g% T/ |# b
我想请问你,如何看待这种多均衡。7 M6 G$ ^- R6 U( g
你是否依然坚持,书中作者所说的观点。
$ f: V. U1 X7 z9 _: O他所指的那里是GTO了。 就一定是GTO了。
0 s3 p' l, o5 F) h7 R: \7 R0 j G, t7 b, L/ W
因为,我想到了一点,既然我们在现实游戏中的对手,在面对我们抢先 push 以后, 绝大部分的时候,都会 call 的。! c. M( t. L3 u1 I# U8 P
那为何,玩家1,还会依然毫不犹豫的 push ,去坚信这就是GTO策略,就一定要这样做。
' d' V3 T4 Y1 V4 a6 L
; o1 F/ E& v3 i我想,你既然写了那么多东西,思考的如此深入,你有没有想过你自己举例的问题中的这些反例,并用相关的软件去模拟。! F4 B" D& W/ I3 X$ C- H' G* Y( v* f
或者自己做一些手工的数**算。7 }, m7 t7 I$ ~$ W& K/ H% X
" W: Z/ X& i# d1 `另外人工智能在扑克中的应用究竟是什么 能否科普一下。* ]( J* `9 ]) W8 @' I4 z" F: m
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|