中扑网cpf德州扑克论坛

 找回密码
 注册

中扑网商城软件购买书籍获取竞技币
扑克学院扑克视频竞技币充值

德州扑克新手入门游戏休闲中心
看穿底牌别对我说谎无限德州扑克理论与实践
职业牌手训练指南网页版扑克赔率计算器

德州扑克资料区意见反馈
天天德州德堡扑克
联众德州扑克口袋德州扑克

查看: 66574|回复: 138
打印 上一主题 下一主题

技术哥教你玩GTO之基础篇

  [复制链接]

16

主题

116

帖子

720

积分

竞技币
1012
威望
49
经验值
720
注册时间
2014-7-30
最后登录
2017-1-4
跳转到指定楼层
庄家
发表于 2014-7-30 14:38:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 技术哥 于 2014-7-30 14:47 编辑 , n( z7 ]+ n6 ?0 a, ^/ ]
8 X3 A1 S6 q7 l+ j9 S5 f2 }! u
技术哥专注智能扑克多年。给大家分享一些自己的心得,包括该领域一些最前沿的动态的进展如果看完能学到哪怕一点有用的知识。点个赞。
/ I  ^* h6 {# Y7 u% S3 Y% w
0 _. v7 A. w- |: B8 ~" g文字基本是平民语言,尽量让大家懂。有问题尽量回答。) l) P' s9 F% T8 P. f
3 q2 d0 b6 V& s& i) R
GTO的领域内容很多。分4个主题来写帖子,基础篇,SNG, CASH,  人工智能
" I2 P' s: v! C$ J6 {; B2 g3 f( ]3 i9 B0 C9 i
=================2014年7月30号====================# E$ \) ]6 b" Q6 u6 ~  r- m
1 I0 n' _$ A6 T- O
GTO(Game TheoretiCALLy Optimal) :  传说中最优游戏策略。 但不是最好的。。。为什么叫最优呢?相对于你老是输钱来说。它确实最优。。因为它能让你不输钱。     那什么是最好的策略:EO(Exploitatively Optimal) 压榨性策略。1 m' Q1 s) |3 o7 o

  Q% ?/ h9 g- t凡是有动态博弈的地方就会存在Nash(纳什均衡),德州扑克是个典型。 GTO就是指的动态博弈中的纳什均衡策略。这是个防守策略,永远可以让你不输,也不赢^^.2 O/ m9 K2 F9 O$ C) X1 W

1 j4 G' Z1 b- l8 P; C+ TGTO最典型的例子就是 石头,剪刀,布的游戏,当你做到真正随机的出1/3,石头,1/3,布,1/3,剪刀的时候,玩足够多的盘数,你不会输也不会赢。
6 x$ p, I7 S7 {0 m% h& t' n9 Q但是....... 还有种叫 序列石头剪刀布的游戏。就是每次游戏,总有一个人先出,一个人后出。后出的有明显的优势。可以依据第1个人的行动而行动。 所以就算第1个人采用随机1/3的nash策略。他也死定了。。。这个更像德州扑克的cash, 现金桌的就是序列的。。总有个人先出牌。 后出牌的人有位置优势。
/ K  g" r( o/ J  c: H
: i. R9 h! Z3 e& `! R! a再看个游戏:2个开车的在一条路上 相向而行。 都往前冲(push),最后两人撞死。谁先停( fold ),谁就丢脸。。 我们规定下2个开车的,让有个人先行动。一个人后行动。 这个就很像SNG了。这个和石头剪刀布(cash)的游戏不一样。 cash是个零和游戏。而这个SNG,赢的不能获的输者的全部。 所以单纯的SNG是有没 nash均衡策略的。 sng的nash均衡是建立在icm的基础上。所以大家玩sng说的nash范围,是指icm-nash的正ev范围。" z* R9 Z+ Q0 G, J- |/ g

: m7 F( |( m$ `' Y那么有人要问:在sng中,比如最简单的hyper-sng中,我完全按照 ICM-NASH 的正EV范围来打。稳定盈利么? 很多人都相信,82也相信。 不幸的是....我以前也相信。虽然一直有怀疑。。3 X' f# L; b1 ?1 Z: J: f' Q9 L  o( O
                        答案是:hyper-sng的 纯nash打法。只能保证你不输。但是也不能赢。会输给抽水。 如果你采用nash的正ev范围打法,就算你有个对手每次只用AA和你all-in,或者盘盘都是用100%的牌all-in你。。。长期下来你们都不输不赢。但是盘盘被抽水。不过。利润还是有。来自哪里??  来自其他玩家的ICM-泄漏。  如果其他的对手比较菜,不明白ICM-的泄漏。。极端的情况。另外8个猪一样的对手一开始就同时all-in了。ICM的泄漏自动增加了你的EV. 这就是纯nash打法唯一的利润点。。并且这个利润要大于抽水才行。中高级的sng.多少懂点icm, 只有低级别的玩家才可能犯错泄漏给你。。。 所以这个利润非常少。。而且我曾经自己试验过超过5000局。
+ K  {9 Z1 \' t0 W+ J) R5 y0 l7 U: g

; ^7 _8 }! O/ Z0 V# Q还有人要问:在cash中,只要是+EV的动作,长期下去,是不是一定稳定盈利。很多人都迷信。
* J- G7 x+ s3 j! f! A- O% R9 x6 B/ ~) E
                       答案是: 不能。原因如下:EV分2种,绝对ev和相对ev,我们平常说的+EV,都是说的相对EV.必须有个对照物,比如这个Bet的动作,相对于check是+EV的。 比如你在 0.5/1 的局 你在大盲位置,用 5-4s 来保护盲注。你call的ev:-0.35.相对于你fold的ev:-1 而言。 你的动作是+EV 的。+的EV是0.65 。 虽然你还是会输钱。   再比如你有一对AA,是Nuts在river上了。你check相对于于bet 是-EV的。虽然是-EV.但是是赢钱的。所以。EV的计算也许可以让你少输多赢。但是不能确保你稳定盈利的。
, \1 z+ r2 S* q/ O: f' i6 q% x9 N- `$ d5 L. l7 I7 I& B
) L: D% w2 g2 O4 P0 ~/ \
那么GTO-也就是nash均衡策略在扑克中到底有什么用呢。。
3 p) A+ ^& `3 M' s$ w+ f2 o+ f+ K+ o, J$ C9 h
一句话:GTO策略告诉你每个玩家的均衡点。 在实际打牌中你找到他们和均衡点的偏移。然后采用EO(压榨性打法)去压榨他们的偏移。
# E$ W7 V  }( n  K1 v# n6 U' f6 c, d0 ^# @; c! j4 A
高手之战特别是单挑,2个人都不停的在压榨对手,同时暴露偏移给对手压榨。最后比的就是谁发现的早,调整的快。
. z1 P9 K/ m7 [7 Z! n( _% j- u) C, K. \! F! K: H1 s
举2个简单的例子。
! O; W0 F; I9 Z$ e" m6 a
7 {: Y. Y, Y& M' v3 _2 v! ksng中: 6人桌,每人1500的筹码,盲注已经到了100/200 ,我们是大盲位置,玩家都弃牌到小盲,小盲1500的筹码push你。call什么范围。ICM-NASH结果告诉我们均衡点是 SB push 64.6%的范围,BB call 39.7%的范围。。 这是均衡点。: S- s, O; M8 j+ ^
             但实际我们知道小盲偷的凶。不到10个BB了,肯定会100% push 我们。那我们call多少呢。。用sng-wizard得到 call 59.3% (J6+).   如果你没有可以马上计算的sngwizard, 那么最简单的方法就是,比对手的偏移量少就行了。 比如SB偏移了100-64.6 = 35.4%,我们肯定也要call松些。我们也偏移10-20%,偏移不精确没关系,因为范围边缘的牌ev值比较小,这部分牌是扔硬币的。 所以如果自己估算,call到54%左右比较合适。(wizard是call到59.3%)( D2 r9 d8 A( N7 i
/ Z$ F/ `$ B. {9 m

% d; y! U# V0 [) S  Ncash中:      盲注: 0.10/0.25      底池 是1,手里有筹码 24.50  公共牌型是 A(黑桃) K(红桃) Q(方块) J(樱花) T(黑桃)   ,到river这里就剩2玩家。。 第1个玩家Push or Check ?   请先自己思考。。。。。!!! 提示:抽水是5%
  V5 r; t8 h4 s9 r                 1 ?& _7 _3 T3 A8 f8 t! c1 e7 O
0 i/ |- C) C/ a
  P0 {3 H* c: L
                      答案:这种情况很常见,公共牌就是NUTS. 如果第1个玩家push了,第2个玩家不能call, 因为call 的话要花费24.50但是抽水就是2.5 .所以call的玩家只能拿回23.75. 损失0.75 。 所以这种情况的GTO策略是  第1个做动作的玩家push,得到0.95,第2个做动作的玩家应该fold..  不然就都损失0.75....想下你平时这种情况,你先动作的时候是不是check了?后动作的时候速度call了?
- C: T  B" i9 c. k* M0 B$ o# z9 h3 }: W' H
上面2个例子是比较简单的GTO.下次我会从cash的2人单挑开始讲pre-FLOP,flop,turn,river等各个阶段的GTO策略和原理。# x+ I9 r4 C& Q
; z# j8 x, }& n3 @6 ~! E; x
================================================================
; E' d# I4 l3 A8 _, w, i1 r3 f* p9 M, z& y  t* g
技术哥答疑板块:   % U( ?, p! f3 o  b$ |. E

; m4 w8 F/ m3 [有人经常在问。如何算碾压了了一个级别,多少手的样本能够说明我站稳了?
' Z( r* }- }4 `/ \1 m& Z9 m. B$ N4 M  C! R& P7 w: a
我来回答大家最关心的一个问题:cash和sng中 多少样本量能说明是否站稳这个级别。足够多的量是多少量呢?
. N% j) H3 O$ h# i
# d) R6 g5 n9 {) z4 G& m( m         公式: Long Run = 4*(SD/W)^2*period         (w是 赢率 w/period,一般是5bb/100  ,period = 100,w = 5)
- Y* W0 o0 w2 s" S1 f                                                                              (SD是standard deviation, 和期望有关,无限9人满员桌,标准的SD大约                           85bb/100,6人桌标准的SD大约95bb/100)7 Z1 w, {; k7 U4 W4 G% v
9 X' V. O9 R) a3 H
   例如:在cash中,你当前的赢率是 8bb/100,SD是90bb/100 , 那么 Long Run = (4)[(90/8)^2]*100 hands = 50625 hands' u4 A" j* ~( `0 O  {

' y8 M' u6 d, y6 L就是说 50625手牌就是足够的样本量。证明你的确有8bb/100
8 a# L. U! @8 j. c8 _( U
2 Q0 g8 f# D5 y4 G; }            在 sng中,SD 和 奖励结构有关,还有ROI和买入大小也影响。这里直接说结论。
  E7 D% P* t! i3 J6 S% Q. s$ X* h2 M) N- r
                           假设你是平均每场买入1.55的SNG
) X1 j8 C+ l- J3 q# B( K- A                           ROI                      Long Run4 j$ D, e; e. s- f3 O) h
                           15%                     427 场8 ~! l+ z+ m( m
                           10%                     961
% N% F: j9 z- Z                           7%                       1961; U" B5 X" @1 R- G, c
                           5%                       38446 }& O6 b2 \# ~* \
                           3%                       10678+ M9 h6 H9 U' x( E
                           1%                       961005 b& H' |. G6 r" P
                           -2%                      240258 F& s, v3 m& z5 U. b3 _
                           -35%                    78: H, A$ j( ^8 @, C+ g0 |% M
- j( a# K# Q# V
可以看到,Roi 越接近 0,需要的样本量越多,该结果不包括反水,比如你5%的roi,加2%的反水,就可以看7%了。 最苦的是1% roi的玩家。。。可能需要10万场才能知道自己是否能站稳当前级别。。。。
8 M. K2 h" Q! C/ C8 ]1 ~/ q# y# ~2 f# S- T3 W! X
================================================================
1 w! _& g' I( n5 _: Q' h- p8 m, R( A4 d$ U1 f

2 ?( M$ G# u  B: ?' G# B# g3 B7 |- c8 y6 O

点评

说的不错!!: 5.0 什么乱七八糟的!: 5.0
支持一下!: 5.0
楼主 你更新一篇技术贴 我给你顶一次经验值和竞技币 不用管那些要你贴成绩的傻B乱说 你的技术贴很有含量  发表于 2014-7-30 21:57
说的不错!!: 5
  发表于 2014-7-30 15:09
说的不错!!: 5 什么乱七八糟的!: 5 支持一下!: 5
太精彩了!  发表于 2014-7-30 15:07

评分

参与人数 7经验值 +41 竞技币 +220 收起 理由
yosabi + 1 赞一个!
laaaaang1986 + 5 + 5 很给力!期待继续发帖!!!另外有什么现金桌书.
宝luoluo + 10 很给力!
扑克侠 + 10 + 5 赞一个!
鼬的天空 + 5 很给力!

查看全部评分

16

主题

116

帖子

720

积分

竞技币
1012
威望
49
经验值
720
注册时间
2014-7-30
最后登录
2017-1-4
推荐
 楼主| 发表于 2014-7-30 21:24:07 | 只看该作者
本帖最后由 技术哥 于 2014-7-31 00:39 编辑
! }4 A8 Y1 c5 j0 f; Q  [( ^0 g
nanrenshiyao 发表于 2014-7-30 20:12; M! Y8 F5 m& ^, Z: S
这还真是近三个月来最有技术含量的帖子,顶楼主·····
5 I  R3 @0 y- X" G7 M# \+ L. `! T: c
这个得靠不断复盘,不断记忆,不断修复才能 ...

, v% V# h/ f  k1 o: m嗯。就是要不断学习,强化记忆,进化的大后期 还是人与人之间的斗争。 不过在于谁能更先,更准确的发现对手的偏差。
6 N( H# h: l2 G. W9 ~
3 w+ X, ~; G# h$ e但是前提是你通过技术的不断进步,有迅速得到平衡点和进行正确调整的能力、 平衡点和如何调整是有标准6 i, t% }6 I5 S/ Q
, U/ @3 x- {+ @$ T/ R5 L5 O3 ?
答案的。很少有人能准确得到这2个东西。。需要大量练习得到一种感觉。比如表格什么的。 这2个能力在扑克
# F0 U+ _5 H9 v; b
$ `" D5 O, t% ~- N: Q技术进步的基础上,职业玩家在趋向于接近标准。   估计5年后。进化的大后期,高端职业玩家之间的战斗只1 [) v) Z9 G+ \, A' K1 y! D
$ o& C- h( N6 l3 w6 r1 ^
取决谁能先准确发现偏离。。这时候就又需要读人了。扑克进化史又陷入一个循环。不过是更高级的一个循
6 o' }, f+ P# ~% d  O* x( Z* s, i$ I
环。但本质是一样的:猜测与欺骗。  z- H% L7 v& p, q

0 _# ]% K2 F+ J6 P, q, R但是国内很多玩家对这一切都没概念。。。甚至不知道标准和调整的标准答案是否存在。。我这回复其实信, ^. k/ T  D; J9 \- i9 ?

# ]# H+ O$ k; [- N/ u息量很大。。。
回复 支持 1 反对 0

使用道具 举报

4

主题

79

帖子

178

积分
竞技币
228
威望
0
经验值
178
注册时间
2014-7-21
最后登录
2015-7-13
推荐
发表于 2014-7-30 21:36:52 | 只看该作者
复制一段话:
2 q& _: ?( U) d% U' H! w
' X2 m2 V4 S, H5 a$ _# e0 F: B7 Z( R% S' B
楼主在论坛内说得头头是道,请问:
. p3 p9 w, e! c5 j- P0 T9 }: W' N% s  C7 H1 ^8 W
你打徳州扑克赢利了吗?9 s; ?. C" k$ [4 q

' T9 E0 V' R- T1 b* R( L可不可以把你赢利的ID秀一下或贴个赢利图呢??
回复 支持 0 反对 1

使用道具 举报

4

主题

79

帖子

178

积分
竞技币
228
威望
0
经验值
178
注册时间
2014-7-21
最后登录
2015-7-13
推荐
发表于 2014-7-30 21:39:38 | 只看该作者
如果连你自己都赢利不了,那么,任何技术都是假的。
3 l5 b8 t+ ~/ J请贴你的赢利图吧!
回复 支持 0 反对 1

使用道具 举报

0

主题

25

帖子

56

积分
竞技币
62
威望
0
经验值
56
注册时间
2014-4-14
最后登录
2015-4-18
5
发表于 2014-7-30 14:52:33 | 只看该作者
好贴,学习了

31

主题

590

帖子

954

积分

竞技币
1394
威望
0
经验值
954
注册时间
2014-6-27
最后登录
2016-6-8
6
发表于 2014-7-30 15:00:46 | 只看该作者
慢慢看,得多看几次才能完全弄懂,并且记住,
& X! [$ O/ t, x2 @, b: j9 h1 _! Z) q# ]* ]# ~
要运用还得看更多次。

9

主题

204

帖子

630

积分

竞技币
3619
威望
0
经验值
630
注册时间
2013-10-2
最后登录
2018-7-21
7
发表于 2014-7-30 16:35:34 | 只看该作者
这才是中扑网的资深玩家,好贴!呼唤版主加分

35

主题

831

帖子

1835

积分

竞技币
2074
威望
0
经验值
1835
注册时间
2013-8-23
最后登录
2019-2-23
8
发表于 2014-7-30 17:46:20 | 只看该作者
没有完全弄懂,但大概意思明白。我想说的是扑克不需要这么精确的计算,只要知道什么样的动作是+EV,并去执行就可以了。因为当我们在打牌是是不可能还要那个软件去计算下这个动作的的EV 是多少,是正还是负,而且session的进行瞬息万变,对手也在不断调整,按照完全理论的东西去打扑克完全是不可行的。

16

主题

116

帖子

720

积分

竞技币
1012
威望
49
经验值
720
注册时间
2014-7-30
最后登录
2017-1-4
9
 楼主| 发表于 2014-7-30 18:38:34 | 只看该作者
本帖最后由 技术哥 于 2014-7-30 19:11 编辑 ) Z2 l% d, \; `  _
yszopq5262396 发表于 2014-7-30 17:46
% \. `6 I) s/ I没有完全弄懂,但大概意思明白。我想说的是扑克不需要这么精确的计算,只要知道什么样的动作是+EV,并去执 ...

5 r& r) z- ?& ~: a2 K5 m3 ^6 m随着大家的技术提高,和趋近。都越来越接近标准。这个是趋势,比如我见过的一个sng 的知名高手。我分析了他几百盘的log..和软件计算的结果非常近似。失误很少。估计100个动作,失误1次的样子。这就是他的计算能力。已经成了一种感觉。就是他领先别人的地方。  {/ K3 F8 a+ M5 d" h( N4 `2 c
第四部分,人工智能会告诉你目前的网络扑克基本都有各种软件能即使计算各种东西。包括我自己,以前就做过很多辅助,能即时查看各种ev,计算各种nash.帮助玩家决断。第4部分还会告诉你目前世界最好的智能扑克机器 neopokerbot.com 的原理和缺陷。3 @% E3 D* ?* ?1 \: K0 T% C
随着科技的发达。我预测在线扑克的趋势会更加标准化,精确化。 读人,读牌在网络扑克占的比例会慢慢减少。
3 W- t8 k" [4 L6 W0 k- U代表人物就是sauce123. 大家可以看看他的盈利。和他的视频。他是科技扑克的代表。
+ ~% |4 d" u! x3 C

10

主题

62

帖子

213

积分
竞技币
247
威望
0
经验值
213
注册时间
2014-5-8
最后登录
2015-8-31
10
发表于 2014-7-30 19:44:30 | 只看该作者
技术哥 发表于 2014-7-30 18:38
4 h0 ]( l, J! A* U" M随着大家的技术提高,和趋近。都越来越接近标准。这个是趋势,比如我见过的一个sng 的知名高手。我分析了 ...
8 u# U6 w/ J5 r, C
sauce123 视频哪有
! T6 J% h: H  ~9 M; o5 ]6 C, ?8 k9 Z( g! j* C6 A$ C6 b
就是要会各种软件才能少失误 吧

8

主题

187

帖子

1265

积分

竞技币
1530
威望
0
经验值
1265
注册时间
2010-8-31
最后登录
2017-8-28

论坛认证会员

11
发表于 2014-7-30 20:12:04 | 只看该作者
Lanx 发表于 2014-7-30 19:44
- |( v( M2 ~8 r# Msauce123 视频哪有
0 K! V8 y2 \7 O
* I3 q, E' V: M6 e6 q就是要会各种软件才能少失误 吧

% a3 }9 g/ P$ H+ j- n这还真是近三个月来最有技术含量的帖子,顶楼主·····
+ F" n; D6 u9 Y1 j, S$ m
0 ^) m: T: O* H3 F这个得靠不断复盘,不断记忆,不断修复才能趋向标准动作···
0 @/ @. O1 H7 S% ^# }2 K) s- m& E! ^6 s
打的时候还得依靠对手数据做出范围调整·····开18桌6人超快的人飘过····按着ICM-NASH的正EV打法猛撸吧,因为低级别太多鱼了···7刀以上就难混了,必须得精益求精····因为网络扑克环境恶化得太严重了···对手的动作也都趋向于标准····

35

主题

831

帖子

1835

积分

竞技币
2074
威望
0
经验值
1835
注册时间
2013-8-23
最后登录
2019-2-23
12
发表于 2014-7-30 20:46:03 | 只看该作者
技术哥 发表于 2014-7-30 18:38- E" ]% V0 W! N/ n+ F( @
随着大家的技术提高,和趋近。都越来越接近标准。这个是趋势,比如我见过的一个sng 的知名高手。我分析了 ...

* h8 R  x  a( u, X) _4 O你的意思是开发一个智能程序替代人工打网络扑克?

23

主题

438

帖子

1601

积分

竞技币
1593
威望
5
经验值
1601
注册时间
2012-10-4
最后登录
2016-6-9
13
发表于 2014-7-30 21:54:24 | 只看该作者
你的对手热烈欢迎你在10JQKA的无花可平分牌面上为了少亏抽水钱而明智的flod,让他赢了本不该他赢的1美元,他表示他喜欢你这样的。希望你下次继续这样干。nicehand。

点评

什么乱七八糟的!: 5.0
什么乱七八糟的!: 5
我为什么要fold?我就要跟,顺便骂句SB  发表于 2014-10-27 19:06
确实只能这样,如果第1个行动的玩家check,我肯定也会all in..那第1个玩家也只能fold .这就是博弈。虽然为了1刀All-in 24刀会被骂,但这就是最优结果  发表于 2014-7-30 23:15

23

主题

438

帖子

1601

积分

竞技币
1593
威望
5
经验值
1601
注册时间
2012-10-4
最后登录
2016-6-9
14
发表于 2014-7-30 21:59:27 | 只看该作者

o

本帖最后由 lljjcc25 于 2014-7-30 23:23 编辑 3 Z( m& ?( _1 R; U

) Q# H8 F+ K6 f# ^! @% F7 E% _7 M; ~哦。是这样子啊。这样子了解了。

点评

第1次听到有人说GTO傻。。它不是为了让你不输。是给你个标准告诉你不输不赢的界限在哪。让你调整偏移去赢。回帖好累。。不回了。。  发表于 2014-7-30 23:18

41

主题

324

帖子

3557

积分

竞技币
1700
威望
7
经验值
3557
注册时间
2011-7-27
最后登录
2018-11-11
15
发表于 2014-7-30 22:45:50 | 只看该作者
BZDT2015 发表于 2014-7-30 21:36
, W7 U( E% `- G! |0 |2 c+ }5 i复制一段话:

' Y2 ?1 }3 F/ u0 X  `如果扑克中 我有一个老师 那么他的名字叫做技术哥。有的人不用打牌。但是他的智商可以碾压正常人一个世纪。 童话哥 算是我扑克的老师吧。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

重要通知!!上一条 /7 下一条

QQ|小黑屋|Archiver|中扑网cpf论坛 ( 桂ICP备18004948号-4 )

GMT+8, 2024-5-18 05:31 , Processed in 0.109520 second(s), 31 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表