中扑网cpf德州扑克论坛

 找回密码
 注册

中扑网商城软件购买书籍获取竞技币
扑克学院扑克视频竞技币充值

德州扑克新手入门游戏休闲中心
看穿底牌别对我说谎无限德州扑克理论与实践
职业牌手训练指南网页版扑克赔率计算器

德州扑克资料区意见反馈
天天德州德堡扑克
联众德州扑克口袋德州扑克

查看: 66464|回复: 138
打印 上一主题 下一主题

技术哥教你玩GTO之基础篇

  [复制链接]

16

主题

116

帖子

720

积分

竞技币
1012
威望
49
经验值
720
注册时间
2014-7-30
最后登录
2017-1-4
跳转到指定楼层
庄家
发表于 2014-7-30 14:38:00 | 显示全部楼层 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 技术哥 于 2014-7-30 14:47 编辑
, ~+ g8 ?) ^0 o( J/ ~% k) ]9 V, \8 K; s) `
技术哥专注智能扑克多年。给大家分享一些自己的心得,包括该领域一些最前沿的动态的进展如果看完能学到哪怕一点有用的知识。点个赞。5 t9 b# m- Z% ~8 E+ R% n# A0 T2 y
# I0 P) E( K% d/ W! @8 P
文字基本是平民语言,尽量让大家懂。有问题尽量回答。. d* o3 a2 m$ L6 |: u

/ g' L# B2 Q2 O0 C. }* T) DGTO的领域内容很多。分4个主题来写帖子,基础篇,SNG, CASH,  人工智能+ }: N+ @& H% w( S
( E  ]" s. k% ]5 ~0 V6 s
=================2014年7月30号====================
. k4 N' V5 D# F% O4 e2 P5 Y4 w2 o9 ]
3 K$ y5 R8 M$ v6 b4 i5 AGTO(Game TheoretiCALLy Optimal) :  传说中最优游戏策略。 但不是最好的。。。为什么叫最优呢?相对于你老是输钱来说。它确实最优。。因为它能让你不输钱。     那什么是最好的策略:EO(Exploitatively Optimal) 压榨性策略。$ _1 ~% l5 A/ S: N3 @

6 K7 O5 R  K- w9 K* A$ T* u- C! c! }凡是有动态博弈的地方就会存在Nash(纳什均衡),德州扑克是个典型。 GTO就是指的动态博弈中的纳什均衡策略。这是个防守策略,永远可以让你不输,也不赢^^.
& f/ p0 {" ~4 {" Y  T" K* K6 j2 \1 c' Y1 I
GTO最典型的例子就是 石头,剪刀,布的游戏,当你做到真正随机的出1/3,石头,1/3,布,1/3,剪刀的时候,玩足够多的盘数,你不会输也不会赢。
: {7 H- u8 K6 t! @7 O" r6 k但是....... 还有种叫 序列石头剪刀布的游戏。就是每次游戏,总有一个人先出,一个人后出。后出的有明显的优势。可以依据第1个人的行动而行动。 所以就算第1个人采用随机1/3的nash策略。他也死定了。。。这个更像德州扑克的cash, 现金桌的就是序列的。。总有个人先出牌。 后出牌的人有位置优势。" s& W# ?! Y. k2 O7 A/ z# I; v! y6 b

9 @6 `7 w7 s* i( q再看个游戏:2个开车的在一条路上 相向而行。 都往前冲(push),最后两人撞死。谁先停( fold ),谁就丢脸。。 我们规定下2个开车的,让有个人先行动。一个人后行动。 这个就很像SNG了。这个和石头剪刀布(cash)的游戏不一样。 cash是个零和游戏。而这个SNG,赢的不能获的输者的全部。 所以单纯的SNG是有没 nash均衡策略的。 sng的nash均衡是建立在icm的基础上。所以大家玩sng说的nash范围,是指icm-nash的正ev范围。% H; D, V- i# K( a& C" _2 q
" Y0 c& H2 x7 i4 x: t; r8 H
那么有人要问:在sng中,比如最简单的hyper-sng中,我完全按照 ICM-NASH 的正EV范围来打。稳定盈利么? 很多人都相信,82也相信。 不幸的是....我以前也相信。虽然一直有怀疑。。9 h  t- h9 j) G8 |# `, U
                        答案是:hyper-sng的 纯nash打法。只能保证你不输。但是也不能赢。会输给抽水。 如果你采用nash的正ev范围打法,就算你有个对手每次只用AA和你all-in,或者盘盘都是用100%的牌all-in你。。。长期下来你们都不输不赢。但是盘盘被抽水。不过。利润还是有。来自哪里??  来自其他玩家的ICM-泄漏。  如果其他的对手比较菜,不明白ICM-的泄漏。。极端的情况。另外8个猪一样的对手一开始就同时all-in了。ICM的泄漏自动增加了你的EV. 这就是纯nash打法唯一的利润点。。并且这个利润要大于抽水才行。中高级的sng.多少懂点icm, 只有低级别的玩家才可能犯错泄漏给你。。。 所以这个利润非常少。。而且我曾经自己试验过超过5000局。
: k3 ~5 ?9 l, g6 \& b# C: P
  \8 Y* i6 X* |  u& i" c$ ^9 k4 O1 Q3 v" ~' F, p, G! J
还有人要问:在cash中,只要是+EV的动作,长期下去,是不是一定稳定盈利。很多人都迷信。2 o" o3 ~  L  {

& K& W, j3 w6 j                       答案是: 不能。原因如下:EV分2种,绝对ev和相对ev,我们平常说的+EV,都是说的相对EV.必须有个对照物,比如这个Bet的动作,相对于check是+EV的。 比如你在 0.5/1 的局 你在大盲位置,用 5-4s 来保护盲注。你call的ev:-0.35.相对于你fold的ev:-1 而言。 你的动作是+EV 的。+的EV是0.65 。 虽然你还是会输钱。   再比如你有一对AA,是Nuts在river上了。你check相对于于bet 是-EV的。虽然是-EV.但是是赢钱的。所以。EV的计算也许可以让你少输多赢。但是不能确保你稳定盈利的。7 S, T8 g) S3 Q( W+ R
2 Y: R0 g* m6 F" d, y# ]

, y( H9 L+ i) n) g( E; I' ?9 H那么GTO-也就是nash均衡策略在扑克中到底有什么用呢。。
' a* n" q# X0 ?% J. W/ X8 c& |2 e+ ]& f
一句话:GTO策略告诉你每个玩家的均衡点。 在实际打牌中你找到他们和均衡点的偏移。然后采用EO(压榨性打法)去压榨他们的偏移。
% E; Q3 @/ c7 o& }" M
! E& K$ Q* {, U- D8 N: L) o高手之战特别是单挑,2个人都不停的在压榨对手,同时暴露偏移给对手压榨。最后比的就是谁发现的早,调整的快。
' }/ X& Y1 `+ H+ |
* x: g/ H+ s( B# k) p举2个简单的例子。
) Z# \& t7 f* H0 t' V4 Z; v
) l' _0 J: L) ]- h9 Fsng中: 6人桌,每人1500的筹码,盲注已经到了100/200 ,我们是大盲位置,玩家都弃牌到小盲,小盲1500的筹码push你。call什么范围。ICM-NASH结果告诉我们均衡点是 SB push 64.6%的范围,BB call 39.7%的范围。。 这是均衡点。
1 z1 u9 o3 v: C: {- _8 f             但实际我们知道小盲偷的凶。不到10个BB了,肯定会100% push 我们。那我们call多少呢。。用sng-wizard得到 call 59.3% (J6+).   如果你没有可以马上计算的sngwizard, 那么最简单的方法就是,比对手的偏移量少就行了。 比如SB偏移了100-64.6 = 35.4%,我们肯定也要call松些。我们也偏移10-20%,偏移不精确没关系,因为范围边缘的牌ev值比较小,这部分牌是扔硬币的。 所以如果自己估算,call到54%左右比较合适。(wizard是call到59.3%)
% ]1 J9 |5 E$ m# @! P4 V" c9 @' L; y/ A. U8 W. D
7 Z5 Y8 D! n! U& _6 l
cash中:      盲注: 0.10/0.25      底池 是1,手里有筹码 24.50  公共牌型是 A(黑桃) K(红桃) Q(方块) J(樱花) T(黑桃)   ,到river这里就剩2玩家。。 第1个玩家Push or Check ?   请先自己思考。。。。。!!! 提示:抽水是5%
& D5 b: I# r% t3 y# h( ~# K+ t                 . G3 u4 r- K0 I: O! o
5 s/ j! T  u1 z+ @5 d2 v( j

3 J8 J; ~; [- t& _; x2 l- p5 [                      答案:这种情况很常见,公共牌就是NUTS. 如果第1个玩家push了,第2个玩家不能call, 因为call 的话要花费24.50但是抽水就是2.5 .所以call的玩家只能拿回23.75. 损失0.75 。 所以这种情况的GTO策略是  第1个做动作的玩家push,得到0.95,第2个做动作的玩家应该fold..  不然就都损失0.75....想下你平时这种情况,你先动作的时候是不是check了?后动作的时候速度call了?* {$ O/ D$ y+ }) X
, c+ l8 G8 b% d: r2 A
上面2个例子是比较简单的GTO.下次我会从cash的2人单挑开始讲pre-FLOP,flop,turn,river等各个阶段的GTO策略和原理。
) z1 i: [! y1 h7 P. X* G; o
! r+ K2 \: ?9 Q. w& U================================================================
: d" ]; ~" a' d; @* s* R  R4 w* b5 i: d/ J, X& T+ z8 m
技术哥答疑板块:   
/ p  q: r6 T3 b2 ]: z( V! A$ f- a0 _0 D
有人经常在问。如何算碾压了了一个级别,多少手的样本能够说明我站稳了?
2 R8 h) s- M1 m$ f" a3 r4 H+ t0 `9 T0 K; P
我来回答大家最关心的一个问题:cash和sng中 多少样本量能说明是否站稳这个级别。足够多的量是多少量呢?
; O5 ~2 Q- w# {* }- {+ n$ F
+ ~+ K- z* j- m. c0 W         公式: Long Run = 4*(SD/W)^2*period         (w是 赢率 w/period,一般是5bb/100  ,period = 100,w = 5)
: C- T5 q; Z% u6 O                                                                              (SD是standard deviation, 和期望有关,无限9人满员桌,标准的SD大约                           85bb/100,6人桌标准的SD大约95bb/100)5 P: I6 i9 z2 T! t

2 E# N7 R( X, a, I* `   例如:在cash中,你当前的赢率是 8bb/100,SD是90bb/100 , 那么 Long Run = (4)[(90/8)^2]*100 hands = 50625 hands  U$ h3 l$ d( n

* W. u1 \, G- c( B% l就是说 50625手牌就是足够的样本量。证明你的确有8bb/100
3 [5 B6 X3 b* o6 V& _$ |1 z. R! ^/ t% g! o% Y& E( F
            在 sng中,SD 和 奖励结构有关,还有ROI和买入大小也影响。这里直接说结论。2 p+ y$ K0 {. e1 ^: E- i
0 t& g1 L( e/ Y1 z
                           假设你是平均每场买入1.55的SNG% v5 Q7 ^; e  m$ W5 M  n* ~  |- \
                           ROI                      Long Run- p2 ]2 Y. Q/ o) m) h: N( u7 s
                           15%                     427 场
% N5 ?: K5 y; k1 r2 _/ U& _3 L                           10%                     961
" _8 K! H$ T! i% c                           7%                       1961
$ e# o. K: b+ T( ^+ }7 {                           5%                       38446 D) N9 \/ N6 q2 d3 }8 {( V& Z
                           3%                       10678& o  L* X  K; C' L) M1 x' Y
                           1%                       961004 w, }2 g- |2 D: q& H9 |# F: h
                           -2%                      24025, t7 ?4 |2 B0 H4 y& D
                           -35%                    786 ?/ J0 ~! R- L7 _0 _
+ s: J- \, C2 W! T& z8 k, f3 L
可以看到,Roi 越接近 0,需要的样本量越多,该结果不包括反水,比如你5%的roi,加2%的反水,就可以看7%了。 最苦的是1% roi的玩家。。。可能需要10万场才能知道自己是否能站稳当前级别。。。。
! p( Y) {2 m, U( x. I/ n
+ n' L* y2 z+ P: A* s. H================================================================
! ?, g4 s! u# m( d7 h% R+ I8 a1 m4 h& F# |+ o  `' A( m$ i
. o' g' B3 O$ w7 }& v7 r" O

点评

说的不错!!: 5.0 什么乱七八糟的!: 5.0
支持一下!: 5.0
楼主 你更新一篇技术贴 我给你顶一次经验值和竞技币 不用管那些要你贴成绩的傻B乱说 你的技术贴很有含量  发表于 2014-7-30 21:57
说的不错!!: 5
  发表于 2014-7-30 15:09
说的不错!!: 5 什么乱七八糟的!: 5 支持一下!: 5
太精彩了!  发表于 2014-7-30 15:07

评分

参与人数 7经验值 +41 竞技币 +220 收起 理由
yosabi + 1 赞一个!
laaaaang1986 + 5 + 5 很给力!期待继续发帖!!!另外有什么现金桌书.
宝luoluo + 10 很给力!
扑克侠 + 10 + 5 赞一个!
鼬的天空 + 5 很给力!

查看全部评分

16

主题

116

帖子

720

积分

竞技币
1012
威望
49
经验值
720
注册时间
2014-7-30
最后登录
2017-1-4
小盲注
 楼主| 发表于 2014-7-30 18:38:34 | 显示全部楼层
本帖最后由 技术哥 于 2014-7-30 19:11 编辑 ( P2 C/ S; W* P" a4 @% {. H
yszopq5262396 发表于 2014-7-30 17:46
3 l7 y7 G; \& w' q没有完全弄懂,但大概意思明白。我想说的是扑克不需要这么精确的计算,只要知道什么样的动作是+EV,并去执 ...

( S; `# t' ~5 W  P随着大家的技术提高,和趋近。都越来越接近标准。这个是趋势,比如我见过的一个sng 的知名高手。我分析了他几百盘的log..和软件计算的结果非常近似。失误很少。估计100个动作,失误1次的样子。这就是他的计算能力。已经成了一种感觉。就是他领先别人的地方。) F: H7 g( m* b' y
第四部分,人工智能会告诉你目前的网络扑克基本都有各种软件能即使计算各种东西。包括我自己,以前就做过很多辅助,能即时查看各种ev,计算各种nash.帮助玩家决断。第4部分还会告诉你目前世界最好的智能扑克机器 neopokerbot.com 的原理和缺陷。
- @) Y$ \0 T) f# c4 ^) U随着科技的发达。我预测在线扑克的趋势会更加标准化,精确化。 读人,读牌在网络扑克占的比例会慢慢减少。/ D1 Y6 |# o, {+ b( D" H
代表人物就是sauce123. 大家可以看看他的盈利。和他的视频。他是科技扑克的代表。$ i; ?  h7 `. H

16

主题

116

帖子

720

积分

竞技币
1012
威望
49
经验值
720
注册时间
2014-7-30
最后登录
2017-1-4
大盲注
 楼主| 发表于 2014-7-30 21:24:07 | 显示全部楼层
本帖最后由 技术哥 于 2014-7-31 00:39 编辑 5 d6 Z/ l" Y7 q1 y
nanrenshiyao 发表于 2014-7-30 20:12( ~1 k( W  b& b+ e9 D- W, p1 J* e
这还真是近三个月来最有技术含量的帖子,顶楼主·····
' O& |7 C* _" G( Q7 u; V# H$ j
7 H* z2 h. H. ^; e7 G1 M7 j这个得靠不断复盘,不断记忆,不断修复才能 ...

& `3 F1 j2 \6 x, ]2 }+ c7 {嗯。就是要不断学习,强化记忆,进化的大后期 还是人与人之间的斗争。 不过在于谁能更先,更准确的发现对手的偏差。3 b. S8 u* z# b
# r/ b  d6 V" Y, B. Z' T
但是前提是你通过技术的不断进步,有迅速得到平衡点和进行正确调整的能力、 平衡点和如何调整是有标准
( r7 l1 A6 ~8 C4 t2 O& p, C# H, s8 r) E8 Q4 s
答案的。很少有人能准确得到这2个东西。。需要大量练习得到一种感觉。比如表格什么的。 这2个能力在扑克$ d8 {" J# w0 C* C* r* o

2 @. Y9 x  _' O% X/ [技术进步的基础上,职业玩家在趋向于接近标准。   估计5年后。进化的大后期,高端职业玩家之间的战斗只
9 L6 m) l% q! k3 |2 q- E: B4 [3 C
% D3 k2 y- f$ Z7 [取决谁能先准确发现偏离。。这时候就又需要读人了。扑克进化史又陷入一个循环。不过是更高级的一个循" n2 q/ n: w3 p( t0 T( |3 X. Z3 t  N
, t  @, W" V' e$ Z, h
环。但本质是一样的:猜测与欺骗。) h! Z% F: W( g/ t, U% X" D& x

% T. ~" D/ `! d6 y- n9 N但是国内很多玩家对这一切都没概念。。。甚至不知道标准和调整的标准答案是否存在。。我这回复其实信
4 ]" c5 r% ?9 @/ ^6 u6 y/ Q5 q& z" i  U2 S, H+ P" Q# ?1 o
息量很大。。。
回复 支持 1 反对 0

使用道具 举报

16

主题

116

帖子

720

积分

竞技币
1012
威望
49
经验值
720
注册时间
2014-7-30
最后登录
2017-1-4
枪口
 楼主| 发表于 2014-7-30 23:07:38 | 显示全部楼层
BZDT2015 发表于 2014-7-30 21:360 \+ p" R8 M5 ?
复制一段话:
* D! F( t+ R5 G1 h  O! h
我不会贴成绩的。也没什么成绩。我自己很少打牌。 另外我在扑克领域是盈利的。我之所以写 这个帖子不是为了让别人崇拜。最先是和一个朋友的交换条件,开贴。我本身不愿意写这些。因为就像三年前我做了个能打牌过程中即时显示ICM的软件。朋友说:中国根本没有市场。因为中国玩家基本没有概念。那是三年前,我写这个文章就是让想要进步的同学有个方向。知道目前扑克技术的前沿。 我相信我帖子里的东西是正确。任何一个公式和例子,都有来源。我用我自己的理解阐述而已。为了让大家明白,我会精心挑选例子,自己设计例子,怕没体现到要表达的东西。。我对自己写的东西是负责的。比如最后那个计算 多少牌局可以定论是否战胜该级别的公式。来自Collin mashaman与人合著的<<the math of holdem>>。 另外我反驳下说 技术是假的。 3年前。我做了个即使显示 icm的软件,我自认为是学习神器。用的人却不超过5个。我82你是一个。我记得他以前说:技术,你是我的贵人。认识你之前我只能打3.5,认识你之后我就一路碾压了。 我并未教他东西,反而一起学习到了很多东西。 但是我给他提供了学习的方向,学习的工具。 另外还有2个我知道用过的。都成了sng的职业玩家。 还有进排行榜的。 我并未做什么,但是我的东西一定会多少有些帮助,让他们相互学习提高。。3 @. O' \/ h0 a' I
所以现在,我想讲讲这个GTO. 我相信一样有人能从里面学到东西。还有虽然我是研究多,但是我相信我比一般的职业玩家在扑克领域中盈利的多。。   你信么。

点评

llilili11那个软件 ?  发表于 2014-7-31 01:10

16

主题

116

帖子

720

积分

竞技币
1012
威望
49
经验值
720
注册时间
2014-7-30
最后登录
2017-1-4
5
 楼主| 发表于 2014-7-31 18:13:37 | 显示全部楼层
fxzjwxuexi 发表于 2014-7-31 16:58. i7 N3 `4 y% x: ^; P% w& ~
非常好的文章,举例说一下我关于“均衡点”的理解,请LZ指教:
7 \/ m) y5 S' H8 n6 |比如说在9人桌中3B,
# F# a& f6 {; T' j8 y    如果你的3B太高 ...

% H4 Z. K; J; C- r2 E0 u$ @  k8 a好多都没理解到。如果刚玩德州不久,看这个文章的话,可能会感觉差了几个level,但是没关系, 强制提升level,就算有些感悟,提升了哪怕1个level都行。
* Q; D$ E6 K8 z( j9 ]& O' L1 u这个基础篇都举得简单的例子,只是为了给人一个概念,什么是GTO和他的作用。并未深入,也许例子背后有些东西比较深入。大家关心的关于buff比例啊。3bet比例啊。下注大小啊,翻牌后的打法啊等等等。都是GTO的重头戏。内容比较深入和多。我下个帖子会从cash的100BB的,pre-flop,flop,turn,river.各阶段分开写。也是我重新学习一次的机会。5 N0 O9 i2 V& H+ \
1 L" `& H9 C5 e
关于这个基本篇的中心思想是告诉你:
$ A4 T/ R; @4 V! s' Q- Anash均衡是存在的。
* T5 R$ y0 u1 b6 X3 O. b# Q- dnash均衡是不输不赢的。
, i/ u2 U0 }0 f% {% |3 u偏移均衡就表示可以被剥削,包括大家平时用的剥削性打法就是因为对手偏离了均衡,有漏洞。! e8 E1 b% l5 A
最后我想说,剥削性打法也可以是有最大ev的。是可以固化的。有标准答案的。比如他偏离了均衡,已经了有了漏洞。你的剥削性打法可以剥削他,但未必能最大限度的剥削。 而如何最大限度的剥削是有标准答案的。
8 I) P7 _( J) H5 z, r' z  J7 U$ J! }; m0 q, D, l5 \2 b/ A
另外,我希望有很多**的盈利玩家的log,是因为我有很多量化工具和量化方法。很多盈利玩家可能知道自己能盈利,但是不知道为什么,有没什么依据。 我能找到这个依据。因为我大概知道这个均衡点。盈利玩家能盈利就表明他的打法已经开始在剥削别人了。通过分析log,我大概知道这个级别的玩家平均偏离了均衡点多少。这样也许我能找到最大化剥削的方法。不管是mtt还是sng,cash,只要你稳定盈利,并且打法基本是abc,只要不是跳跃性的想当然的打牌盈利的。。。都欢迎发log给我。用hm2的,发个hud..你的log的分析结果,只会发给你自己,可以站内消息我,我回邮箱地址。 另外8月份没时间了。想发log的9月开始吧。
1 e8 f( P; }4 \7 R; I8 d洗碗去了。。。
' q1 f2 W/ i2 G# O2 ?" x; C! s
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

重要通知!!上一条 /7 下一条

QQ|小黑屋|Archiver|中扑网cpf论坛 ( 桂ICP备18004948号-4 )

GMT+8, 2024-5-5 23:32 , Processed in 0.082998 second(s), 23 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表