【上級編】GTO Part4 〜実戦で使うGTO 混合戦略の調節〜

実戦でのGTOのバリエーション

ジョーズ

前回は「相手がGTOでないときに自分がGTOを使う」の概論を話してみたよ。今回はさらに実戦的な話をしようかな。

チンアナゴ

ほほう、というと？

ジョーズ

前回の話はね、「プリフロップから計算したGTO（ゲーム全体のGTO）をあらゆる状況で使う」というのが前提だったんだ。

ジョーズ

でも、実戦ではそういう汎用性の高いGTOをずーっと使うわけでもないんだ。

ジョーズ

例えばね、相手のフロップでのベット頻度がGTOよりも高いのなら、自分のコール・フォールドの混合戦略になっているハンドの一部を、常にコールに回したほうが利益が出るかもしれないよ（混合戦略の調節）。

チンアナゴ

ふむふむ。

ジョーズ

こういうケースはどうかな。プリフロップ、フロップ、ターンでの相手のリークがわかっていて、そこをエクスプロイトするためにGTOから外れたレンジ・戦略を使いましたと。

ジョーズ

でも、リバーでの相手のリークがよくわからない＝リバーでのエクスプロイト戦略がわからなくなってしまったんだ。

ジョーズ

そんなときはお互いのレンジを想定した上で、リバーだけのGTOを考えてみれば、最低限保証された期待値が確保できるよね（部分ゲームのGTO）*1。

チンアナゴ

ふーん。GTOからちょっと外れてみたり、やばいわからん！ってなったら襟を正してGTOに戻ったり・・・柔軟さが大事ってことなんかな。

ジョーズ

そういうことだね。

ジョーズ

相手のスタッツや人口平均が取る戦略のデータを見たり、あるいはブロッカーを考慮したりして、「じゃあ今回は混合戦略のうち、このアクションを選択しよう」「この人はもっとエクスプロイトできそうだ、GTOから大きく外れてみよう」と判断するわけだね。

ジョーズ

そうして期待値を高くしていくのさ。

チンアナゴ

ふーむ。GTOっつってもいろいろあるんだね。
ねえ、いつ、どんな戦略を使えばいいのか教えてよ。

ジョーズ

そうだね、GTOをベースにした戦略をすべて網羅するのはさすがに無理だけど、いくつかピックアップすることはできるかな。

GTO戦略

混合戦略の調整
ノードロック
汎用性の高いGTOをそのまま使う（前回解説）混合戦略の調整

ジョーズ

今回は最初の「混合戦略の調節」を説明していくね。

混合戦略の調節とは？

ジョーズ

特にお互いのレンジが広い場合（2ベットポットなど）、GTOはレンジの大部分で混合戦略を採用するんだ。

ジョーズ

これまでに説明したように、混合戦略はアクションの期待値が一緒だったよね。

チンアナゴ

うん。期待値が一緒だから、どっちを選んでもいいんでしょ？

ジョーズ

そう、基本的にはそれで問題はないんだ。でも、相手のスタッツやブロッカーなど、いろんな要素を考慮することで、混合戦略になっているアクションをあえて一つに常に固定することが可能だよ。

ジョーズ

具体例があったほうがわかりやすいよね。
例えば、こんなケースはどうかな。

例

HJ vs BB 2betPot（HJ 2.25bb open, BB call）
フロップ：[Q❤️][J♦️][6♠️]
条件
- 簡単にするため、ベットサイズ＆レイズサイズは50%Potに統一（ターン以降のAll inはあり）
- スタックはお互い100bbでスタート、レーキは無視
- BBはプリフロップでは適切にディフェンスするが、ポストフロップではターンCBにフォールドしすぎというリークがある

ジョーズ

HJのオープンレンジ（20％）はこれ。

ジョーズ

BBのディフェンスレンジ（30％）はこれを今回は設定してみたよ。

ジョーズ

さっそくフロップのGTOを見てみようか。
BBがチェックして、HJの戦略がこれ。

チンアナゴ

確かに、ほとんどが混合戦略になってるね。

ジョーズ

今回はHJのレンジのうちの特定のハンド、[KTo]に注目してみようか。HJは[KTo]でフロップCBを打ったんだ。
そのベットに対するBBの戦略がこれ。

チンアナゴ

ふむふむ。BBのハンドはどうするの？

ジョーズ

今回はHJ視点で考えてるからBBのハンドは不明。このレンジのままだね。それでBBはCBにコールしましたと。

ジョーズ

ターンは[Q♦️]だったよ。ターンでのBBは全レンジでチェック。

ジョーズ

BBチェックに対するHJの戦略はこうなってるよ。

チンアナゴ

ふむ、[KTo]はベット優勢ではあるけど、混合戦略のままだね。
ベット・チェックのどちらでもいいのか。

ジョーズ

でもね、BBはターンCBにフォールドしすぎというリークがあるんだ。だから、ここでは混合戦略のうち、ベットを選ぶことでより高い期待値が得られると考えられるよ。

チンアナゴ

あれ？でも、混合戦略だからチェック・ベットの期待値は一緒なんじゃない？

ジョーズ

前回も説明したけど、このHJのGTOは「超うまい相手がGTOに基づいてプレイしているとき」のものだからね。

ジョーズ

つまり、相手にリークは存在しなくて、逆に相手は自分を最大限搾取しようとしてくるというのが前提にあるんだ。

チンアナゴ

あ、そっか。前回そんな話をしてたね。
超うまい相手に立ち向かうために混合戦略があるんだっけ。

ジョーズ

そうそう。混合戦略ってのは相手が超うまいプレイヤーのときだけの話で、絶妙なバランスで成立してるんだ。

ジョーズ

だから、相手がそこから少しでも外れてしまうと、混合戦略になってるアクションは期待値に差が生まれてしまうんだね。

ジョーズ

でも、このBBは「GTOを基準に考えるとターンCBに降りすぎ」、つまりリークを抱えてるんだね。BBはGTOが想定している相手と違うんだね。

ジョーズ

そんなとき、自分はどうプレイすればいいのかな？
前回紹介した方法は「こちらは戦略を変えず、GTOをプレイする」だったね。そうすると何がうれしいんだっけ？

チンアナゴ

えっと、相手がGTOじゃないときに自分がGTOをプレイするんだよね・・・。相手が純粋戦略を間違えたら期待値が上がるし、自分は搾取される心配がないって話だったっけか。

ジョーズ

その通り！
そういう「守りのGTO」が前回の内容だったんだ。今回はそこから一歩進んで、相手のリークを突くために攻めに転じる戦略を紹介してるんだ。

チンアナゴ

その「攻めのGTO」がターンでベットするってこと？

ジョーズ

混合戦略の頻度を100％にしてしまってるから、厳密にはGTOじゃないんだけどね。

ジョーズ

BBはターンCBに対してEVを失いがちだから、自らGTOから外れて常にベットを選択しようってことなんだ。これが混合戦略の調節さ。

混合戦略とブロッカー

チンアナゴ

ふーむ、なるほど。相手のスタッツやプレイスタイルを観察して、GTOの混合戦略をどれか一つに固定してみるんだね。

ジョーズ

混合戦略の決め手はほかにもブロッカーがあるよ。
これはターンのHJのGTO。右下の欄を見てごらん。

チンアナゴ

12パターンの[KTo]があるね。あれ？オフスートなのに頻度や期待値がちょっとずつ違う・・・。一体どうしてなの？

ジョーズ

これは[K♦️]と[T♦️]がブロッカーとして機能しているからだよ。
ターンCBにBBがコールやレイズをするレンジにはダイヤのフラッシュドローがあるはずだよね。

ジョーズ

でも、例えば[K♦️][T♣️]や[K♠️][T♦️]はBBのコール・レイズレンジに必要な[K♦️]と[T♦️]を自分で消費しているから、そのぶんBBはターンCBに対してコール・レイズをするコンボ数が減ってるはずなんだ。

チンアナゴ

ほえー、そんなことまで考えるんだね。

ジョーズ

ということは、[K♦️]と[T♦️]を持つ[KTo]は、持たない[KTo]と比べて高頻度でターンブラフCBを打つことになるし、期待値も高くなってるんだね。これがブロッカーによる混合戦略の調節の一例だよ。

神はサイコロを振らない

チンアナゴ

私、混合戦略のベット○○％とかってサイコロを振って決めるのかな？って思ってたけど、そうじゃないんだね。

ジョーズ

うん、乱数表を使ったり時計の秒針を見たり、いろんな方法で頻度を再現しようとする人もいるけど、それはあまり必要ないと僕は考えてるよ。

ジョーズ

それよりも相手のスタッツやブロッカーを考慮した混合戦略のアクションの決め方を研究するほうが大事なんじゃないかな。

チンアナゴ

ところでさあ、混合戦略の頻度を無視したせいで相手からエクスプロイトされることってあるの？

ジョーズ

特定の一つのハンドでの頻度無視はまず相手にバレないと思うよ。
「あ！この人は[Q❤️][J♦️][6♠️]のボードで[KTo]のときにベット率が高すぎる！」って、わかるわけがないからね。

チンアナゴ

なるほど、そりゃそうか。

ジョーズ

ただし、混合戦略になってるハンドの大部分で頻度を無視ちゃうと、全体のスタッツが大幅に偏ってしまって、エクスプロイトされるきっかけになることはあるかもね。

ジョーズ

例えば、混合戦略のベット・チェックのすべてをベットにしちゃって、それをずーっと繰り返してると、相手にHUDに表示されるCB率が95％とかになっちゃうからね。

チンアナゴ

なるほど、「あ！この人はGTOじゃないぞ！CB率が適正と比べて高すぎる！」ってバレちゃうんだね。

ジョーズ

そういうことだね。
相手のHUDに自分のスタッツがどう表示されてるのか、わかればこちらもエクスプロイトし返せるんだけど、もちろんそうはいかないからね。

ジョーズ

GTOから外れるときは多少のリスクはあるってことさ。

今回のまとめ：GTOの特徴（5）

ジョーズ

さて、今回は実戦で使うGTOのうち、「混合戦略の調節」について話したよ。最後にまとめておくね。

今回のまとめ

実戦では、汎用性の高いGTOを常にそのまま使うだけでなく、状況によってはよりEVの高い戦略を選ぶことができる（GTOからの逸脱）
GTOから逸脱する動機はさまざまだが、主には相手のスタッツ・ブロッカー（Removal Effect）・人口平均のリーク抽出などがある
GTOから逸脱した戦略はさまざまだが、ここでは主に混合戦略の調節・ノードロックについて取り上げる

ジョーズ

次回はノードロックについて取り上げてみるよ。

注釈

*1:そもそもSOLVER等のアルゴリズムによって得られたGTOは、ベットサイズの選択肢が理論上のものよりも少なく、また数学的に完全なGTOではありません。そのため、われわれが手にすることができるGTOというもの（SOLVERの計算結果・プリフロップソリューションなど）は、ある意味ではすべて「部分ゲーム」であるとも言えます。この記事では、プリフロップから計算したGTO、つまりプリフロップソリューションやそれに従って計算したプリフロップからリバーまでのGTOを「ゲーム全体のGTO」と呼び、それに対して特定のストリートに限定したり、ノードロックによって得られたGTOを「部分ゲームのGTO」と呼ぶことにします。GTOの対象となるストリートやゲームツリーに注目し、その適用範囲に応じて「部分」「全体」を使い分けているということでご了承ください。どこまでが「部分」あるいは「全体」なのかといった厳密な定義はしていませんが、あくまでも「部分」は「全体」に比べて少ないゲームツリーを対象範囲としている、といった相対的な話として理解していただければと思います。

よかったらシェアしてね！

【上級編】GTO Part4 〜実戦で使うGTO 混合戦略の調節〜

実戦でのGTOのバリエーション

混合戦略の調節とは？

混合戦略とブロッカー

神はサイコロを振らない

今回のまとめ：GTOの特徴（5）

注釈

コメント

コメントするコメントをキャンセル

【上級編】GTO Part4 〜実戦で使うGTO 混合戦略の調節〜

実戦でのGTOのバリエーション

混合戦略の調節とは？

混合戦略とブロッカー

神はサイコロを振らない

今回のまとめ：GTOの特徴（5）

注釈

関連記事

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル