【上級編】GTO Part2 〜混合戦略と純粋戦略〜

実際にGTOを見てみよう!

ジョーズ

さて、前回はナッシュ均衡・エクスプロイト・GTOとは一体どんなものなのか、ざっくりと説明したよ。

ジョーズ

今回は具体的なGTOを一緒に見てみようか。

チンアナゴ

どんなGTOにするの?

ジョーズ

プリフロップのBU vs BBにしようかな。BUがオープンしてSBがフォールド、そこでBBのGTOは?っていうスポットだね。

ジョーズ

よくあるスポットだから、どんなGTO戦略なのか気になるんじゃない?

チンアナゴ

なるなる!

ジョーズ

まずは場面設定を紹介するね。

場面設定
  • スタックサイズはBU、BBともに1000(100bb)
  • BUのオープンサイズは35(ポットレイズ)
  • 3ベット、4ベット、5ベットのサイズはそれぞれ125、290、1000
  • 今回はPioCloudのプリフロップソリューション(レーキ3.5%14Cap)を使用
チンアナゴ

BUはどんなレンジでオープンしたの?

ジョーズ

今回はこんなオープンレンジ(VPIP40)を想定したよ。

ジョーズ

これでGTOを計算する材料はすべてそろったね。
さあ、これがBBのGTO戦略だよ。

ジョーズ

青がフォールド、緑がコール、赤がレイズ(3ベット)だよ。BBはこんなふうにプレイすれば、BUからエクスプロイトされることはないんだ。

ジョーズ

例えば、[A7o]は青一色だから常にフォールドすべきみたいだね。
[TT]は赤一色だから常に3ベット。

ジョーズ

[A5s]は赤と緑が混じってるから、レイズでもコールでも良いんだってさ。でも、緑より赤のほうが幅が大きいから、3ベットをより頻繁にすべきみたいだよ。

チンアナゴ

へー。ふーん。・・うん。

ジョーズ

やっぱ初めて見るとそういうリアクションになるよね。
どう?何がわかんない?

チンアナゴ

なんかアクションが混じってるハンドがいっぱいあって、見てるとモヤモヤするなあ。

チンアナゴ

もっと「このハンドは絶対こう!」ってパキッと教えてくれるのかと思ってたよ。

ジョーズ

その複数のアクションが混じっているハンドが今日の本題なんだ。
これを混合戦略っていうんだよ。

ジョーズ

逆に一つの色で塗られてるところは純粋戦略

チンアナゴ

混合と純粋かあ。
ねえ、どうしてこんなふうに戦略が分かれてるの?

ジョーズ

OK。次の章で詳しく説明していくね。

混合戦略ってなんなの?

ジョーズ

さて、混合戦略と純粋戦略をどう考えればいいのか。
ここではジャンケンを使って説明してみようかな。

チンアナゴ

グー・チョキ・パーのジャンケンだよね?

ジョーズ

そうそう。チンアナゴちゃん、もしジャンケンでグーばっかり出す人がいたらどうする?

チンアナゴ

そりゃあ、こっちはパーをたくさん出すのがいいんじゃない?

ジョーズ

うん、そうすれば相手をエクスプロイトできそうだよね。
でも、相手はチンアナゴちゃんの戦略を察知して、今度はチョキを多めに出してくるかもしれないよ。

チンアナゴ

じゃあ、私はグーを多めに出せばいいのかな。そうすると相手もそれに合わせて出す手を変えてきて・・・最終的にはグー・チョキ・パーを1/3ずつの割合で出すようになる気がする。あ、これがナッシュ均衡?

ジョーズ

そう、それがジャンケンのナッシュ均衡で、混合戦略になってるんだね。
お互いにグー・チョキ・パーを1/3ずつの割合で出せば、相手にエクスプロイトされることはないんだ。

チンアナゴ

うん、直感的にはわかるんだけど・・・もっと詳しい説明が欲しいなあ。ねえ、そもそもどうして混合戦略になるの?

ジョーズ

一言で言えば、ジャンケンには手の相性があるからだよ。
グーはチョキに勝てるけどパーには負けるみたいにね。

ジョーズ

「グーしか出さない」みたいな戦略は相手にパーばかりを出される(手の相性をうまく利用される)から、エクスプロイトされてしまうんだ。

チンアナゴ

うん、そりゃそうだ。

ジョーズ

逆に言えば、ジャンケンにエクスプロイトされないような戦略(ナッシュ均衡)があるのなら、それは必ず複数の手を混ぜて出すようになってるはずなんだ。

ジョーズ

そうじゃないと、手の相性を利用したカウンター戦略を必ず使われちゃうからね。

ジョーズ

ということで、ナッシュ均衡にはそもそも混合戦略が必要不可欠なんだね。ジャンケンやポーカーのようなゼロサム・ゲームの場合は特にね。

混合戦略の最大のポイントは期待値!

ジョーズ

さて、今までの話は入り口で、ここからが本題なんだ。
混合戦略で一番大事なポイントだよ。

チンアナゴ

なになに?

ジョーズ

混合戦略と期待値の関係だよ。
part1で僕はナッシュ均衡をこう定義したんだ。

ナッシュ均衡の定義
  • 互いのプレイヤーが戦略を変更してもそれ以上期待値を上げることができない状態・あるいはその戦略の組み合わせのこと
チンアナゴ

うん、その「戦略を変更して期待値を上げること」を「エクスプロイト」っていうんだよね。

ジョーズ

その通りだよ。だからこそナッシュ均衡は「エクスプロイトされない戦略の組み合わせ」になってるんだったね。

ジョーズ

さて、じゃあ実際のところ、ナッシュ均衡に基づいた混合戦略を使ったとき、相手の戦略の期待値はどうなってるんだろう?

ジョーズ

もちろん相手はいろいろな戦略を持ってるはずだけど、「戦略を変更してもそれ以上期待値を上げることができない」のだから、相手の戦略はすべて期待値が同じになってるんだよ。

ジョーズ

ここが重要なポイントなんだ。

チンアナゴ

うーん?ピンとこないなあ。ジャンケンで説明してみてよ。

ジョーズ

OK。ジャンケンの戦略とはすなわち「グー・チョキ・パーの手を出す頻度」のことだよね。

ジョーズ

例えば、「グーしか出さない」「チョキ多め」とかね。

チンアナゴ

うんうん。

ジョーズ

それらの戦略と混合戦略(グー・チョキ・パーが1/3ずつ)が戦うことを考えてみようか。例えば、「グーしか出さない」戦略vs混合戦略の期待値はどうなってるだろう?

チンアナゴ

えっと、「グーしか出さない」vs「1/3ずつグー・チョキ・パー」だよね?ってことは、グーしか出さない人は3回に1回はチョキに勝って、3回に1回はグー同士であいこ、3回に1回はパーに負けるはずだよ。

ジョーズ

そのとおりだね。例えば勝ちを1点、負けを-1点、あいこはやり直し(0点)と考えるなら、「グーしか出さない」の期待値は1/3*1+1/3*0+1/3*(-1)=0なんだ。

チンアナゴ

お、ちょうどきれいにゼロになるんだね。

ジョーズ

じゃあ次はこれ。2回に1回はチョキ、4回に1回ずつグーとパーを出す「チョキ多め」の戦略だとどうかな?混合戦略と「チョキ多め」が戦ったときの期待値を考えてみよう。
場合分けが多いから期待値を表にしてみたよ。

チンアナゴ

ふむふむ。この表の数字を全部足してやれば「チョキ多め」の期待値が出るんだね。・・・ってあれ?これも全部足したらゼロになるよ?

ジョーズ

そうなんだよ。混合戦略に対してどんな戦略を使っても、期待値は同じ(この場合はゼロ)になるんだ。

チンアナゴ

そっか、これがジョーズくんが言ってたことなんだね。
ねえ、じゃあさ、相手に混合戦略を使われたらどうすればいいの?

ジョーズ

相手がナッシュ均衡に基づいた混合戦略を使ってるなら、それに対してこちらはどんな戦略を使っても期待値は一緒なんだよね。
だったら、こちらも混合戦略を使うしかないんじゃないかな。

ジョーズ

どうせ期待値は一緒だけど、そのほうがエクスプロイトされる心配がないからね。

チンアナゴ

ふーむ、お互いが相手の戦略の期待値を全部一緒にしちゃうような混合戦略を使うってことか。まさに「均衡」なわけね。

ジョーズ

たくさん説明したから、ここで一旦まとめておこうかな。
こんな話をしてきたよ。

GTOの特徴(2)

GTOの特徴(2)
  • ナッシュ均衡(GTO)は適切な割合・頻度に基づいた混合戦略を必ず採用する。
  • 適切な割合・頻度に基づいた混合戦略は、相手の戦略の期待値をすべて等しくしてしまう。
  • ナッシュ均衡では、互いの混合戦略が相手の戦略の期待値をすべて等しくしてしまうので、互いのプレイヤーは戦略を変更することでそれ以上期待値を上げることができない。=ナッシュ均衡の定義の言い換え
チンアナゴ

ねえねえ、じゃあポーカーの混合戦略はどうなってるの?

ジョーズ

そうだね、そろそろポーカーの話もしないとね。
さっきのGTO戦略の混合戦略を一つピックアップしてみようか。

ジョーズ

[A5s]は赤(3ベット)と緑(コール)の混合戦略だったね。右下に書いてある数字がそれぞれのアクションの期待値(EV)なんだ。0.01のズレがあるのは計算上の誤差だよ。

チンアナゴ

3ベットとコールの期待値がほとんど同じになってるね。

ジョーズ

混合戦略は相手の戦略の期待値を等しくするんだったね。
[A5s]を常に3ベットやコールに回しても、それ以上期待値を上げることができないんだ。なぜなら、相手(BU)もGTO戦略に基づいた混合戦略を使っているからね。

ジョーズ

逆に言えば、3ベットもコールも期待値は同じなんだから、プレイヤーはどちらを選択してもいいんだ。

ジョーズ

ただし、3ベットを選択したほうが分散が大きくなることと、厳密には混合戦略の頻度を正確に再現する必要があることには注意だよ。

チンアナゴ

ふむふむ。ポーカーの混合戦略ではアクションの期待値が一緒になっちゃってるんだね。

じゃあ純粋戦略ってなんなの?

チンアナゴ

ねえ、じゃあ純粋戦略はどうなってるの?

ジョーズ

純粋戦略もジャンケンで説明してみようか。
実はね、ジャンケンにはグー・チョキ・パーのほかに第4の手があるんだ。

チンアナゴ

えっ、そうなの?

ジョーズ

うん、僕が今考えたんだ。「ピン」といって、ピン芸人なんかの「ピン」=「1」がその由来だよ。グー・チョキ・パー・ピンと覚えてね。

チンアナゴ

どうでもええわ!それで?ピンはグー・チョキ・パーのどれに勝つの?

ジョーズ

ピンはグーには勝つけど、チョキとパーには負けるんだ。

チンアナゴ

ピン、弱ッ!

ジョーズ

そうなんだよ。
さて、グー・チョキ・パー・ピンのナッシュ均衡を考えてみようか。

チンアナゴ

えっと、今度はグー・チョキ・パー・ピンを1/4の割合で出して・・・あ、でも、そっか。そもそもピンを出すとエクスプロイトされちゃうのか。

ジョーズ

そうなんだよ。ピンとパーはどちらもグーに勝てる手だけど、パーのほうはピンに一方的に勝てるからね。だからピンはパーの下位互換なんだ。

ジョーズ

だから、どんな割合だろうとピンを出す相手に対しては、グーを少なめにしてパーとチョキを増やせばエクスプロイトできそうだよね。

チンアナゴ

ということは、ナッシュ均衡ではピンを出しちゃダメってこと?

ジョーズ

そういうことだよ。ナッシュ均衡は必然的に混合戦略になるって話をさっきしたよね?でもね、中にはそもそもその戦略を取るor取らないこと自体がエクスプロイトされる原因になるようなケースもあるんだ。

ジョーズ

そういう場合はエクスプロイトされないほうの選択を常に取ることになるよね。それを純粋戦略というんだ。

チンアナゴ

ふむふむ。例えば手の相性が一方的に悪かったり、期待値が明らかに低い戦略は、そもそも混合戦略の仲間にすら入れてもらえないってこと?

ジョーズ

まさにそういうことだよ。出来の悪いピンを入れるとエクスプロイトされてしまうからね。万年補欠でいてもらうことになるんだ。

ジョーズ

でもね、その逆もあり得るんだよ。つまり、混合戦略を取るよりも常にその手を出すほうが期待値が高いような場合だね。
これはポーカーの純粋戦略も同じだよ。ほら、これを見てごらん。

ジョーズ

[TT]は3ベットが100%の純粋戦略だよ。ポーカーの純粋戦略は最も期待値が高いアクションが一つだけだよ。[TT]は常に3ベットしないと、相手にエクスプロイトされてしまうんだ。

チンアナゴ

ほんとだ。[TT]のアクションの期待値(EV)は3ベットが一番高いね。

ジョーズ

もう一つ見てみようか。
今度は純粋戦略でフォールドすべきハンドだよ。

チンアナゴ

今度はフォールドが一番期待値が高いんだね。
これがかわいそうなピンってことか。

ジョーズ

そういうこと。[A7o]は常にフォールドすべきで、プレイするとエクスプロイトされてしまうんだね。

チンアナゴ

ふーむ、さっきのジャンケンだと混合戦略と純粋戦略のイメージがついたけど、ポーカーだとどのハンドがどんな戦略になってるのか、全く想像つかないね。

ジョーズ

そうだよね。ジャンケンぐらい簡単なゲームだと「あ、ピンは出したらダメだ」ってすぐにわかるんだけどね。

ジョーズ

それに比べて、ポーカーはものすごく複雑なゲームなんだ。GTO計算機の力を借りないと、何がピンなのかすらわからないのさ。

ジョーズ

さて、最後にもう一度GTOについてまとめておこうかな。

GTOの特徴(3)

GTOの特徴(3)
  • 純粋戦略とは、割合・頻度によらずその戦略を取るor取らないことがエクスプロイトをされる原因になるような戦略において、エクスプロイトされないほうの選択を取ること。
  • ポーカーの混合戦略では、最も期待値の高いアクションが複数存在する。
    =どのアクションを選んでも期待値は同じ。ただし、ベットやレイズをするほうが分散は大きくなる。
  • ポーカーの純粋戦略では、最も期待値の高いアクションが一つだけ存在する。
    =ほかのアクションの期待値がマイナスで、フォールド(EV=0)を選ぶ場合もある。
チンアナゴ

ふむ、ちょっとずつGTOのことがわかってきたよ。でも、GTOってほんとに役に立つのかなあ?そもそも実戦でどう使えばいいんだろ?

ジョーズ

OK。じゃあ次回はGTOを実戦で使うときに必要な知識について触れようかな。特に混合戦略の頻度・エクスプロイトについてだね。

チンアナゴ

よーし、part3へ続くッ!

よかったらシェアしてね!

コメント

コメント一覧 (2件)

  • 自分はポーカー初心者ですが、ネット上でよく目にするgtoのイメージが掴めました。
    現段階で実践は難しいですが、とてもためになりました。
    ありがとうございます!

コメントする