こかげむら

ゲーム好きな理系大学生のお話

ポーカーの戦術タイプ,勝つことと強くなること

ポーカーには戦術タイプがいくつかあります.タイトアグレッシブ,ルースパッシブ,ニット,マニアックなどです(初心者のうちはその人の性格が反映されたりします).

戦術タイプはジャンケンのように竦み(すくみ)になっていて,タイプAはタイプBに強いが,タイプCには弱いというようになっています.

強い人は相手闘う相手に応じてタイプを自在に変化させてきます.

相手が炎タイプなら水タイプになるが,草タイプなら炎タイプになると言った感じです,最強ですね.

最初からそれを上手くこなすことはできないので,最初はタイトアグレッシブという戦術タイプをマスターするのが勝つための近道と言われています.

タイトアグレッシブは,強いハンドでしか勝負に参加せず(タイト),ヒットしていた場合や自分に有利そうなボードの時,ちゃんとレイズする(アグレッシブ)戦術タイプです.

今まで基本戦術というのはタイトアグレッシブのことを指していました.

なぜこれが勝つための近道かというと,初心者プレイヤーにはルースパッシブなプレイヤーが多いのです.

ルースパッシブは,幅広いハンドで勝負に参加し(ルース),自分が勝ってそうでもレイズはせず相手がレイズしてくれるのを待っている(パッシブ)という戦術です.

ルースパッシブに対して,タイトアグレッシブは有利な戦術タイプになります.従ってタイトアグレッシブをマスターすれば初心者プレイヤーには勝つことができるようになるということです.

f:id:agry:20200904143006p:plain

ちなみに何事においてもそうだと思いますが,強くなる(技術を向上させる)ためには,自分より弱い人と戦っていても強くなれません自分より強い人と戦って,負かされて,その人がなぜそういうプレイをしたのか理由を教えてもらい,その技術を盗むのが強くなる近道だと思います.自分より強い人が身近にいないけど早く強くなりたい場合は,人工知能に教えてもらいましょう.

ポーカーの戦術は計算機によってものすごく進化してきています.

現在では人工知能相手に対戦することができるSnowieや,集合分析によってGTO戦略(GTO:Game Theory Optimal,ゲーム理論に基づく最強の戦術)を研究できるGTO+,Piosolverなどがあります.(全部まあまあな金額しますが)

僕的にはSnowieがおすすめで,Snowieの戦術を真似することができれば,初心者相手に確実に勝ち越せると言ってもいいと思います.

pokersnowie.jp

これらで勉強して,海外旅行に実質無料で行く技術を身に付けましょうw

ポーカーで勝つために基本戦術をマスターし,闘うフィールドを考える

ポーカーは,胴元vsプレイヤーのパチンコやスロットなどとは異なり,プレイヤーvsプレイヤーのゲームです.ですので自分より少し弱いプレイヤー(2人プレイなら自分の勝率51%くらいで勝ち越せるプレイヤー)と戦っていれば利益が出ると思いきや,そうではありません.

ポーカーは海外のカジノや,日本だとアミューズメントカジノなどでプレイすることができますが,基本的にどこでプレイしてもレーキ(場代)が取られます.

f:id:agry:20200904140732p:plain

オンラインポーカーPorker Starsのレーキ表

プレイヤーvsプレイヤーで100$の賭け金が集まったとして,レーキが5%の場合,勝者に与えられるのは95$になります.このレーキというのは長期的にみると非常に重くのしかかってきます(結局一番儲かるのは胴元ということです).

レーキがあるため,実力が同じくらいの相手とプレイしていては賭け金は循環してしまい,少しずつ胴元に取られ長期的にみると利益マイナスになってしまいます.

なのでポーカーで利益を出そう,稼いで生きて行こうと思ったら自分が圧勝できるプレイヤーと打つことが大切になってきます.

ポーカーは5〜10人くらいで打つので,その場にいる全員よりも自分が圧倒的に強いということはありません.自分より強いプレイヤーも混ざっていると思います.

なので自分より強いと思うプレイヤーとは戦わないと決めて,そこそこ強いハンド(K,Jなどマージナルハンドという)では参加せず,確実に勝てそうなハンド(AA,KK,QQ,AK)でのみ参加する.

自分より弱いプレイヤーが参加したとき,強いプレイヤーが降りていればマージナルハンドでも参加するといった感じでしょう.

では,弱いプレイヤーを見分けるコツですが,それは以前述べたリンプインを多用してくる高頻度でオールインしてくる,逆に全然レイズしてこない,レイズに対してフラッシュドローなどでオッズ理論に合わないコールをするなど,ポーカーの基本戦術からかけ離れたことをしてくるプレイヤーが弱いプレイヤーだと思っています.

ここから言えるのは,基本戦術を知らないとそれからかけ離れているかどうかもわからないので,やはり基本が大切ということです.基本戦術はタイトアグレッシブという戦術で行くと良いとされていますが,その話は次の記事でします.

基本を知った上で,自分よりも弱いプレイヤーをできるだけ早く見定め(試行回数を多くし),圧勝することで長期的にポーカーで利益を出すことができるようになると思います.

テキサスホールデムで勝てるようになるための近道

今回は「テキサスホールデムで勝てるようになるための近道」です

以前も書きましたが,テキサスホールデムでは,手札が配られた時,3枚のカードが開いた後,4枚目,5枚目のカードが開いた後の計4回で勝負するのか辞めるのか決断を下すタイミングがあります.

3枚のカード(フロップと言います)が開かれたあとの戦術はもちろん大事ですが,

最も大事なのは2枚の手札が配られた時(プリフロップと言います)

それで「勝負に行くか(レイズするか)」「辞めるのか(フォールドするのか)」です.

以前言ったように,「コールして入る」という決断は基本的にはありません.

なぜプリフロップでの決断が大切かというと,それがテキサスホールデムにおいて最も多く訪れる決断のシチュエーションだからです.

プリフロップでの戦術はかなり研究が進んでおり,どのような2枚でレイズすれば得になりやすいのかということが分かってきています.

僕が参考にしているのはsnowieのpreflop advisorというものです(下のurlと画像です).これはポーカーの人工知能に何億,何兆というハンドをプレイさせ,その時利益が出たハンドを元に作られているらしいです.

https://www.pokersnowie.com/pftapp/

f:id:agry:20200904123522p:plain

この表では例えば,A5のoffsuit(ハートとスペードなど,マークが異なる組み合わせのこと)の時はフォールドですが,A5のsuited(ハートとハートなどマークが同じ組み合わせのこと)のときはレイズというように読み取ることができます.

上のサイトを見て貰えば分かりますが,この表はポジション(何番目にプレイする座席位置か)によって異なります.テキサスホールデムは実はポジションによって決断の難易度に差が出てきます.それを踏まえて表が作成されているので,ポジションによって表も異なってくるのです.

f:id:agry:20200904123553p:plain

ポジションごとのこの表を全て暗記し,レイズしてリレイズされた時の表などもポジションごとにあるのでそれも全て暗記すれば,アミューズメントカジノや海外のカジノでポーカーを打っても大負けすることは少なくなると思います.(全部覚えている人はかなり少ないと思うのでそこで差が出ます)

最初は表を見ながらでもいいので表通りの手札で入れば,フロップ以降の決断も簡単になる→難しい決断を下す機会が減る→よって勝てるようになると思います.

失敗しないための考え方 失敗しないために攻める(レイズする)という話

大きな失敗はできれば避けたいものです.

自分に損失が出てしまうかもしれないし他人に迷惑をかけてしまうかもしれません.(失敗は成長の種かもしれませんが,失敗したら全財産が消える勝負を毎日やりたいとはだれも思わないはずです)

失敗をしないためにはどうしたらいいでしょうか?

失敗は,難しい状況で意思決定を行った時にしてしまうことが多いと思います.

例えば,出さなければいけないレポートが複数個あり,ぎりぎりまでサボって出さないでいたとしましょう.

どれから手を付けていいかわからず,取りえず締め切りが近いものから手を付けていったら」残しておいたレポートは非常に時間のかかるもので,さらには必修単位で,再履修になったという経験がだれしも()あったと思います.

難しい状況になる原因は,多数の選択肢(どのレポートから手を付けていくべきか)があったから,レポートの優先順位がわかっていないなどいくつかあります.

この場合だと,必修単位のレポートはどれか把握し,優先順位を正しくつけてから取り組むべきでした.

もっといい解決方法としては,レポートが出された時点から取り組み,その時点でやらなければならないレポートを1つに絞っておくことですね.

要は簡単な状況下ならば失敗は減るということです.1つのレポートをやるか,やらないかくらい簡単な状況だったら僕だって再履修にはならなかったはずです.

テキサスホールデムで考えていきましょう.

初心者でよくありがちなプレイの一つに,「リンプイン」というものがあります.手札が2枚配られ,とりあえず最初の3枚を見に行きたいから,参加費を払っているプレイヤーと同じ額を出すという行為です.

これをすると,じゃあ僕も参加費を払って見に行こうという人が出てきて,3人以上と戦うことになったり,強制的に参加費を払わされている人は+0$で参加することができるようになってしまいます.

単純に考えて2人で戦うなら自分の勝率は50%,しかし5人で戦えば20%にまで減ってしまいます.

例えば自分が下の画像のように[A,A]を持っていても,5人もいたらもしかしたら2ペアができている人がいるかもしれない,[2,5]を持っていてストレートができている人がいるかもしれない.というように考えることが多くなり難しい状況になってしまうのです.f:id:agry:20200904121903p:plain

相手がストレートを完成させているのに[A,A]のワンペアで自分からレイズするというのはまずいですよね.

もしこんな展開になってしまったら,レイズにリレイズが重なり,持ち金すべて賭けることになり,[A,A]を持っていた人は持ち金すべて失うでしょう.これが失敗になります.

このような意思決定が難しい状況にはなりたくありません.

ですからテキサスホールデムでは,自分が簡単な意思決定だけを行う状況を作るために,勝負に参加するならば参加費の2~5倍ほどの$を支払って「レイズ」し,あとから参加してくる人を絞り込みにかけるべきなのです.

参加費の3倍の$を支払って参加してくる人は先ほどと比べて少ないでしょう.また,[2,5]のような弱い手が参加しているということは考えにくいです.以上のことからさっきと同じ3枚ならばおそらく自分が勝っているだろうと推測することができます.

このような状況になってしまえば意思決定は簡単に行うことができます.自分がおそらく勝っているのだから,チェックして相手を罠に嵌めてもいいし,レイズして$を奪い去っても構いません.自分のやりたいようにのびのびプレイできます.

どんなプレイをしても基本的に失敗にはならないでしょう.必修単位のレポートは完成させており,あとは提出するだけのような状態です.

このように,

失敗しないためには難しい状況を作らない必要があり,難しい状況を作らないためには自分から攻めて,考慮しなければいけないことを少なくしておくことが重要なのです.

この考え方はいろいろなところで使えるかもしれませんね.とりあえずこれを読んだ人は,やることは早くやって(必修単位のレポートを早く終わらせ),ポーカーでは「リンプイン」をせず「レイズ」をして参加するようにしましょうね.

 

理論に基づく決断のためのオッズ理論

前回に引き続きテキサスホールデムの話です.

テキサスホールデムでは,手札が配られた時,3枚のカードが開いた後,4枚目,5枚目のカードが開いた後の計4回で勝負するのか辞めるのか決断を下すタイミングがあります

この決断を下す時,なんとなくで決断していては損することになりかねません.決断するのは何かしらの理由が必要になります.その決断の際,利益を最大化するための考え方にオッズ理論という考え方があります.

今日は前回の記事で考えた状況をもう少し詳しく見ていきます.最初の状況は1枚目の図です.

kokagemura.hatenablog.com

  1. 手札はダイヤが2枚でした.3枚のカードが開かれて,そのうちダイヤが2枚でした.
  2. 相手がポット(中央にある$:P$とする)の半分(P/2$)をレイズしてきました.現時点では負けていそうですが4,5枚目でダイヤが1枚でも出れば勝てそうです.f:id:agry:20200904120139p:plain

この時自分はコール(相手と同じ金額を賭けて4枚目のカードを見る)するべきでしょうか,フォールド(降参)するべきでしょうか?

前回の記事の2倍,4倍の法則を用いて,4, 5枚目が開いた時自分が勝つ勝率を計算します.5枚目までにダイヤが落ちる確率は アウツ9枚なので 9x4=36% です

つまりこの勝負は3回に1回は勝てそうということがわかります.

次に,自分がコールすることで手に入れることができるかもしれない金額を考えると,今ポットには(元々あった$)+(相手がレイズした$)+(自分がコールする$) = P + P/2 + P/2 = 2Pです.つまりコールする(P/2$賭ける)ことで,その4倍の$が手に入るかもしれない(この場合4倍のことをオッズといいます,オッズは4倍)ということです.

3回に1回勝てる勝負で,勝つことができたら4倍の$が手に入る勝負です.この勝負を無限回行ったら確実に得をするということがわかります.なのでこの場合はコール(相手と同じ金額を賭けて4枚目を見る)が正しい決断となります.(レイズじゃダメなの?って話をすると長くなるからやめます)これがオッズ理論です.

この理論に基づいて決断を下していけば長期的に見て確実に得をすることができます.オッズ理論はテキサスホールデムのみならず,日常における決断(?)や投資などにも役に立つと思います.(ちなみに僕はポーカー以外でこんなことを考えて決断したことはありません)

ちなみに4枚目が開いて,ダイヤが落ちず,再び相手がP/2$レイズしてきた場合

f:id:agry:20200904121406p:plain

・勝率(5枚目でダイヤが落ちる確率)は 9x2 = 18%

・オッズは (P+P/2+P/2) / ( P/2) = 4倍

5回に1回しか勝てない勝負,勝っても賭け金の4倍しかもらえないため(18% * 4倍 = 72 <- これが100を超えると得する勝負ということ

フォールドが正解になります.

初心者は5枚目でダイヤが落ちそう!と思ってコールしがちですが,ぐっと堪えてフォールドしていればいつかきっといいことがあります

テキサスホールデムの基本的な確率の話

テキサスホールデムはギャンブルではなく,実力のゲームです.

いかに期待値の高いプレイをすることができるかが結果に大きく影響します.

なので,テキサスホールデムにおいては基本的な確率を暗記,または計算できるようにしておくと非常に有利になります.

実際にテキサスホールデムで稼いだお金だけで生活しているプロもいます.

今回はテキサスホールデムの戦略を構築する上で欠かせない確率の話です.例えば,下の画像のような盤面にダイヤが2枚,手持ちカードにダイヤ2枚の状況の時,相手がレイズしてきました.現時点では自分は負けていそうですが,4枚目or5枚目でダイヤのカードが落ちれば『フラッシュ』が完成して勝てそうです.

f:id:agry:20200904120139p:plain

では4枚目or5枚目のカードでダイヤが落ちる確率は何%なんでしょうか?

ダイヤのカードは見えている4枚のダイヤを除いて9枚あります.従って4枚目でダイヤが落ちる確率は,相手の手札を考慮しなければ9/(52-5)=0.19で19%です.

ですが,ポーカーのプレイ中にこんなことを正確に計算している暇はないので,勝率を求める裏技があります.それが2倍,4倍の法則です.

  1. まず4枚目,5枚目で落ちたら自分が勝てそうなカード(アウツ)の枚数を数えます(今回だとダイヤのカード9枚)
  2. 4枚目でアウツが落ちる確率は アウツの枚数x2 % (今回だと18%)
  3. 4枚目or5枚目でアウツが落ちる確率は アウツの枚数x4% (今回だと36%)

というように計算します.結果に少し誤差はありますが,大体合っています.この勝率を計算し,相手のレイズに対してコールをすべきなのか,それともフォールドか,自分がレイズするならいくらレイズすればいいのかなどを考えて戦略を構築していきます.これはオッズ理論という考え方で,テキサスホールデムに限らず,何か論理的に決断を下す時に必要な考え方でもあります.オッズ理論についてはまた今度書こうと思います.

完全独習 統計学入門を読んだ1

研究だったり,趣味だったりで使うかもしれないから統計学を勉強したいと思った.

初めはいろいろな人が書いたwebページを読んで勉強していたが,そろそろ何か本を読んでみたいと思い,ブログとかでよく見る下の本を購入して読み終えたのでその内容を忘れないように書いておこうと思う.

本の感想を先に言うと,初学者の自分に合った,最初の一冊に最高の本に出合えたと思った.

完全独習 統計学入門

完全独習 統計学入門

 

本当に初学者なので色々間違っているところがあるかもしれないけど,現段階で理解していることをあとで読み返して理解できるように書いておく.

 

データに隠れた特徴を見つける

日常で目にするデータにはいろいろな規則がある.例えば日本人成人男性の身長は人によってまちまち.しかし大体170前後の人が多く,身長1cmという人はおそらく存在しない.

このように日本人成人男性の身長においては,170前後の数が多く出現し,0や1などの極端に小さい数字は出現しない.という特徴(分布)があるということがわかる.

平均,分散,標準偏差

テストで[10, 20, 30, 40, 50]点の5人の生徒

これらの点数の平均は30点.

もし平均30点,ということだけわかっていたとしても,5つの数字の平均が30になる組み合わせは無限にある(例えば[0, 0, 0, 0, 150])から,どれだけ点数が散らばっているのかということも知りたい.

平均点からどれくらい散らばっているのかを考えたい.

平均点からの散らばりだから,5人の生徒のそれぞれの点数から平均30を引いて(これを偏差という)平均をとればいいのではと考える.

 ↓

[-20, -10, 0, 10, 20]

足すと0になってしまう.正と負が混在してるからこうなる.偏差を全部2乗して平均をとる二乗平均を使おう.

 (400+100+0+100+400) / 5 = 200 

これが「分散」というデータのばらつきを表す統計量.でも単位を考えてみると,点数を二乗して足し合わせた物だから,単位は『点^2』.使い勝手悪い.

分散の1/2乗が「標準偏差」という統計量になる.この場合単位は『点』.この標準偏差が使い勝手が最高.

この場合 標準偏差 = √200 = 14.14....(点)

標準偏差の意味

標準偏差は,各データが平均値から大体どれくらい広がっているのかを表す.

今扱っていたデータは[10, 20, 30, 40, 50]で平均値は30, 標準偏差は14.14

つまり30±14.14くらいにデータが広がっているということがわかる.

標準偏差を使えば,それが特殊か月並みかわかる

 扱うデータを日本人成人男性の身長に戻す.例えば,飛び抜けて高身長の男性を探す女性がいたとする.この時,身長が何センチの男性だったらその女性の要件を満たせるだろうか.

考える問題

175cmあれば,飛び抜けて高身長と言っていいだろうか?ということについて考えてみる.

方針

これは平均と標準偏差を使えば述べることができる.

まず,日本人成人男性の身長は正規分布に基づくことがわかっている.(この前提条件大事.正規分布は現実世界で最もよく観察される分布.)

この時,平均身長±標準偏差の範囲に約70%の人が入っている

さらに,平均身長±標準偏差x2の範囲に約95%の人が入っているということが言える.

2016年時点での日本人成人男性の平均身長167cm,標準偏差6.6cmらしい.(https://www.e-stat.go.jp/dbview?sid=0003224177

つまりこの時,

167 - 6.6 = 160.4cm, 167 + 6.6 = 173.6cm

167 - (6.6x2) = 153.8cm,167 + (6.6x2) = 180.2cm

より,「日本人成人男性は約70%の人が160.4cm以上,173.6cm以下であり,約95%の人が153.8cm以上,180.2cm以下である.」ということができる.

結論

したがって身長175cmの男性は7割の人より大きいということがわかるが,特別大きい問い訳ではない,180.2cm以上あれば,日本人成人男性においては特別大きい(Top2.5%)ということができる.

この女性には180.2cm以上の男性を紹介するといいっぽい

*ちなみにテストでよく聞く偏差値の話

大学受験の時,〇〇模試を受けて結果が帰って来た時よく目にした偏差値という言葉.偏差値の計算の仕方について書かれていた.

計算の仕方は以下のよう

  1. 平均点を偏差値50と定める.
  2. 平均点±標準偏差*nを偏差値50±10*nと定める.

この決まりによって計算されているらしい.上の話を踏まえれば,全体の70%くらいの人は偏差値40〜60に存在している.超成績が良い人というのは偏差値70以上の人で,そのくらいになると全体のTop2.5%くらいに君臨する人ということになる.

95%予言的中区間

この本では「95%予言的中区間」という言葉が使われていた.自分的にすごいわかりやすかったから解釈して書いてみる.

問題設定

100枚コインを投げるとする.表が出る枚数は何枚か(範囲指定してもいい.例えば.40枚から60枚の間のように)当てるゲームをする.当たったら指定した範囲の広さに応じて賞金がもらえる(範囲が狭い方が賞金が高い)けど,外れたら死ぬ,というルール設定.

私は死にたくないけど,できるだけお金はもらいたい.つまり,できるだけ狭い範囲を指定して賞金が欲しい.

この時,0〜100回の範囲で表が出ると予想すれば100%正解できるが,ゲームの意味がないので死ぬとする.

方針

コインは1/2で表が出るので,100回投げれば何となく50回くらい表が出るのではないかと考えられる.しかし,自分の命がかかっているのに「50回」と1点張りするのはリスクが高すぎる.

 60回はダメ?45回〜55回と予測するのはどうか?など,いろいろ考えられる.

この時使えるのが標準偏差を使った考え方である.

前提

N枚のコインを投げた時,表が出る枚数は近似的に,平均値がN/2で標準偏差が(√N)/2の一般正規分布になるということがわかっている.

つまり,今回の例だと表が出るのは平均50枚,標準偏差5枚の一般正規分布になるということがわかる.

結論

100回投げた時,コインの表が出る回数は平均(50)±標準偏差(5),つまり45〜55回の範囲に約70%で入っていて,

平均(50)±標準偏差(5)*2,つまり40〜60回の範囲に約95%で入っているということがわかる.

私は死にたくないので,約95%で的中させられる40〜60回の範囲を指定してゲームに臨むことにした.(5%で死ぬのは仕方ない)という感じで使える.

この95%的中する範囲というのは統計学でよく使われる範囲であるらしい.そこで,約95%というのは気持ちが悪く,ピッタリ95%的中させられるというようにしたい.そこで,今までは±標準偏差*2としていたが,±標準偏差*1.96としてピッタリ95%的中させられる範囲にする.

今回だと,40.2〜59.8枚がピッタリ95%予測的中区間ということになる.

いったんここまで

ここまでで,標準偏差を上手く使って区間推定ライクなことができるということがわかった.母集団と標本の話などもこの後しっかり出てくるが,疲れたからここまでにして続きはまた後日書く.