日本シリーズの確率問題を考える





NASA JPLで火星ローバーの自動運転アルゴリズムを作っていらっしゃる小野雅裕さんの日本シリーズ問題を見かけました。
よくわからないのでとりあえず愚直なやり方で行います。数値が大量に出てくるのでいちいち約分はしていません。意外と計算が多いので間違いがあるかもしれません。

a)おもむろにテレビをつけてひとつの試合の結果を知ったケース

まずテレビで見た結果が第何試合目の結果なのかを考えます。1〜4試合目は必ず行われるが7試合目はそれまでに決着が付けば行われません。7戦目の実行の確率が下がることにより、目にした試合結果は7試合目の結果であるより1試合目の結果である確率の方が高い。このように、テレビで見た結果が第何試合目の結果なのかはその試合の行われる確率に依存する考え方をします。

1〜7試合目のそれぞれの試合が実行される確率を計算します(1〜4は当然100%です)。4戦以降のそれぞれの時点で何勝何敗が何パターンあるか確かめながら調べます。パターンとは各試合の勝ち負けの組み合わせのパターンのことです。各試合の勝ち負けの組み合わせが異なっても何勝何敗かは同じになるものがかなりあります。
以降、4-0という表記は4勝0敗を意味します。

4戦目終了時点
4-0 1パターン ここで終わり
3-1 4パターン 次へ
2-2 6パターン 次へ
1-3 4パターン 次へ
0-4 1パターン ここで終わり
よって14/16(7/8)が次へ

5戦目終了時点
4-1 4パターン ここで終わり
3-2 10パターン 次へ
2-3 10パターン 次へ
1-4 4パターン ここで終わり
よって20/28(5/7)が次へ

6戦目終了時点
4-2 10パターン ここで終わり
3-3 20パターン 次へ
2-4 10パターン ここで終わり
よって20/40(1/2)が次へ

これらより試合が行われる確率は
1試合目 必ず行われる
2試合目 必ず行われる
3試合目 必ず行われる
4試合目 必ず行われる
5試合目 7/8
6試合目 (7/8)*(5/7)
7試合目 (7/8)*(5/7)*(1/2)

分母をそろえると
1試合目 112/112
2試合目 112/112
3試合目 112/112
4試合目 112/112
5試合目 98/112
6試合目 70/112
7試合目 35/112

です。各試合の実行確率が出ました。

聞いた結果がどの試合の結果なのかという確率は、この分布を全体の合計が1になるように整えると得られるので
1試合目 112/651
2試合目 112/651
3試合目 112/651
4試合目 112/651
5試合目 98/651
6試合目 70/651
7試合目 35/651
となります。

次にシリーズ勝利(日本一になること)の確率を、それぞれの試合ごとに計算する。ここでは見た試合では勝ったことを加味します。

聞いた試合が1試合から4試合目のどれかの場合
状況は7戦4勝型での1勝アドバンテージと同じ、つまり6戦3勝以上の確率を求める
計算を簡単にするために、シリーズ勝利が決定してもその後の試合を行うことにして各試合の勝ち負けの組み合わせは全部で64パターン
そのうちシリーズ勝利は
6-0 1パターン
5-1 6パターン
4-2 15パターン
3-3 20パターン
よって42/64でシリーズ勝利

聞いた試合が5試合目の場合
「4試合終了時に両方が1勝はしている」ことが決定するので1試合から4試合目の結果は3通りで、各試合の勝ち負けの組み合わせを数えるとこの3通りの確率の分布は
3-1 4パターン(確率4/14)
2-2 6パターン(確率6/14)
1-3 4パターン(確率4/14)
となる。それぞれは5戦終了後に1勝が足されるので
4-1
3-2
2-3
となる。それぞれについてシリーズ勝利の確率を求めると
4-1はこの時点でシリーズ勝利が決定している
3-2は場合はあと2試合のうちひとつ勝てばいいので3/4
2-3の場合はあと2試合に勝たないといけないので1/4
全体を計算すると
4/14
6/14 * 3/4
4/14 * 1/4
これらを足して19/28

聞いた試合が6試合目の場合
「5試合終了時に両方が2勝はしている」ことが決定するので1試合から5試合目の結果は2通りとなり
3-2 10パターン(確率1/2)
2-3 10パターン(確率1/2)
それぞれ6戦終了後に
4-2
3-3
となり、4-2はそこでシリーズ勝利が決定
3-3のパターンは7戦目を行い1/2の確率でシリーズ勝利となるので
全体で3/4

聞いた試合が7試合目の場合
シリーズ勝利が確定します

各試合ごとに、上の
・聞いた結果がその試合の結果である確率
・その試合に勝利したときにシリーズ勝利になる確率
を掛けあわせ、
1試合目 (112/651) * (21/32 = 147/224) = (16464/145824)
2試合目 (112/651) * (21/32 = 147/224) = (16464/145824)
3試合目 (112/651) * (21/32 = 147/224) = (16464/145824)
4試合目 (112/651) * (21/32 = 147/224) = (16464/145824)
5試合目 (98/651) * (19/28 = 152/224) = (14896/145824)
6試合目 (70/651) * (3/4 = 168/224) = (11760/145824)
7試合目 (35/651) * (1 = 224/224) = (7840/145824)
全部足すと(100352/145824) = 0.68817204301075
これがシリーズ勝利の確率です。

聞いた試合が5試合目の場合なら上で求めたように19/28 = 0.67857142857143


b)シリーズ終了後に友達がランダムに一つの試合の結果を教えてくれたケース
今度は勝敗結果(何勝何敗)ごとに場合分けをします。
この記事の初めに求めた、それぞれの試合が行われる確率のデータを使って

起こる確率
4-0 2/32 = 1/16
4-1 4/32 = 4/16 * 1/2
4-2 5/32 = 7/8 * 10/28 * 1/2
4-3 5/32 = 7/8 * 5/7 * 20/40 * 1/2
3-4 5/32
2-4 5/32
1-4 4/32
0-4 2/32

それぞれの場合でランダムに結果を教えられたときに勝利である確率
4-0 4/4 = 210/210
4-1 4/5 = 168/210
4-2 4/6 = 140/210
4-3 4/7 = 120/210
3-4 3/7 = 90/210
2-4 2/6 = 70/210
1-4 1/5 = 42/210
0-4 0

合計(掛け算)を計算すると
4-0 420/6720
4-1 672/6720
4-2 700/6720
4-3 600/6720
3-4 450/6720
2-4 350/6720
1-4 168/6720
0-4 0/6720
この内の4-0から4-3の割合が求める値。
分子 = 420 + 672 + 700 + 600
分母 = 420 + 672 + 700 + 600 + 450 + 350 + 168
2392/3360 = 0.71190476190476
これがシリーズ勝利の確率

次に5試合目ということがわかると
聞いた試合が5戦目である確率は
4-0 0
4-1 1/5 = 42/210
4-2 1/6 = 35/210
4-3 1/7 = 30/210
3-4 1/7 = 30/210
2-4 1/6 = 35/210
1-4 1/5 = 42/210
0-4 0

5戦目が勝利である確率
4-0 0
4-1 1 = 30/30
4-2 3/5 = 18/30
4-3 3/6 = 15/30
3-4 3/6 = 15/30
2-4 2/5 = 12/30
1-4 0
0-4 0

各勝敗パターンになる確率と(そのパターンの中で)5戦目が選ばれる確率と5戦目に勝利する確率の分子をかけて
4-0 0
4-1 4*42*30 = 5040
4-2 5*35*18 = 3150
4-3 5*30*15 = 2250
3-4 5*30*15 = 2250
2-4 5*35*12 = 2100
1-4 0
0-4 0

さっきと同じように
4-0から4-3の合計を分子
4-0から0-4の合計を分母にして
分子 10440
分母 14790
で5試合目に勝利したことがわかったならシリーズ勝利の確率は0.70588235294118



考察1
なぜテレビで見たときと友達から聞いたときは結果が違うのか

結果を知るときに、あるひとつの試合の結果に出会う可能性(重み)が違います。
・全部で4試合行った場合の1試合
・全部で7試合行った場合の1試合
の重みを、テレビで見たときと友達から聞いたときでそれぞれ考えると、
テレビは試合数と放送回数が比例するので
4試合行った場合の1試合 (4試合で決着が付く確率) * (放送回数4) * (1/4)
7試合行った場合の1試合 (7試合で決着が付く確率) * (放送回数7) * (1/7)
となります。
友達から聞く場合は、シリーズ全試合の中から1試合を選ぶので、
4試合行った場合の1試合 (4試合で決着が付く確率) * (1/4)
7試合行った場合の1試合 (7試合で決着が付く確率) * (1/7)
とテレビと友達で重みが変わります。
表にまとめました。
上ではAは何試合目ごとの場合分けでしたが、AとBの違いが見やすいように各勝敗数による場合分けに統一しました。




考察2
わかっている情報の扱い

初め、5戦目が勝利(ということだけが分かっている場合)のときにシリーズ勝利となる確率をこう考えました。


「4試合終了時に両方が1勝はしている」ことが決定し「5戦目は勝利」である。
その他の試合は4戦あり、このうち2勝以上であればシリーズ勝利となる状況。つまり4戦2勝以上の確率を求めればよい。
(簡単にするため4戦全部行うとして)全部で16パターン。このうちシリーズ勝利のパターンは
4-0 1パターン
3-1 4パターン
2-2 6パターン
の11パターン。
よって11/16でシリーズ勝利


しかし、もっと詳しく全部の試合の勝敗パターンをきちんと考えると違う結果になりました。どこが違うか詳しく見ていくと初めの4戦の結果の解釈です。
この初めに考えたやり方だと、まず4戦から1勝1敗の2戦を省いて残りの2戦実行で結果を求め
2-0 1パターン
1-1 2パターン
0-2 1パターン
となり、これに両方1勝を足した
3-1 1パターン
2-2 2パターン
1-3 1パターン
と考えています。
しかし、詳しく全部の試合の勝敗パターンをあげるやりかただと、4戦実行の結果から4-0と0-4を省き
3-1 4パターン
2-2 6パターン
1-3 4パターン
となります。
2つのやり方で
3-1
2-2
1-3
の分布が違ってしまいます。
これに気がつくのにかなり時間がかかりました。

コメント

このブログの人気の投稿

Swiftのコンパイルエラー寄せ集め

コンパイルエラー覚え書き(Objective-C)

AVAudioSession細かいことまとめ(late 2014)