ルーレットはマルコフ過程

破産する確率を求めてみましょう。 吸収壁(破産したらそのまま停止)のある場合のマルコフ過程の問題である。

賭博者破産の法則

成功確率が p である試行を n 回繰り返したときに i 回成功する確率は2項分布として知られる関数で計算されるが、例えば p=0.2 であるような試掘を 5 回行ったときに 1 回も成功しない確率は 32.8 %もある。1 回も成功しない確率を 10 %未満にするには 11 回以上、1 %未満にしたければ 21 回の繰り返し試行が必要という計算になる。この法則は、石油探鉱業において不可避的な不運の連続を乗り切って生き残るためには多数の試掘を続けるに十分な資金と意志とを持つことが肝要であることを教えるとともに、限られた資金で生き残るためにはリスク分散の戦略が必要なことを示唆している。

ギャンブラー破産問題とは gambler's ruin problem

The term gambler's ruin is used for a number of related statistical ideas. The original meaning is that a gambler who raises his bet to a fixed fraction of bankroll when he wins, but does not reduce it when he loses, will eventually go broke, even if he has a positive expected value on each bet. Another common meaning is that a gambler with finite wealth, playing a fair game (that is, each bet has expected value zero to both sides) will eventually go broke against an opponent with infinite wealth.

例題

Consider a gambling situation involving two players A and B. An example is roulette where, say, player A is a "guest" and player B is the "house." During any one play of the game there is a probability p, O<p<l, that player A wins a chip (or coin) from player B, and a probability q = 1-p that player B wins a chip from player A. The players begin with initial holdings of a and b chips, respectively. A player wins overall if he obtains all the chips. What is the probability that player A wins?

gamblerRuin.JPG

ルーレット ルーレットのウィール(Wheel)の近くには、0および1から36までのナンバーのついたレイアウト台があります。このナンバーは、黒と赤で交互の並んでいます。レイアウト台の隣にあるウィールには、ノッチの上に、一致するナンバーがついています。ノッチはスピンした後にルーレットのボールが止まる場所です。

  • 1回1枚だけかける場合
    勝率 1/37 (37ポケットだから、特定のポケットに落ちる確率は、1/37)
    勝ち点 36 (ポケットに落ちた時、貰える枚数は、36枚)
    以上から、
    期待値は、1/37 * 36 = 36/37 (期待値は、1枚掛けて、36/37枚ほど返ってくるという意味)

解法

To solve this classic problem, consider the general situation where A has k chips, 0≤k≤a + b, and B has a+b-k chips. Denote the probability under these circumstances that player A eventually wins by u(k). We can deduce a difference equation for u(k). Assuming player A has k chips, at the conclusion of the next play he will have either k + 1 or k - 1 chips, depending on whether he wins or loses that play. The probabilities of eventually winning must therefore satisfy the difference equation

u(k)=p・u(k+1) + q・u(k-1)
u(k)は、チップがk個ある状況で最後までに勝てる(取りきれる)確率。後ろ向きの推移式。

In addition we have the two auxiliary conditions

u(0)=0
u(a+b)=1

This difference equation for u(k) is linear, homogenous, and has constant coefficients. Its characteristic equation is

-pλ^2+λ-q = 0

The corresponding- roots are A=1, A=q. Accordingly, the general solution (assuming q≠p) is

u(k)=c1 + c2・(q/p)^k

The two auxiliary conditions give the equations

0=c1+c2
1=c1+c2・(q/p)^(a+b) .

These can be solved for c1 and c2 and the result substituted into the general solution. This leads to

u(k)=[1-(p/q)^k]/[1-(q/p)^(a+b)]
これはk個チップを持っているAさんが無限解試行して破産せずに結局勝てる(取りきる)確率

Finally, at the original position where player A has a chips, the corresponding probability of winning is

u(a)=[1-(p/q)^a]/[1-(q/p)^(a+b)]

As a specific example, suppose you play a roulette wheel that has 37 divisions: 18 are red, 18 are black, and one (number 0) is green. If you bet on either red or black you win a sum equal to your bet if the outcome is a division of that color. Otherwise you lose your bet. If the house bank has 1,000,000 francs and you have 100,000 francs, what is the chance that you can “break the bank,” betting 1000 francs on red or black each spin of the wheel?

In this case

p=18/37 q=1-p a=100 b=1,000

Thus,

u(100)=[1-(19/18)^100]/[1-(19/18)^1100]=3.29x 10^(-24)

3項漸化式の解

勝つ確率p、負ける確率q=1-pとする

  • f(x):xから始めてA円を得る確率
  • f(0)=0,f(A)=1
  • 0<x<A ならf(x)=pf(x+1)+qf(x-1)
  • t=pt^2+q の2根1,λ=q/p
  • f(x)=(λ^x-1)/(λ^A-1)

破産確率は資産に比例する

A,B の2 人が公正なコインによる賭け(p=q=1/2の場合)をする. それぞれの持ち点をA,B とし て, コイン投げの勝負によって1 点ずつやり取りするものとする. つまり, コイン投げに勝てば相手から1点を受け取り, 負ければ相手に1 点を譲り渡す. このゲームは, 一方の持ち点が0 になった段階で終了し,勝者はA + B 点を獲得するものとする. A,B がそれぞれ勝利する確率に関心がある. n 回目のゲームが終了した時点でのA の持ち点をA + Xn として, 得点の収支をXn とおくと, {Xn} は吸収壁をもつランダム・ウォークである. 収束状況では, A,B それぞれが勝つ確率P(A), P(B) は,

P(A) = A/(A + B)
P(B) = B/(A + B)

となり, ゲーム開始時の持ち点に比例することがわかる.

これは、前の問題にp=q=1/2を代入しても、同じである。

吸収壁をもつランダム・ウォークは, ギャンブラーの破産問題(the gambler’s ruin problem) に明快な視点と解法をもたらした.

ゲームが終了するまでに要するコイン投げの平均回数

前記のコイン投げ問題で

[定理] {Xn} を前記のランダム・ウォークとする. ただし、このランダム・ウォーク が壁に吸収されるまでに要する時間の平均値は次のようになる.

p=q=1/2 の場合
破産までの時間の平均値= AB
P<1/2 の場合
破産までの時間の平均値=(A+B)/(q-p){A/(A+B) - (1-(p/q)^A)/[1-(q/p)^(A+B)]}

ヨーロッパ式とアメリカ式

ルーレットは、ヨーロッパで完成しアメリカに渡りました。ヨーロッパ式は0が一つで、アメリカ式は0が二つあります。たったこれだけの違いですが、カジノの取り分がこれで変わってきます。当然アメリカ式の方が客に不利なのです。

最近はヨーロッパでもアメリカ方式のルーレットが進出してきているそうです。ヨーロッパ方式では的中確率は36:1で35倍の配当なので、2.7%がカジノの取り分。アメリカ式は37:1の確率で35倍なので5.26%がカジノの取り分になります。カジノの取り分(ハウスエッジ)が大きいので、アメリカでルーレットを利用する客は2%ほどだそうです。

オンラインカジノでルーレットを利用する場合は、このことを踏まえて、ヨーロッパ式を利用することをおすすめします。

結論

何度も繰り返すといずれ破産するゲームなので、いずれにせよルーレットはお勧めしません。 世の中には、ルーレット以上に勝率の低いゲームがたくさんあります。

  • 手数料の高い投資信託なども、このルーレットのゲームと似ています。

参考


添付ファイル: filegamblerRuin.JPG 495件 [詳細]

トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2009-11-08 (日) 22:04:00 (3635d)