公理主義。

公理からの演繹こそ至高。数学のいろいろをただ書きなぐるためにこのブログは生まれた。ここは、私の覚書である。

公理主義的確率。

確率には3種類あるのだとか。

  1. 主観的確率
  2. 経験的(統計的)確率
  3. 公理主義的確率

今回は公理主義的確率を扱う。

Notation

事象

まずは用語の定義!
抽象的な集合\(\Omega\)を全(体)事象だとか標本空間だとかと呼ぼう。この2つの語は同じ意味である*1
\(\Omega\)は一般に無限で構わない。高校数学まででは無限集合を扱わない上、定義の仕方が集合の要素数なため扱えないというだけである。
\(\omega\in\Omega\)を標本点といい、標本点の集合、即ち\(\Omega\)の部分集合\(E\)を事象という。特に標本点だけからなる集合\(\{\Omega\}\)を基本事象だとか根源事象だとかという。
\(E=\emptyset\)のとき、\(E\)を空事象といい、\(E=\Omega\)のとき、\(E\)を全(体)事象という。
これら事象に対し、0~1の実数値を割り振ることで確率と呼ぶわけである。

集合のときと同様に、事象\(E_1\),\(E_2\)の和集合\(E_1\cup E_2\)を和事象といい、積集合\(E_1\cap E_2\)を積事象という。
複数事象に対し、どの2つの事象をとっても、その積事象が空事象である場合、それら事象を互いに排反であるという。
任意の事象\(E\)に対し、\(\overline{E}=\Omega\setminus E=\{\omega\in\Omega | \omega \notin E\}\)を余事象という。
定義より\(E\)と\(\overline{E}\)は互いに排反であり、その和事象は\(\Omega\)である。

確率

集合\(X\)の部分集合全てを集めた集合\(\{ E | E \subseteq X\}\)を\(X\)の冪集合とかパワーセットだとかといい、\(2^X\)や\( {\mathfrak P}(X) \)や\({\cal P}(X)\)などと書き表す。
関数\(P:2^X \rightarrow [0,1] \)が次の公理を満たすとき、関数\(P\)を確率という。

  1. \( \forall E\subseteq\Omega, 0\leq P(E) \)
  2. \( P(\Omega)=1 \)
  3. \( E_i\cap E_j=\emptyset (i\neq j)\Rightarrow P(E_1\cup E_2\cup \cdots) = P(E_1)+P(E_2)+\cdots \) *2

公理(3)は、無限での話をしている。共通部分のない事象複数集めた場合、その和集合の確率は、それぞれの集合の確率を合計したものになるというものだ。

確率の公理の系

事象の確率

\(E_i=\left\{\begin{eqnarray}
& \Omega & (i=1)\\
& \emptyset & (i>1)\\
\end{eqnarray}\right.\)
とする。これを公理(3)に適応すると、\(\Omega\cap\emptyset=\emptyset\)なので前提がいえて、公理(2)より\(P(\Omega)=1\)なので
\(1=1+P(\emptyset)+P(\emptyset)+\cdots\)
より\(P(\emptyset)=0\)がいえる。

有限加法性

公理(3)は無限を対象にしている。有限ではどうなのだろうか。
\(E_i\)を\(i > n\)のとき空事象をとるとしよう。
公理(3)を使いたいので
\(E_i\cap E_j=\emptyset (i < j \leq n)\)としておく。
\[
\bigcup_{i=1}^{\infty}{E_i}
= \bigcup_{i=1}^{n}{E_i} \cup \bigcup_{i=n+1}^\infty{E_i}
= \bigcup_{i=1}^{n}{E_i} \cup \emptyset = \bigcup_{i=1}^{n}{E_i}
\]
よって、\(E_i\cap E_j (i < j \leq n)\Rightarrow P(E_1\cup E_2\cup\cdots\cup E_n)=P(E_1)+P(E_2)+\cdots+P(E_n)\)となる。

事象の確率

任意の事象\(E\)とその余事象\(\overline{E}\)に対し、有限加法性を当てはめてみる。
互いに排反なので前提がいえて、\(P(E\cup\overline{E})=P(E)+P(\overline{E})\)である。
ここで、\(E\cup\overline{E}=\Omega\)なので、\(P(\Omega)=P(E)+P(\overline{E})\)といえる。
公理(2)より、\(P(\Omega)=1\)なので、\(P(E)+P(\overline{E})=1\)である。
\(P(E)+P(\overline{E})=1\) を \(P(\overline{E})=1-P(E)\)とすれば、余事象の確率は、元の事象の確率を1から引くことによって得られることが分かる。

確率は1以下

\(P(E)+P(\overline{E})=1\) を \(P(E)=1-P(\overline{E})\)としよう。
\(\overline{E}\)も事象なのであるから、公理(1)より\(0\leq P(\overline{E})\)がいえる。
\(\begin{eqnarray}
P(\overline{E})&\geq 0 \\-P(\overline{E})&\leq 0 \\1-P(\overline{E})&\leq 1 \\ P(E)&\leq 1
\end{eqnarray}\)
よって、任意の確率は1以下であるといえる。

Conclusion

公理主義的確率における確率とは関数である。
上に示した確率の公理を満たせばすべて確率といっていい。それが公理というものだ。
だとすれば、どんな関数が許されるのか。
たぶんそこらへんに関係するのが確率密度関数とかそこらへんの単語なんだろうけど、まだ勉強不足。
分かったら書きますのよ。

*1:おそらく標本空間は統計分野から出でた言葉だろう。

*2:σ-加法性というらしい。