ベイズ統計学とは
ベイズ統計学は、一言でいうと「新しい情報が手に入るたびに、自分の信念(確率)をアップデートするための数学」です。普通の確率(古典的な確率)は、「コインなら表と裏が \(1/2\) だよね」といった、長期的な頻度に基づく考え方が中心です。一方、ベイズ統計では「この人が自分を好きである確率は 30% くらいかな」「この薬が効くと思える度合いは今のところ 60% くらい」といった、主観的な確信度をそのまま「確率」として扱います。
そして、新しいデータ(観測)が得られるたびに、
それまでの信念:事前分布(prior)
新しいデータ:証拠・観測(データ)
更新後の信念:事後分布(posterior)
という流れで、信念を更新していきます。
ベイズの定理
ベイズ統計の中心となるのが「ベイズの定理」です。イベント A と観測 B があるとき、
\(P(A \mid B) = \displaystyle\frac{P(B \mid A) P(A)}{P(B)}\)
ここで、
- \(P(A)\):事前確率(事前分布)
- \(P(B \mid A)\):尤度(ゆうど)=「A が真だとしたら B が起きる確率」
- \(P(A \mid B)\):事後確率(事後分布)=「B を見た後での A の確率」
- \(P(B)\):正規化定数(全確率の法則で求める)
と解釈します。感覚的には、
事後確率 = 事前確率 × データのもっともらしさ(尤度)
を、全体で割って正規化したものと思っておけば OK です。
ベイズ統計学の応用先
ベイズ統計は、かなり広い分野で使われています。ざっくり例を挙げると、
- 機械学習・AI
- スパムフィルタ(ナイーブベイズ分類器)
- ベイズ最適化
- 医療
- 検査結果から病気の確率を推定(有名な「陽性でも病気じゃない可能性がある」話)
- ビジネス
- A/Bテスト(どちらの施策が良さそうかを確率で評価)
- 売上予測や需要予測の不確実性を扱う
- 日常の意思決定
- 「この人は自分をどう思っているか」
- 「天気予報 40% だけど、傘を持っていくか」
今回扱う「バレンタインのチョコから好意の確率を推定する」というのも、まさに不確実な状況で、自分の信念をアップデートするというベイズ統計の王道パターンです。
バレンタインのチョコと好意の確率
設定
あなたは、ある人(仮に A さん)からチョコをもらいました。そこで考えたいのは、「A さんが自分に好意を抱いている確率はどれくらいか?」
ここで、以下のように記号を定義します。
事象 \(L\):A さんが自分に 好意がある
事象 \(\overline{L}\):A さんが自分に 好意がない
観測 \(C\):バレンタインデーで チョコをもらった
知りたいのは、
\(P(L \mid C) \quad \text{(チョコをもらったときに好意がある確率)}\)
です。
事前分布の設定
問題文の通り、事前分布はこうします。
好意がある確率:\(P(L) = \displaystyle\frac{1}{2}\)
好意がない確率:\(P(\overline{L}) = \displaystyle\frac{1}{2}\)
「まだ何も知らない段階では、好きの可能性も、そうでない可能性も 50–50 と仮定しよう」というイメージです。
チョコをあげる確率(尤度)の設定
ここが「モデル化」の肝です。現実には人それぞれですが、ベイズ統計では 自分の仮定(モデル)をハッキリ言語化します。ここでは、次のように「適当に」しかし直感的に妥当な値を置いてみます。
好意がある相手にはかなり高い確率でチョコをあげる:\(P(C \mid L) = 0.8\)
好意がない相手にも、義理チョコなどで少しはあげる:\(P(C \mid \overline{L}) = 0.2\)
ポイントは、チョコをあげる行動は、好意があるときのほうが、ないときよりも起こりやすいでも、好意がなくてもゼロではない(義理・社交辞令・職場文化など)
こういう「差」が、後で事後確率に効いてきます。
ベイズの定理を書き下す
求めたいのは、
\(P(L \mid C) = \displaystyle\frac{P(C \mid L) P(L)}{P(C)}\)
ここで、分母 \(P(C)\) は「チョコをもらう確率」全体で、
\(P(C) = P(C \mid L) P(L) + P(C \mid \overline{L}) P(\overline{L})\)
です(全確率の法則)。
数値を代入して丁寧に計算
まず分母から計算します。
\(P(C) = P(C \mid L) P(L) + P(C \mid \overline{L}) P(\overline{L})\)
\(= 0.8 \times \frac{1}{2} \;+\; 0.2 \times \frac{1}{2}\)
それぞれ計算すると、
\(0.8 \times \dfrac{1}{2} = 0.4\)
\(0.2 \times \dfrac{1}{2} = 0.1\)
したがって、
\(P(C) = 0.4 + 0.1 = 0.5\)
となります。
つまり、「誰に対しても \(1/2\) の確率で好意があり、チョコをあげる振る舞いが上記のようである世界」では、「ランダムに選んだ相手からチョコをもらう確率」は \(0.5\) ということになります。次に、事後確率 \(P(L \mid C)\) を求めます。
\(P(L \mid C)\)
\(= \displaystyle\frac{P(C \mid L) P(L)}{P(C)}\)
\(= \displaystyle\frac{0.8 \times \frac{1}{2}}{0.5}\)
まず分子から、\(0.8 \times \displaystyle\frac{1}{2} = 0.4\)。
よって、\(P(L \mid C) = \displaystyle\frac{0.4}{0.5} = 0.8\)
結論
このモデルのもとでは、チョコをもらったときに、相手が自分に好意を抱いている確率は \(80\) % という結果になります。
事前と事後を比較して「ベイズの真髄」を見る
事前確率(情報なしのとき):\(P(L) = 0.5\)
チョコをもらった後の事後確率:\(P(L \mid C) = 0.8\)
つまり、チョコをもらうという「新しい情報」を得て、好意がある確率は \(50%\) → \(80%\) に上がったという「信念のアップデート」が起きています。これこそが、ベイズ統計の真髄です。
逆側の確率も計算しておく
好意がない確率も、もちろん更新されます。
\(P(\overline{L} \mid C) = 1 – P(L \mid C) = 1 – 0.8 = 0.2\)
もしくは、ベイズの定理を \(\overline{L}\) についても書けば、
\(P(\overline{L} \mid C) = \displaystyle\frac{P(C \mid \overline{L}) P(\overline{L})}{P(C)}\)
\(= \displaystyle\frac{0.2 \times \frac{1}{2}}{0.5}\)
\(= \displaystyle\frac{0.1}{0.5}=0.2\)
こちらも同じ結果になります。ベイズの面白いところは、尤度(行動モデル)を変えると、事後確率も変わることです。例えば、
好意があるときにチョコをあげる確率:\(P(C \mid L) = 0.6\)
好意がないときにチョコをあげる確率:\(P(C \mid \overline{L}) = 0.4\)
のように、「本命と義理の差があまりない文化・人」だとしましょう。同じように計算すると、
\(P(C) = 0.6 \times \frac{1}{2} + 0.4 \times \frac{1}{2} = 0.3 + 0.2 = 0.5\)
\(P(L \mid C) = \displaystyle\frac{0.6 \times \frac{1}{2}}{0.5} = \frac{0.3}{0.5} = 0.6\)
この場合、チョコをもらっても好意の確率は \(60\) % までしか上がりません。同じ「チョコをもらった」という事実でも、「その人がどういう基準でチョコを配るか(尤度)」によって、解釈(事後確率)は変わるというのがベイズ的な視点です。
おわりに
今回参考にした書籍はこちら
さいごまで読んでいただきありがとうございました!
- 大学受験数学で困っている方
- 公務員試験の数学で困っている方
- 統計学(統計検定)の勉強で困っている方
個人家庭教師やってるので、ぜひコメントやXでご連絡ください。(Xはこちら)
私自身、数学に関して順風満帆に理解できてきたわけではありませんでした。
周りを見渡せば数学の天才がゴロゴロいて、そんな人たちに比べれば私は足元にも及びませんでした。
だからこそ、わからない、理解できない方の気持ちを少しはわかってあげられると自負しております。
数学に困っている方の一助になれれば幸いです。
ご連絡お待ちしております。



質問や感想はコメントへ!