結論から言うと、確率と尤度の違いは「何を固定し、何を推定するか」です。
- 確率とはパラメータ(原因)を固定し、どのようなデータ(結果)が得られるかを考える。
- 尤度とは観測されたデータ(結果)を固定し、そのデータを最もよく説明するパラメータ(原因)を考える。
数式はどちらも
$$P(\text{データ}|\theta)$$
という形ですが、確率はデータを変数として見るのに対し、尤度はパラメータを変数として見るという点が大きく異なります。
この違いを理解すると、最尤推定やベイズ統計、機械学習で「なぜこのような計算をするのか」が一気に理解しやすくなります。
なぜ「尤度」と「確率」は混同されやすいのか
統計学を学び始めると、多くの人が「尤度と確率って何が違うの?」と疑問に思います。
その理由は、数式がほとんど同じだからです。どちらも
$$P(\text{データ}|\theta)$$
という形で表されます。しかし、統計学では数式の形よりも「何を固定しているか」が重要です。確率と尤度は、同じ数式でも見ている方向がまったく逆なのです。
確率とは「原因から結果を予測する」こと
まずは確率から考えてみましょう。
例えば、公平なサイコロを振るとします。サイコロが公平であることが分かっていれば、
- \(1\) が出る確率:\(1/6\)
- \(2\) が出る確率:\(1/6\)
- …
- \(6\)が出る確率:\(1/6\)
となります。ここでは、「サイコロの性質(原因)は分かっている」けど「出る目(結果)はまだ分からない」という状況です。つまり、
原因 → 結果
という向きで考えています。これが確率です。数式では
$$P(\text{データ}|\theta)$$
と書きます。ここで
- \(\theta\):既知のパラメータ
- データ:これから観測される結果
を表しています。
尤度とは「結果から原因を推測する」こと
一方、尤度では状況が逆になります。例えば \(100\) 人の身長を測定したとします。すでにデータは集まっています。しかし、
- 平均身長
- 標準偏差
は分かりません。ここで考えるのは、
「平均 \(170\) cmだったら、このデータはどれくらい自然に得られるだろう?」
「平均 \(160\) cmだったら、このデータは説明できるだろうか?」
ということです。つまり、
結果 → 原因
という向きになります。データは固定され、平均や標準偏差などのパラメータを動かしながら比較します。この
$$L(\theta)=P(\text{データ}|\theta)$$
を尤度関数と呼びます。
いろんな角度で違いを比べてみる
数式は同じでも意味はまったく違う
ここが最も重要なポイントです。確率も尤度も
$$P(\text{データ}|\theta)$$
という形になります。しかし、
- θを固定する
- データが変わる
「この条件なら、どんな結果が起こるか?」
- データを固定する
- θを変える
「この結果なら、どんな条件が最も考えられるか?」
という違いがあります。つまり、
数式は同じでも、変数として扱うものが違う
のです。
身長データで尤度を考えてみる
\(100\) 人の身長を測定したところ、多くの人が\(170\) cm前後だったとします。ここで次の2つのモデルを比べます。
- 平均 \(160\) cm、標準偏差 \(10\) cm
- 平均 \(170\) cm、標準偏差 \(10\) cm
観測されたデータを見る限り、平均 \(170\) cmの方が自然です。つまり、平均170cmのモデルの方が尤度が高いと言えます。さらに、
- 平均169cm
- 平均170cm
- 平均171cm
など、さまざまな候補を比較し、尤度が最も大きくなるパラメータを探します。これが最尤推定です。
よくある勘違い:尤度は「パラメータの確率」ではない
初心者がよく誤解する点として、
「尤度が高い=そのパラメータである確率が高い」
というものがあります。実はこれは正しくありません。尤度は、
「そのパラメータが観測データをどれだけうまく説明できるか」
を表す尺度です。つまり、尤度は
パラメータ同士を比較するための指標
であり、パラメータ自体の確率を意味するものではありません。パラメータの確率を求めたい場合は、事前分布を取り入れるベイズ統計の考え方が必要になります。
尤度が重要な理由
尤度は統計学だけでなく、機械学習でも中心的な役割を果たしています。例えば、
- 最尤推定
- 線形回帰・ロジスティック回帰
- ポアソン回帰
- 混合分布モデル
- 隠れマルコフモデル
- ニューラルネットワークの学習
- ベイズ統計
など、多くの手法が「データを最もよく説明するモデルを探す」という尤度の考え方に基づいています。そのため、尤度を理解すると統計学全体の見通しが格段によくなります。
まとめ
尤度と確率は数式こそ同じですが、考え方は正反対です。
- 確率とは原因(パラメータ)を固定し、結果(データ)を予測する。
- 尤度とは結果(データ)を固定し、原因(パラメータ)を推測する。
覚えておきたいポイントは、
「確率は未来を予測する考え方、尤度は観測結果から原因を推測する考え方」
ということです。この違いを理解すると、最尤推定やベイズ統計、さらには機械学習で用いられる多くのアルゴリズムが、なぜそのような計算を行っているのかが理解しやすくなるでしょう。
さいごまで読んでいただきありがとうございました!
- 大学受験数学で困っている学生の方
- 公務員試験の数学で困っている学生/社会人の方
- 統計学(統計検定)の勉強で困っている学生/社会人の方
個人家庭教師やってるので、ぜひコメントやXでご連絡ください。(Xはこちら)
時間や料金などは相談して決められればと思っておりますが、塾に通うよりは高コスパかなと思います。また、基本的にはオンラインでの授業を想定していますが、場所によっては直接の指導が可能です。(プロフィール)
これまでは塾講師や高校で働いていたのですが、現在はデータサイエンティストとして活動しています。社会やビジネスで数学がどのように使われているのか、そういった話も交えながら進められればと思っております。
数学に困っている方の一助になれれば幸いです。
ご連絡お待ちしております。





質問や感想はコメントへ!