メニュー
yu-to
管理者
本ブログを運営しているyu-toと申します。

統計学に関する記事を基礎、応用、実践に分けて投稿していきます。
高校数学に関する記事も多く投稿しているので、イチから学びたい社会人にもおすすめです。
カテゴリー

特性関数を使った中心極限定理の証明

  • URLをコピーしました!

この記事を書いたのはこんな人

  • 国立大学大学院数学科修了
  • 元教員
  • 統計検定準1級
  • 数学検定準1級
  • 家庭教師やってます(こちら

この記事を書いたのはこんな人

yu-to

☑️ 国立大学大学院数学科修了
☑️ 元教員
☑️ 数学検定準1級
☑️ 統計検定準1級
☑️ 家庭教師(こちら

目次

中心極限定理を一言でいうと

統計学で非常に重要な定理のひとつが中心極限定理です。内容をシンプルに言うと、

ばらばらなデータでも、たくさん集めて平均をとると、その平均は正規分布に近づく

というものです。

たとえばサイコロを \(1\) 回振ると、出る目は \(1\) 〜 \(6\) のどれかで、分布は正規分布ではありません。しかしサイコロを何回も振って平均をとると、その値は \(3.5\) 付近に集まりやすくなります。

さらに「何回か振って平均を出す」という実験を繰り返し、その平均の分布を見ていくと、だんだん釣鐘型、つまり正規分布の形に近づいていきます。これが中心極限定理の直感です。

たくさん集めると正規分布に近づく様子を可視化したのがゴルトンボードです。

ゴルトンボード

数式で見る中心極限定理

では、この現象を数式で表してみます。

\(X_1\), \(X_2\), \(\dots\), \(X_n\) を独立同分布な確率変数とし、

$$E[X_i]=\mu,\qquad \mathrm{Var}(X_i)=\sigma^2<\infty$$

とします。このとき標本平均

$$\bar X_n=\frac{1}{n}\sum_{i=1}^n X_i$$

について、次が成り立ちます。

$$\frac{\sqrt{n}(\bar X_n-\mu)}{\sigma} \overset{d}{\longrightarrow} N(0,1) \qquad (n\to\infty)$$

これは、「平均を中心化してスケールを調整すると、その分布が標準正規分布に近づく」という意味です。

ここで \(\sqrt{n}\) が出てくる理由は、標本平均の分散が

$$\mathrm{Var}(\bar X_n)=\frac{\sigma^2}{n}$$

と小さくなっていくためです。このままだと分布が縮んでしまうので、\(\sqrt{n}\) をかけて広がりを保っています。

証明のアイデア(特性関数を使う)

ここからは証明の流れを説明します。まず、標準化した変数

$$Y_i=\frac{X_i-\mu}{\sigma}$$

を考えると、

$$E[Y_i]=0,\qquad \mathrm{Var}(Y_i)=1$$

です。このとき

$$\frac{\sqrt n(\bar X_n-\mu)}{\sigma} = \frac{1}{\sqrt n}\sum_{i=1}^n Y_i$$

となるので、

$$S_n=\frac{1}{\sqrt n}\sum_{i=1}^n Y_i$$

が標準正規分布に収束することを示せばよいことになります。ここで特性関数

$$\varphi_Z(t)=E[e^{itZ}]$$

を使います。独立性により、

$$\varphi_{S_n}(t) = \left( \varphi_Y\!\left(\frac{t}{\sqrt n}\right) \right)^n$$

と書けます。次に、指数関数をテイラー展開すると

$$e^{iuY}=1+iuY-\frac{u^2Y^2}{2}+o(u^2)$$

なので、

$$\varphi_Y(u) = 1-\frac{u^2}{2}+o(u^2) \qquad (u\to0)$$

が得られます。これを代入すると、

$$\varphi_{S_n}(t) = \left( 1-\frac{t^2}{2n}+o\!\left(\frac1n\right) \right)^n$$

となり、極限をとると

$$\varphi_{S_n}(t)\to e^{-t^2/2}$$

になります。これは標準正規分布の特性関数です。したがって、

$$S_n \overset{d}{\longrightarrow} N(0,1)$$

が従い、中心極限定理が証明されます。

中心極限定理が重要な理由

この定理のすごいところは、元の分布の形をほとんど問わないことです。

  • 一様分布でも
  • ベルヌーイ分布でも
  • サイコロのような離散分布でも

平均と分散が有限であれば、平均の分布は正規分布に近づきます。

つまり、現実の複雑なデータでも「平均」を見ることで、正規分布という扱いやすい形に落とし込めるのです。この性質があるからこそ、統計的推定や仮説検定が実用的に使えるようになっています。

まとめ

中心極限定理とは、

独立同分布な確率変数の平均は、適切に標準化すると正規分布に近づく

という定理です。

直感的には「たくさんの偶然を足し合わせると、きれいな釣鐘型になる」と理解できます。

そして数学的には、特性関数を使うことで厳密に証明することができます。

この定理は、統計学の土台を支える非常に重要な結果であり、「なぜ正規分布がこんなに頻繁に現れるのか」を説明してくれるものでもあります。

さいごまで読んでいただきありがとうございました!

  • 大学受験数学で困っている学生の方
  • 公務員試験の数学で困っている学生/社会人の方
  • 統計学(統計検定)の勉強で困っている学生/社会人の方

個人家庭教師やってるので、ぜひコメントやXでご連絡ください。(Xはこちら

時間や料金などは相談して決められればと思っておりますが、塾に通うよりは高コスパかなと思います。また、基本的にはオンラインでの授業を想定していますが、場所によっては直接の指導が可能です。(プロフィール

これまでは塾講師や高校で働いていたのですが、現在はデータサイエンティストとして活動しています。社会やビジネスで数学がどのように使われているのか、そういった話も交えながら進められればと思っております。

数学に困っている方の一助になれれば幸いです。

ご連絡お待ちしております。

  • URLをコピーしました!

質問や感想はコメントへ!

コメントする

CAPTCHA


目次