PDF(確率密度関数)
PDF とは
確率密度関数(PDF: Probability Density Function) は、 連続型の確率変数において「ある値の周辺にどの程度確率が集中しているか(≒確率の濃さ)」を示す関数です。
※連続分布では「ある一点の確率」は常に 0
⇒ その代わり、ある範囲に属する確率を考える(=PDF を積分)
- PDF が高い ⇒ その周辺で観測されやすい
- 面積(積分) ⇒ その範囲の確率
数学的定義
確率変数 $( X )$ の PDF を $f(x) $ としたとき:
$$ P(a \leq X \leq b) = \int_a^b f(x)\,dx $$
つまり:
- 範囲 [a, b] に入る確率は、PDF 曲線下の「面積」
- PDF の値そのものは確率ではない(注意)
PDF の性質
| 性質 | 内容 |
|---|---|
| $f(x) \geq 0$ | PDF(確率密度関数)は常に 0 以上(負の確率は存在しない) |
| $\int_{-\infty}^{\infty} f(x)\,dx = 1$ | 全体の面積(確率)は 1 |
| $P(X = a) = 0$ | (連続分布では)点の確率は常に 0 |
代表的な PDF
正規分布
$$ f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right) $$
- 平均 $( \mu )$
- 標準偏差 $( \sigma )$
- 中心に山を持つ左右対称の分布(釣鐘型)
ヒストグラム
- 実測データのヒストグラムは、PDF の近似的な表現
- KDE(カーネル密度推定)を用いると、なめらかな PDF を描画可能
例(Python / seaborn):
import seaborn as sns import matplotlib.pyplot as plt sns.kdeplot(data, bw_adjust=0.5) plt.title("PDF の推定(KDE)") plt.show()
PDF と CDF の違い
| 概念 | 内容 |
|---|---|
| PDF \( f(x) \) | 確率の密度(グラフの高さ) |
| CDF \( F(x) \) | その点以下の累積確率(面積) |
| 関係式 | \( F(x) = \int_{-∞}^x f(t) dt \) |
応用(ERI Project)
- ERI 地震解析における PDF の活用例:
- Δt(発生間隔):
- 逆ガウス分布のような形状になることが多い
- ΔE(エネルギー差):
- やや広がりのある非対称な分布
- Energy(地震エネルギー):
- 右裾の長いパレート分布型など
- PDF を可視化することで:
- データの集中度や外れ値の傾向が一目で分かる
- 理論分布との適合性の確認が可能