PDF(確率密度関数)

PDF とは

確率密度関数(PDF: Probability Density Function) は、 連続型の確率変数において「ある値の周辺にどの程度確率が集中しているか(≒確率の濃さ)」を示す関数です。

※連続分布では「ある一点の確率」は常に 0
⇒ その代わり、ある範囲に属する確率を考える(=PDF を積分)
  • PDF が高い ⇒ その周辺で観測されやすい
  • 面積(積分) ⇒ その範囲の確率

数学的定義

確率変数 $( X )$ の PDF を $f(x) $ としたとき:

$$ P(a \leq X \leq b) = \int_a^b f(x)\,dx $$

つまり:

  • 範囲 [a, b] に入る確率は、PDF 曲線下の「面積」
  • PDF の値そのものは確率ではない(注意)

PDF の性質

性質 内容
$f(x) \geq 0$ PDF(確率密度関数)は常に 0 以上(負の確率は存在しない)
$\int_{-\infty}^{\infty} f(x)\,dx = 1$ 全体の面積(確率)は 1
$P(X = a) = 0$ (連続分布では)点の確率は常に 0

代表的な PDF

正規分布

$$ f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right) $$

  • 平均 $( \mu )$
  • 標準偏差 $( \sigma )$
  • 中心に山を持つ左右対称の分布(釣鐘型)

ヒストグラム

  • 実測データのヒストグラムは、PDF の近似的な表現
  • KDE(カーネル密度推定)を用いると、なめらかな PDF を描画可能

例(Python / seaborn):

import seaborn as sns
import matplotlib.pyplot as plt
 
sns.kdeplot(data, bw_adjust=0.5)
plt.title("PDF の推定(KDE)")
plt.show()

PDF と CDF の違い

概念 内容
PDF \( f(x) \) 確率の密度(グラフの高さ)
CDF \( F(x) \) その点以下の累積確率(面積)
関係式 \( F(x) = \int_{-∞}^x f(t) dt \)

応用(ERI Project)

  • ERI 地震解析における PDF の活用例:
    • Δt(発生間隔):
      • 逆ガウス分布のような形状になることが多い
    • ΔE(エネルギー差):
      • やや広がりのある非対称な分布
    • Energy(地震エネルギー):
      • 右裾の長いパレート分布型など
    • PDF を可視化することで:
      • データの集中度や外れ値の傾向が一目で分かる
      • 理論分布との適合性の確認が可能

まとめ

  • PDF は確率の密度(高い=観測されやすい)
  • PDF の積分が確率(全体面積は 1)
  • 点の確率は常に 0(連続分布の特徴)
  • ERI 分析では Δt・ΔE・Energy などに必須

Home