はじめに
本Webサイトの右側のサイドバー(または下側)にある検索窓に
「対数正規分布」
と入力して検索してもなぜかこのページがヒットしませんでした。
そこで、この大変に残念な状況をなんとか改善すべく、対数正規分布の確率密度関数
p(x) &= \frac{1}{x\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(\log x -\mu)^2}{2\sigma^2}\right]\label{eq:lognormaldistribution}
\end{align}
が(右側)ロングテールな分布を持つことを示してみることにしました。
ロングテールな分布とは?
もののWikipediaによりますと[1]、確率変数$X$がすべての$t>0$に対して(\ref{eq:problim})式を満たす確率分布のことをロングテールと呼ぶのだそうです。
\lim_{x\to\infty} P(X > x+t|X > x) &= 1\label{eq:problim}
\end{align}
(\ref{eq:problim})において、$P(A|B)$は条件付き確率を表します。
サクサク計算。
(\ref{eq:lognormaldistribution})式が(\ref{eq:problim})をすべての$t>0$に対して満たすことを計算によって確認してみます。
まず、代入します。
(\ref{eq:problim})式の左辺は…
P(X > x+t|X > x) &= \frac{P(X > x+t)}{P(X > x)} \label{eq:problimsecond}
\end{align}
と変形できます。
スポンサーリンク
また、$P(X > x)$は(\ref{eq:lognormaldistribution})式より、
P(X > x) &= \int_{x}^{\infty}p(y)dy \nonumber \cr
&= \int_{x}^{\infty}\frac{1}{y\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(\log y -\mu)^2}{2\sigma^2}\right]dy \label{eq:probfirst}
\end{align}
と書くことができます。
同様に$P(X > x+t)$についても、
P(X > x+t) &= \int_{x+t}^{\infty}p(y)dy \nonumber \cr
&= \int_{x+t}^{\infty}\frac{1}{y\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(\log y -\mu)^2}{2\sigma^2}\right]dy \label{eq:probsecond}
\end{align}
と書くことができます。
よって、(\ref{eq:problimsecond})式は…
P(X > x+t|X > x) &= \dfrac{\displaystyle\int_{x+t}^{\infty}\frac{1}{y\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(\log y -\mu)^2}{2\sigma^2}\right]dy}{\displaystyle\int_{x}^{\infty}\frac{1}{y\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(\log y -\mu)^2}{2\sigma^2}\right]dy} \label{eq:problimthird}
\end{align}
となります。ここまでの式で積分の変数が$y$になっているのには特に意味はありませんので、気にしない方向でお願いいたします。
さらに、$u = \log y$とおいて、(\ref{eq:problimthird})式の分子と分母の積分式の変数変換を行うと…
P(X > x+t|X > x) &= \dfrac{\displaystyle\int_{\log(x+t)}^{\infty}\frac{1}{e^u\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(u -\mu)^2}{2\sigma^2}\right]\dfrac{dy}{du}du}{\displaystyle\int_{\log(x)}^{\infty}\frac{1}{e^u\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(u -\mu)^2}{2\sigma^2}\right]\dfrac{dy}{du}du} \nonumber \cr
&= \dfrac{\displaystyle\int_{\log(x+t)}^{\infty}\frac{1}{e^u\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(u -\mu)^2}{2\sigma^2}\right]e^udu}{\displaystyle\int_{\log(x)}^{\infty}\frac{1}{e^u\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(u -\mu)^2}{2\sigma^2}\right]e^udu} \nonumber \cr
&= \dfrac{\displaystyle\int_{\log(x+t)}^{\infty}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(u -\mu)^2}{2\sigma^2}\right]du}{\displaystyle\int_{\log(x)}^{\infty}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(u -\mu)^2}{2\sigma^2}\right]du}\label{eq:problimfourth}
\end{align}
と変形できて、分母及び分子に正規分布の確率密度関数を積分したものが現れます。
ロピタルの定理を使う。
(\ref{eq:problimfourth})式は直接計算することが難しそうです。
テイラー展開をしても計算が捗ることはなさそうです。
そこで、ロピタルの定理が適用できるかどうかを検討し、分子及び分母の式をもう少し簡単にすることができないか考えます。
$x \to \infty$の時に分母及び分子がともに0になることと、(\ref{eq:problimfourth})式の分母を$x$で微分した式
\dfrac{d}{dx}\displaystyle\int_{\log(x)}^{\infty}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(u -\mu)^2}{2\sigma^2}\right]du &= -\frac{1}{x\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(\log x -\mu)^2}{2\sigma^2}\right] \label{eq:denominator}
\end{align}
が$x > 0$では0にならないことを確認の上、(\ref{eq:problimfourth})式の分子及び分母をそれぞれ$x$で微分し、その結果得られた式の$x \to \infty$における極限を計算してみます。
上記の極限が存在すれば、ロピタルの定理を適用することができます。
(\ref{eq:problimfourth})式の分子及び分母を$x$で微分した式は…
\dfrac{\dfrac{d}{dx}\displaystyle\int_{\log(x+t)}^{\infty}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(u -\mu)^2}{2\sigma^2}\right]du}{\dfrac{d}{dx}\displaystyle\int_{\log(x)}^{\infty}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(u -\mu)^2}{2\sigma^2}\right]du} &= \dfrac{-\dfrac{1}{(x+t)\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(\log (x+t) -\mu)^2}{2\sigma^2}\right]}{-\dfrac{1}{x\sqrt{2\pi\sigma^2}}\exp\left[-\frac{(\log x -\mu)^2}{2\sigma^2}\right]} \nonumber \cr
&= \dfrac{x}{x+t}\,\exp\left[-\dfrac{(\log (x+t) -\mu)^2-(\log x -\mu)^2}{2\sigma^2}\right] \nonumber \cr
&= \dfrac{x}{x+t}\,\exp\left[-\dfrac{(\log (x+t) -\mu)^2}{2\sigma^2}\left[1-\dfrac{(\log x -\mu)^2}{(\log (x+t) -\mu)^2}\right]\right] \nonumber \cr
&= \dfrac{x}{x+t}\left[\exp\left[-\dfrac{(\log (x+t) -\mu)^2}{2\sigma^2}\right]\right]^\left[1-\frac{(\log x -\mu)^2}{(\log (x+t) -\mu)^2}\right] \label{eq:problimfifth}
\end{align}
のように計算できます。
さらに、(\ref{eq:problimfifth})式の右辺を$x \to \infty$としたときの極限をとります。
ここで、
\lim_{x \to \infty} \dfrac{x}{x+t} &= 1 \label{eq:limxxt} \cr
\lim_{x \to \infty} \exp\left[-\dfrac{(\log (x+t) -\mu)^2}{2\sigma^2}\right] &= 0 \label{eq:limexp}
\end{align}
となることと、
\lim_{x \to \infty} \frac{(\log x -\mu)^2}{(\log(x+t) -\mu)^2} &= \lim_{x \to \infty} \dfrac{\dfrac{2}{x}(\log x – \mu)}{\dfrac{2}{x+t}(\log(x+t) – \mu)} \label{eq:lhopitalfirst} \cr
&= \lim_{x \to \infty} \dfrac{(x+t)(\log x – \mu)}{x(\log(x+t) – \mu)} \nonumber \cr
&= \left[ \lim_{x \to \infty} \dfrac{x+t}{x} \right] \left[\lim_{x \to \infty} \dfrac{\log x – \mu}{\log(x+t) – \mu} \right] \nonumber \cr
&= \lim_{x \to \infty} \dfrac{x}{x+t} \label{eq:lhopitalsecond} \cr
&= 1 \label{eq:limlogfirst}
\end{align}
である($x > e^{\mu}-t$であれば(\ref{eq:lhopitalfirst})式右辺の分母が0にはならないこと、また$x > 0$であれば(\ref{eq:lhopitalsecond})式右辺の分母は0にはならないことから(\ref{eq:lhopitalfirst})式及び(\ref{eq:lhopitalsecond})式の両式に対してロピタルの定理を使用。)ことから、
\lim_{x \to \infty} \left[ 1 – \frac{(\log x -\mu)^2}{(\log(x+t) -\mu)^2} \right] &= 0 \label{eq:limlogfinal}
\end{align}
と計算できることを利用します。
(\ref{eq:limxxt})、(\ref{eq:limexp})及び(\ref{eq:limlogfinal})の各式を利用することによって、(\ref{eq:problimfifth})式の右辺を$x \to \infty$としたときの極限は、
\lim_{x \to \infty} \dfrac{x}{x+t}\left[\exp\left[-\dfrac{(\log (x+t) -\mu)^2}{2\sigma^2}\right]\right]^\left[1-\frac{(\log (x+t) -\mu)^2}{(\log x -\mu)^2}\right] &= 1\cdot 0^0 \nonumber \cr
&= 1 \label{eq:problimsixth}
\end{align}
と計算できます($0^0 = 1$としています)。
(\ref{eq:problimfourth})の左辺が1であること、すなわち極限が存在することがわかったので、(\ref{eq:problimsecond})式が成立することがわかります。$\blacksquare$
まとめ
適用条件を慎重に確認しつつ、普段はあまり使わないロピタルの定理を使って計算してみたり、$0^0 = 1$としてみたりしていますが、対数正規分布がロングテールであることを示すことができました。
何かの機会に参考にしていただければ幸いです。
この記事は以上です。