概率密度函数

6,722次阅读

共计 3116 个字符，预计需要花费 8 分钟才能阅读完成。

在数学中，连续型随机变量的概率密度函数（在不至于混淆时可以简称为密度函数）是一个描述这个随机变量的输出值，在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。当概率密度函数存在的时候，累积分布函数是概率密度函数的积分。概率密度函数一般以大写“PDF”（Probability Density Function）标记[1]。

概率密度函数有时也被称为概率分布函数，但这种称法可能会和累积分布函数或概率质量函数混淆。
对于一维实随机变量X，设它的累积分布函数是 {\displaystyle F_{X}(x)} F_{{X}}(x)。如果存在可测函数 {\displaystyle f_{X}(x)} f_{{X}}(x)，满足：

{\displaystyle \forall -\infty <a<\infty ,\quad F_{X}(a)=\int _{-\infty }^{a}f_{X}(x)\,dx} \forall -\infty <a<\infty ,\quad F_{X}(a)=\int _{{-\infty }}^{{a}}f_{{X}}(x)\,dx
那么X 是一个连续型随机变量，并且 {\displaystyle f_{X}(x)} f_{{X}}(x)是它的概率密度函数。[2]

性质
连续型随机变量的概率密度函数有如下性质：

{\displaystyle \forall -\infty <x<\infty ,\quad f_{X}(x)\geq 0} \forall -\infty <x<\infty ,\quad f_{{X}}(x)\geq 0
{\displaystyle \int _{-\infty }^{\infty }f_{X}(x)\,dx=1} \int _{{-\infty }}^{{\infty }}f_{{X}}(x)\,dx=1
{\displaystyle \forall -\infty <a<b<\infty ,\quad \mathbb {P} \left[a<X\leq b\right]=F_{X}(b)-F_{X}(a)=\int _{a}^{b}f_{X}(x)\,dx} \forall -\infty <a<b<\infty ,\quad {\mathbb {P}}\left[a<X\leq b\right]=F_{X}(b)-F_{X}(a)=\int _{{a}}^{{b}}f_{{X}}(x)\,dx
如果概率密度函数 {\displaystyle f_{X}(x)} f_{X}(x)在一点 {\displaystyle x} x 上连续，那么累积分布函数可导，并且它的导数： {\displaystyle F_{X}^{\prime }(x)=f_{X}(x)} F_{X}^{{\prime }}(x)=f_{X}(x)

由于随机变量X的取值 {\displaystyle \mathbb {P} \left[a<X\leq b\right]} {\mathbb {P}}\left[a<X\leq b\right] 只取决于概率密度函数的积分，所以概率密度函数在个别点上的取值并不会影响随机变量的表现。更准确来说，如果一个函数和X的概率密度函数取值不同的点只有有限个、可数无限个或者相对于整个实数轴来说测度为0（是一个零测集），那么这个函数也可以是X的概率密度函数。

连续型的随机变量取值在任意一点的概率都是0。作为推论，连续型随机变量在区间上取值的概率与这个区间是开区间还是闭区间无关。要注意的是，概率

{\displaystyle \mathbb {P} \left[X=a\right]=0} {\mathbb {P}}\left[X=a\right]=0，
但 {\displaystyle \{X=a\}} \{X=a\}并不是不可能事件。[2]

例子

连续型均匀分布的概率密度函数
最简单的概率密度函数是均匀分布的密度函数。对于一个取值在区间 {\displaystyle [a,b]} [a,b]上的均匀分布函数 {\displaystyle \mathbf {I} _{[a,b]}} {\mathbf {I}}_{{[a,b]}}，它的概率密度函数：

{\displaystyle f_{\mathbf {I} _{[a,b]}}(x)={\frac {1}{b-a}}\mathbf {I} _{[a,b]}} f_{{{\mathbf {I}}_{{[a,b]}}}}(x)={\frac {1}{b-a}}{\mathbf {I}}_{{[a,b]}}
也就是说，当x 不在区间 {\displaystyle [a,b]} [a,b]上的时候，函数值等于0，而在区间 {\displaystyle [a,b]} [a,b]上的时候，函数值等于 {\displaystyle \scriptstyle {\frac {1}{b-a}}} \scriptstyle {\frac {1}{b-a}} 。这个函数并不是完全的连续函数，但是是可积函数。

正态分布的概率密度函数
正态分布是重要的概率分布。它的概率密度函数是：

{\displaystyle f(x)={1 \over \sigma {\sqrt {2\pi }}}\,e^{-{(x-\mu )^{2} \over 2\sigma ^{2}}}} f(x) = {1 \over \sigma\sqrt{2\pi} }\,e^{- {{(x-\mu )^2 \over 2\sigma^2}}}
随着参数 {\displaystyle \mu } \mu 和 {\displaystyle \sigma } \sigma 变化，概率分布也产生变化。

应用
随机变量X的n阶矩是X的n次方的期望值，即

{\displaystyle \mathbb {E} [X^{n}]=\int _{-\infty }^{\infty }x^{n}f_{X}(x)\,dx} {\mathbb {E}}[X^{n}]=\int _{{-\infty }}^{{\infty }}x^{n}f_{X}(x)\,dx
X的方差为

{\displaystyle \sigma _{X}^{2}=\mathbb {E} \left[\left(X-\mathbb {E} [X]\right)^{2}\right]=\int _{-\infty }^{\infty }(x-E[X])^{2}f_{X}(x)\,dx} \sigma _{X}^{2}={\mathbb {E}}\left[\left(X-{\mathbb {E}}[X]\right)^{2}\right]=\int _{{-\infty }}^{{\infty }}(x-E[X])^{2}f_{X}(x)\,dx
更广泛的说，设 {\displaystyle g} g 为一个有界连续函数，那么随机变量 {\displaystyle g(X)} g(X)的数学期望

{\displaystyle \mathbb {E} [g(X)]=\int _{-\infty }^{\infty }g(x)f_{X}(x)\,dx} {\mathbb {E}}[g(X)]=\int _{{-\infty }}^{{\infty }}g(x)f_{X}(x)\,dx[3]
特征函数
对概率密度函数作类似傅利叶变换可得特征函数。

{\displaystyle \Phi _{X}(j\omega )=\int _{-\infty }^{\infty }f(x)e^{j\omega x}\,dx} \Phi _{X}(j\omega )=\int _{{-\infty }}^{{\infty }}f(x)e^{{j\omega x}}\,dx
特征函数与概率密度函数有一对一的关系。因此，知道一个分布的特征函数就等同于知道一个分布的概率密度函数。[4]

正文完

请博主喝杯咖啡吧！