-
公式:$P(\theta|x)=\frac{P(x|\theta)P(\theta)}{P(x)} = P(x|\theta)P(\theta)$ (
$P(x)$ 是常数) -
与最大似然估计的区别:最大似然估计认为使似然函数$P(X|\theta)$最大参数的$\theta$即为最好的$\theta$, 此时最大似然估计是将$\theta$看作固定的值,只是其值未知;最大后验概率分布认为$\theta$是一个随机变量,即$\theta$具有某种先验分布,求解时除了要考虑似然函数$P(X|\theta)$,还要考虑$P(\theta)$。最大后验概率估计可以看作是正则化的最大似然估计。在最大似然估计中,由于认为$\theta$是固定的,因此$P(\theta)=1$.
- 贝叶斯估计是最大后验估计的进一步扩展,贝叶斯估计同样假定$\theta$是一个随机变量,但贝叶斯估计并不是直接估计出$\theta$的某个特定值,而是估计$\theta$的分布。