贝叶斯估计

最大似然估计

$P(x|\theta) = \frac{P(\theta|x)P(x)}{P(\theta)}$

公式：$P(\theta|x)=\frac{P(x|\theta)P(\theta)}{P(x)} = P(x|\theta)P(\theta)$ ($P(x)$是常数)
与最大似然估计的区别：最大似然估计认为使似然函数$P(X|\theta)$最大参数的$\theta$即为最好的$\theta$, 此时最大似然估计是将$\theta$看作固定的值，只是其值未知；最大后验概率分布认为$\theta$是一个随机变量，即$\theta$具有某种先验分布，求解时除了要考虑似然函数$P(X|\theta)$，还要考虑$P(\theta)$。最大后验概率估计可以看作是正则化的最大似然估计。在最大似然估计中，由于认为$\theta$是固定的，因此$P(\theta)=1$.

贝叶斯估计是最大后验估计的进一步扩展，贝叶斯估计同样假定$\theta$是一个随机变量，但贝叶斯估计并不是直接估计出$\theta$的某个特定值，而是估计$\theta$的分布。