参数的最大似然估计的想法基于大家普遍接受的一个事实, 这个事实为 “小概率事件在一次试验中几乎不可能发生”. 换言之, 在一次试验中发生的事件, 其发生的概率应该比较大. 所以, 若总体 , 当我们有了一组样本观测值 时, 的取值应该使得样本观测值 出现的可能性较大. 为确定出 的具体估计量, 我们要求 的取值应该使得样本观测值 出现的可能性达到最大.

我们以总体 为连续型随机变量的情形来解释如何得到参数的最大似然估计.

定义 (似然函数, likelihood function)

的分布密度函数为 , 大家知道, 若 处取值较大, 则 取值为 附近的概率也较大. 于是我们要求 的取值使得 的联合密度函数在样本观测值 处取到最大. 记 的联合密度函数为 , 则由 命题 6.1.1 (样本联合分布的形式与独立同分布假设) 知,

我们称 似然函数.

Link to original

至此,

最大似然估计量

我们将求参数 的最大似然估计的问题, 归结为在已有样本观测值 前提下, 寻求 的最大值点 的问题. 记该最大值点为 , 则 最大似然估计量 就为

Link to original

最大似然估计量求解

为了求得 的最大值点,往往通过求它的驻点. 即关于 的导数为 0 的点, 但 (7.1.4) 为 个函数的乘积,求导比较繁琐. 通常可利用对数函数 的单调性, 将问题转化为求 的最大值点.

Link to original