参数的最大似然估计的想法基于大家普遍接受的一个事实, 这个事实为 “小概率事件在一次试验中几乎不可能发生”. 换言之, 在一次试验中发生的事件, 其发生的概率应该比较大. 所以,若总体 , 当我们有了一组样本观测值 时, 的取值应该使得样本观测值 出现的可能性较大. 为确定出 的具体估计量,我们要求 的取值应该使得样本观测值 出现的可能性达到最大.
我们以总体 为连续型随机变量的情形来解释如何得到参数的最大似然估计.
定义 (似然函数)
设 的分布密度函数为 ,大家知道, 若 在 处取值较大,则 取值为 附近的概率也较大. 于是我们要求 的取值使得 的联合密度函数在样本观测值 处取到最大. 记 的联合密度函数为 , 则由命题 6.1.1 知,
我们称 为 的似然函数.
Link to original
至此, 我们将求参数 的最大似然估计的问题, 归结为在已有样本观测值 前提下, 寻求 的最大值点 的问题. 记该最大值点为 ,则 的最大似然估计量就为
为了求得 的最大值点,往往通过求它的驻点. 即关于 的导数为 0 的点,但 (7.1.4) 为 个函数的乘积,求导比较繁琐. 通常可利用对数函数 的单调性, 将问题转化为求 的最大值点.