7.1.2 最大似然估计

参数的最大似然估计的想法基于大家普遍接受的一个事实, 这个事实为 “小概率事件在一次试验中几乎不可能发生”. 换言之, 在一次试验中发生的事件, 其发生的概率应该比较大. 所以, 若总体 $X \sim F_{X} (\cdot, θ)$ , 当我们有了一组样本观测值 $(x_{1}, x_{2}, \dots, x_{n})$ 时, $θ$ 的取值应该使得样本观测值 $(x_{1}, x_{2}, \dots, x_{n})$ 出现的可能性较大. 为确定出 $θ$ 的具体估计量, 我们要求 $θ$ 的取值应该使得样本观测值 $(x_{1}, x_{2}, \dots, x_{n})$ 出现的可能性达到最大.

我们以总体 $X$ 为连续型随机变量的情形来解释如何得到参数的最大似然估计.

定义 (似然函数, likelihood function)
设 $X$ 的分布密度函数为 $f_{X} (\cdot, θ)$ , 大家知道, 若 $f_{X} (x, θ)$ 在 $x = x_{0}$ 处取值较大, 则 $X$ 取值为 $x_{0}$ 附近的概率也较大. 于是我们要求 $θ$ 的取值使得 $(X_{1}, X_{2}, \dots, X_{n})$ 的联合密度函数在样本观测值 $(x_{1}, x_{2}, \dots, x_{n})$ 处取到最大. 记 $(X_{1}, X_{2}, \dots, X_{n})$ 的联合密度函数为 $L (x_{1}, x_{2}, \dots, x_{n}; θ)$ , 则由命题 6.1.1 (样本联合分布的形式与独立同分布假设) 知,
$L (x_{1}, x_{2}, \dots, x_{n}; θ) = i = 1 \prod n f_{X} (x_{i}, θ) . (7.1.4)$
我们称 $L$ 为 $X$ 的似然函数.
Link to original

至此,

最大似然估计量
我们将求参数 $θ$ 的最大似然估计的问题, 归结为在已有样本观测值 $(x_{1}, x_{2}, \dots, x_{n})$ 前提下, 寻求 $L (x_{1}, x_{2}, \dots, x_{n}; θ)$ 的最大值点 $θ$ 的问题. 记该最大值点为 $θ = T (x_{1}, x_{2}, \dots, x_{n})$ , 则 $θ$ 的 最大似然估计量 就为
$θ_{L} = T (X_{1}, X_{2}, \dots, X_{n}) . (7.1.5)$ Link to original

最大似然估计量求解
为了求得 $L (x_{1}, x_{2}, \dots, x_{n}; θ)$ 的最大值点,往往通过求它的驻点. 即关于 $θ$ 的导数为 0 的点, 但 (7.1.4) 为 $n$ 个函数的乘积,求导比较繁琐. 通常可利用对数函数 $ln$ 的单调性, 将问题转化为求 $ln (L (x_{1}, x_{2}, \dots, x_{n}; θ))$ 的最大值点.
Link to original

Youliang Zhong

Backlinks

Graph View

7.1.2 最大似然估计

定义 (似然函数, likelihood function)

最大似然估计量

最大似然估计量求解