按上所述,总体 X 是我们研究的目标,而出发点是样本 (X1,X2,⋯,Xn), 那么研究的途径或手段就是所谓的统计量.
它的直观意思是要通过对样本观测值的处理, 来回答或推断总体的分布、数字特征、参数等. 所以统计量就是样本 (X1,X2,⋯,Xn) 的一个函数, 但其中不能含未知参数, 否则由观测值得不出任何结果.
常用的统计量有以下几种:
- 样本均值: Xˉ=n1(X1+X2+⋯+Xn)=n1i=1∑nXi.
- R 软件中用 mean(x) 来计算, 其中 x 为样本观测值 (x1,x2,⋯,xn) (下同).
- 样本方差: Sn2=n1i=1∑n(Xi−Xˉ)2⋅R 软件中用 n/(n−1)∗var(x) 来计算. 修正样本方差: Sn∗2=n−11i=1∑n(Xi−Xˉ)2
- R 软件中用 var(x) 来计算. 显然, nSn2=(n−1)Sn∗2.
- 样本 k 阶原点矩: Xk=n1i=1∑nXik.
- 样本 k 阶中心矩: n1i=1∑n(Xi−Xˉ)k.
- 顺序统计量: X(1)≤X(2)≤⋯≤X(n), 其中
- X(1)=min{X1,X2,⋯,Xn},
- X(n)=max{X1,X2,⋯,Xn},
- 而 X(k) 是将 X1,X2,⋯,Xn 的取值从小到大排列第 k 位的值.
- 样本中位数:
X={X(2n+1),21(X(2n)+X(2n+1)), 若 n 为奇数, 若 n 为偶数.
- $\mathrm{R}$ 软件中用 median(x)来计算.
7. 样本极差: RnX=X(n)−X(1)
- R 软件中用 max(x)−min(x) 来计算.