分位数和分布函数(累积分布函数,CDF)之间有着紧密的数学联系。要理解它们的关系,需先明晰各自的定义。
1. 分布函数(CDF)的定义
设随机变量 的分布函数为 ,则
即, 表示随机变量 取值小于等于 的概率。
2. 分位数的定义
对于 ,下 分位数 定义为满足
的实数 。
直观上, 把分布“切分”为左侧概率为 (\alpha),右侧概率为 (1-\alpha) 的两个部分。例如, 时, 就是中位数。
3. 分位数函数与分布函数的反函数关系
-
分位数函数 是分布函数 的广义反函数:
也就是说,给定一个概率 (\alpha),分位数函数返回使得“左侧概率不少于 (\alpha)”的最小 。
-
对于连续且严格单调的分布函数,分位数函数就是 的反函数:
即
反之
这种情况下,分位数和分布函数是一一对应的[5][6][7]。
4. 例子
- 标准正态分布 ,分布函数记为 。
- 下 (\alpha) 分位数 满足 。
- 例如,,所以中位数为 0。
5. 总结关系
- 分布函数 :已知 ,求概率 。
- 分位数函数 :已知概率 ,求阈值 使 。
二者互为反函数(在连续严格单调情形下),分位数本质上就是分布函数的反解。
直观理解
- 分布函数:固定 ,看有多少概率落在左侧。
- 分位数:固定概率 (\alpha),找对应的 。
常用分位数举例:
- 中位数(50%分位数):
- 第一四分位数(25%分位数):
- 第三四分位数(75%分位数):。