本章重点讨论了随机变量的概念,以及如何描述随机变量的取值规律,即其分布。

核心概念

  • 随机变量 (Random Variable)

    • 定义 2.1.1:一个将随机试验结果 (基本事件 ) 映射到实数 () 的函数 .
    • 关键条件:对于任意实数 ,使得 的基本事件 构成的集合 必须是一个事件,即属于事件域
    • 意义:这个条件确保了概率 对于所有 都是有明确定义的。它将随机试验的结果数值化,并与概率测度联系起来。
    • 直观理解:在试验前无法确定其具体取值的量,其取值由随机试验的结果决定。
  • 分布函数 (Distribution Function)

    • (在提供的 Chapter 2 节选中未给出显式定义,但在定义随机变量时提到了其重要性,并在定义连续型随机变量时作为基础)。它是描述随机变量概率分布的通用方法。对于随机变量 ,其分布函数定义为
    • 分布函数完整刻画了随机变量的统计特性。
  • 随机变量的类型

    • 离散型随机变量 (Discrete Random Variable):只取有限个或可数无限个不同的值 [26 (针对随机向量,但概念通用)]。
      • 通过概率分布列 (Probability Mass Function, PMF) 来描述其分布:列出所有可能的取值 及其对应的概率 。需满足
    • 连续型随机变量 (Continuous Random Variable):如果存在一个非负函数 ,使得其分布函数 可以表示为
      • 通过分布密度函数 (Probability Density Function, PDF) 来描述其分布。
      • PDF 的性质:
        • 对于所有 成立。
        • (由 和定义推导)。
        • 对于任意区间 ,概率 (由定义推导)。
        • 的连续点处,
  • 重要的特殊分布

    • 泊松分布 (Poisson Distribution):常用于描述在一定时间或空间内稀有事件发生的次数。
      • 参数为
      • 当二项分布 很大且 很小时,泊松分布是其近似,参数
      • 例:一段时间内查号台收到的呼唤次数、一段时间内放射性物质分裂落到某区域的质点数。
    • 指数分布 (Exponential Distribution):常用于描述稀有事件发生的时间间隔或某种元件的寿命。
      • 参数为
      • 密度函数: (),其他区域为 0。
      • 分布函数: (),其他区域为 0。

常见难点

  • 理解随机变量的定义:它是一个函数,不是一个简单的变量。理解定义中 条件的意义,它保证了概率的可计算性。
  • 区分离散型和连续型随机变量的描述方式:离散型用概率分布列 (PMF),连续型用概率密度函数 (PDF)。理解 PMF 是概率,而 PDF 是概率密度,本身不是概率值(单个点概率为 0),概率是 PDF 曲线下的面积。
  • 掌握分布函数 的性质及其与 PMF 或 PDF 之间的关系(求和/积分,差分/求导)。
  • 理解和应用特定分布(如泊松分布和指数分布)的典型场景和计算方法。