第一章 随机事件与概率
1.1 随机现象与随机试验
自然界和人类社会的世间万象, 大体可分为两类, 一类是确定性现象, 另一类是偶然性现象. 我们所说的确定性现象是指, 当满足一定条件时, 该类现象的结果是可以预见的. 比如, 明天太阳会从东方升起, 掷一枚石子会落地等等. 而偶然性现象则指那种结果无法预见的现象. 比如某强台风未来 24 小时中心最大风速和走向, 明天股市的涨与跌, 掷一颗骰子出现的点数等等. 在偶然性现象中, 有一部分是可以在基本相同的条件下重复观测或重复试验的, 并且随着观测或试验次数的增多, 会看出试验的不同结果出现的可能性有大有小, 也就是我们通常所讲的呈现出统计规律, 这种现象称为随机现象. 仔细想来, 我们生活的世界里, 随机现象是大量存在的, 并且影响着我们生活的方方面面. 为了刻画和研究随机现象, 数学家经过不懈的努力, 开创了概率论这门重要而独特的数学分支. 换言之, 概率论是研究随机现象的统计规律的科学, 它的独特之处在于用确定的数学研究非确定的现象 (随机现象).
1.1.1 随机试验与随机事件
用确定性的数学研究随机现象, 从何入手呢? 人们在建立数学模型时, 引进了三个最基本的概念, 它们是随机试验、随机事件和概率.
我们把对随机现象的一次观测或实际实验, 统称为随机试验, 其基本意义是
(1) 试验可以在基本相同的条件下大量重复.
(2)试验会出现的那些结果是可预知的.
(3) 每次试验将出现哪一个结果是无法预知的.
我们将随机试验的结果称为随机事件, 简称为事件. 而概率则是随机事件发生的可能性大小的一种度量, 这是用概率论学科研究随机现象的关键切入点. 然而如何规定或定义这个度量却非易事, 我们将在后文中仔细讨论.
例 1.1.1 掷一颗骰子, 观察其落定后朝上面出现的点数, 这就是一个随机试验. 而 出现的点数为奇数 出现的点数为偶数 出现的点数小于 3 } 等都是事件. 若骰子均匀且每次掷法随意, 则依我们后面介绍的概率的古典定义, 的概率应分别为 .
例 1.1.2 设地铁每 5 分钟开出一列, 观测一位乘客的等待时间, 这也是一个随机试验. 而 等待时间不超过 2 分钟 等待时间多于 2 分钟 , 等待时间介于 1 分钟到 2 分钟之间 等都是事件. 若乘客随意到达,则依我们后面介绍的概率的几何定义, 的概率应分别为 .
1.1.2 事件的关系与运算
前已指出, 概率论的研究对象是随机现象的统计规律, 最终回答的问题归结为一个事件发生的可能性的大小, 即事件发生的概率有多大. 在分析计算一个较为复杂的事件的概率时, 人们往往用较为简单事件的运算来表达复杂事件, 进而通过计算简单事件的概率来计算复杂事件的概率. 所以本小节介绍事件之间的关系与运算.
在观察一个随机现象时, 某个结果 (或事件) 每次都会出现 (或发生), 这种事件我们称之为必然事件, 而某个结果 (或事件) 每次都不出现, 这种事件我们称之为不可能事件. 比如, 在例 1.1.1 中的 {出现的点数不超过 6 } 和例 1,1.2 中的 {等待时间不超过 5 分钟}, 都是必然事件. 而 {出现的点数为 7 } 和 {等待时间超过 5 分钟} 都是不可能事件.
通常用 表示必然事件,而用 表示不可能事件. 这两个事件其实不是随机的, 只是为了以后表述的方便而引进的, 这一点, 与微积分学中把常数也叫变量是雷同的.
事件的关系
在观察随机现象时,一次试验中若事件 发生,则事件 也发生,我们称 包含 ,记为 . 若 且 ,则称 与 相等,记为 . 一次试验中事件 不发生这样的结果,称为 的对立事件,记为 . 若每次试验中, 和 不会同时出现,则称 与 互不相容.
在例 1.1.1 中,{出现的点数小于 出现的点数小于 ,且 与 互不相容. 在例 1.1.2 中, 等待时间多于 3 分钟 等待时间多于 2 分钟 , ,且 与 互不相容. 另外,规定 .
事件的运算
- 事件的积 (或交).
设 和 为任意两事件,一次试验中,若 和 都出现,这样的结果称为 与 的积 (或交). 记为 (或 ). 换言之, 表示 和 都出现这样的试验结果.
例 1.1.3 (例 1.1.1 续) 沿用例 1.1.1 的有关记号, 则有
出现点数为 ,
出现的点数为 2 ,
.
- 事件的和 (或并)
设 和 为任意两事件,一次试验中,若 或 至少出现一个,这样的结果称为 与 的和 (或并). 记作 . 也就是说, 表示 和 至少出现一个这样的结果.
例 1.1.4 (例 1.1.2 续) 沿用例 1.1.2 的有关记号, 则有
等待时间超过 1 分钟 ,
.
- 事件的差
设 和 为任意两事件,一次试验中,若 出现但 不出现,这样的结果称为 与 的差. 记作 (或 ). 也就是说, 表示 出现但 不出现这样的结果.
例 1.1.5 (例 1.1.1 续) 沿用例 1.1.1 的有关记号, 则有
出现的点数为 ,
出现的点数为 ,
例 1.1.6 设有 三个事件,则如下的事件可以用事件的运算表示为
(1) 和 都发生但 不发生 ,
(2) 和 都不发生但 发生 ,
(3) 和 都发生 ,
(4) 和 都不发生 ,
(5) 和 不都发生 ,
(6) 和 中恰有两个发生 ,
(7) 和 中至少有两个发生
(8) 和 中最多有一个发生 .
例 1.1.7 在飞碟射击比赛中, 假设规定每位射手连续射击三次. 试用事件的运算表示下列各事件.
(1) 三次射击都射中 .
(2) 三次射击中只射中两次 .
(3) 三次射击中至少有一次未射中 .
解 记 第 次射中目标 .
(1) .
(2) {三次射击中只射中两次} 就是三次中有一次未射中, 而其余两次射中, 所以
(3) {三次射击中至少有一次未射中} 就是 “或者全未射中, 或者恰有一次未射中,或者恰有两次未射中”,也就是 “不是三次都射中”,亦即 “ 和 中至少有一个发生”, 所以
例 1.1.8 图 1.1 是一个开关电路, 试用各开关的 “开” 或 “闭” 表示 “灯亮”. 记 为第 个开关闭合, 灯亮 . 由于要使电路接通当且仅当 “开关 1 和 2 同时闭合或者开关 3 或者开关 4 至少有一个闭合”, 所以
图 1.1 开关电路示意图
事件运算的法则
前面我们定义了事件的积 (交)、和 (并)、差及对立等运算, 与算术运算和极限运算等类似, 为分析计算较为复杂事件的概率, 我们还需熟悉事件运算的法则. 这些运算法则, 读者在例 1.1.6 和例 1.1.7 中已经有所体会了.
首先, 对于积 (交), 和 (并) 运算有
(1) 结合律 由于 和 都表示 至少发生一个, 所以
而 和 都表示 都发生,所以
(2) 交换律
(3) 分配律
事实上,若 发生,则 发生且 和 至少发生一个. 若 发生,则 发生. 若 发生,则 发生. 于是有
反过来,若 发生,则 和 至少发生一个. 若 发生,则 和 都发生,从而 发生. 若 发生,则 和 都发生,从而 发生. 于是又有
这说明 (1.1.4) 成立.
另外, 读者还可以自己仿照以上说明, 得到
对于积 (交)、和 (并) 及对立运算还有
(4) 对偶律
因为 表示 “不是 和 至少发生一个”,亦即 和 都不发生,所以有
同理, 可以说明
1.2 概率的定义
前已指出, 概率论在研究随机现象的统计规律时, 是试图用一个数刻画一个随机事件发生的可能性的大小, 那么这个数存在吗? 对于一个事件, 这个数应如何规定呢?
1.2.1 概率的统计定义
首先, 大量的事实表明, 人们在对某一随机现象进行大量的重复观测时, 发现随着观测次数 的增加,某一结果 (事件) 发生次数 与 比值 (频率)
会在某一个介于 0 和 1 之间的数 附近摆动,我们称 为事件 发生频率的稳定值. 这个 反映出事件 发生的可能性的大小,称之为 发生的概率,这便是概率的统计定义.
例如, 我们用同一种方式一次次地掷一枚均匀的骰子, 观察出现点数的情况. 若投掷次数 ,也许看不出各点出现的频率接近 . 但若 或 ,就会发现各点出现的频率与 很接近. 在概率论发展的历史上,曾有蒲丰 (Buffen) 和皮尔逊 (Pearson) 等人具体做过投均匀硬币的试验, 从中观测到随着投掷次数的增加, 出现正面和出现反面的频率越来越接近 50%.
概率的统计定义使人们相信可以用一个介于 0 和 1 之间的数来表示一个事件发生的可能性的大小, 即事件的概率是客观存在的, 但这种定义无法用来计算事件的概率, 因为试验次数多大才算合适, 无法确定. 另外, 所谓 “频率的稳定值”, 只有在概率的公理化定义之后, 用后文介绍的 “大数定律” 才能明确阐述 (见 5.1}$ 推论 5.1.1). 于是,人们着手探讨概率的其他定义,比如针对某些特殊的随机现象, 给出计算概率的合理方法或公式, 这就是我们本节下面介绍的概率的古典定义和几何定义.
1.2.2 概率的古典定义
定义 1.2.1 设随机试验只有 等 个结果,每次试验有且只有其中的一个发生,每个结果发生的可能性大小相同. 则定义事件 发生的概率为
其中 为事件 中包含 中元素的个数.
我们称这种计算概率的数学模型为古典概型.
显然,例 1.1.1 中 的概率正是按 (1.2.1) 来计算的.
例 1.2.1 袋中有 3 只白球 2 只红球, 现从袋中任取两只球, 试求以下各事件的概率.
(1) 取得的两只球都是白球 .
(2) 取得的两只球都是红球 .
(3) 取得的球 1 只为白球 1 只为红球 .
解 因为是 “任取” 两球, 所以取到 5 球中的任意两只球的可能性相同. 设想将 5 只球从 1 到 5 编号,那么,从中取出两只球共有 种不同的结果,所以 .
(1)由于袋中有 3 只白球, 取出的两只白球必然在此 3 只球中抽取. 所以 ,于是
(2) 由于袋中有两只红球,取出的两只红球就只能是这两只红球,所以 1, 于是
(3) 由于袋中有 3 只白球两只红球, 取出的 1 只白球应在 3 只白球中抽取, 1 只红球应在两只红球中抽取. 所以, 1 只白球的取法有 3 种, 对白球的每种取法. 红球的取法有两种,所以 ,于是
注: 这里及以后用专门的记号 代替记号 .
例 1.2.2 试用古典概型解释划拳时叫哪个数最容易取胜.
甲乙两人划拳时,每人等可能地伸出 0,1,2,3,4,5 个指头,同时口中叫出 0,1. 等 11 个数字,每局若有一人叫出的数字等于两人伸出指头的和数就算该人赢, 两人都叫对或两人都叫错为平局.
我们用二维数组(x, y)来记甲,乙伸出指头数,共有 种出拳方法, 而
和数为 ,
和数为 ,
和数为
和数为 ,
和数为 ,
和数为 ,
和数为 ,
和数为
和数为 ,
和数为
和数为 .
所以 “叫 5 而胜” 的概率最大,
1.2.3 概率的几何定义
定义 1.2.2 设随机试验是往区域 里投点,点落到 中某子区域 的可能性的大小只与 的度量大小有关,而与 的形状和位置无关,则定义
其中 表示几何度量,它可以是长度,面积,体积等.
我们称这种计算概率的数学模型为几何概型.
显然,例 1.1.2 中 的概率正是按 (1.2.2) 来计算的.
例 1.2.3 (约会问题) 两人相约在 7 点到 8 点间在某地会面, 先到者等候另一人 20 分钟, 过时即离去. 试求这两人能会面的概率.
解 依题意,两人都在 7 点到 8 点间的任意时刻到达,亦即在 的任意点到达,设 和 分别为两人到达的时刻,则两人到达的时刻为二维区域 内的所有点,而两人能会面当且仅当
即能会面的到达时刻点(x, y)所形成区域的面积为,边长为 60 的正方形面积,减去 2 个直角边长为 40 的直角三角形面积, 所以
1.2.4 概率的公理化定义
前已指出, 概率的统计定义不能用来计算事件的概率, 更不便分析复杂随机现象的统计规律, 而概率的古典定义和几何定义又是基于某些具体的随机试验模型给出的, 并且该二类模型中都有 “等可能性” 这样一个苛刻的要求. 不能用来分析计算一般随机现象的统计规律, 这促使人们设法建立一套概率的公理化体系, 以便演绎地分析各类随机现象. 经过不断探索, 直到 20 世纪 30 年代. 以俄国数学家柯尔莫哥洛夫 (A. H. Koıмогоров) 为代表的数学家建立了概率的公理化定义, 该定义的基本思想是把随机事件看作集合, 从而事件的和、积、对立及差等运算分别对应并、交、余和差等集合运算 (这一点,读者已在例 1.1.3~ 例 1.1.5 中体会到了), 而把概率定义为集合的测度, 从而把概率论建立在测度论的基础上, 也使所有的讨论都在概率空间的框架下进行. 这里对应于前述随机试验,随机事件和概率三个直观概念的分别是基本事件空间 (或称样本空间),事件域 (或称事件 代数) 和概率测度 .
基本事件空间
定义 1.2.3 设 为一些事件构成的集合,如果每次试验有且仅有 中的一个事件发生,则称 为基本事件空间 (或样本空间),而称 中的事件为基本事件 (或样本点)
从定义 1.2.3 中我们看到,基本事件空间 是所有基本事件构成的集合 (全集), 基本事件之间互不相容, 且它们的和为必然事件. 其他事件则包含若干个基本事件,也就是 的一个子集. 称一事件 发生,当且仅当 中的一个基本事件发生. 所以,称全集 为必然事件,称空集 为不可能事件.
例 1.2.4 (例 1.1.1 续) 记 出现的点数为 ,则 为一基本事件空间,其中有 6 个基本事件. , ,且 也是基本事件空间,其中只有两个基本事件.
事件域(F)
事件域是人们研究随机现象时所感兴趣的事件集合, 由于事件经运算后仍为事件, 自然要求该集合对事件的运算封闭, 即其中的事件经事件运算之后仍然在该集合中, 这一性质可以概括为如下的定义 1.2.4.
定义 1.2.4 设 是基本事件空间, 是 的一些子集所构成的集合 (类). 如果满足下列条件:
(1) .
(2) 若 ,则 .
(3) 若 ,则 ,
则称 为事件域,并称 中的元素 (即 的某个子集) 为事件.
引进事件域定义的意义还在于对于同一个随机试验, 不同的观测者关心的事件可以不同.
例 1.2.5 (例 1.1.1 和例 1.2.4 续) 沿用例 1.1.1 和例 1.2.4 的记号,则 和 都为事件域.
概率测度(P)
概率测度是从我们日常生活中称重和量长度等度量方法抽象出来的. 比如, 两个西瓜的总重量等于各西瓜重量的和, 两个不重叠的线段的总长度等于各线段长度之和. 而称重的度量单位有千克, 磅等, 量长度的单位有米, 英尺等. 而概率测度则是事件域 中事件的一种度量,一个事件在该度量下的大小,代表该事件发生的可能性的大小.
定义 1.2.5 设 是随机试验的基本事件空间, 为定义在事件域 到实数集 的映射,满足:
(1) 非负性 对任一事件 ,有 .
(2) 规范性 .
(3) 可列可加性 若事件 ,且两两互不相容,则
则称 为事件域 上的概率测度,而称 为事件 的概率.
显然,前面给出的概率的古典定义和几何定义,都满足定义 1.2.5 中的 (1) (3), 从而都是概率测度.
通常,针对研究的某一随机现象,都要先确定基本事件空间 ,事件域 和概率测度 ,将三者作为一个整体,我们称 为概率空间,概率论的所有研究都是在这个空间上进行的.
概率的性质
由定义 1.2.5, 我们可以得到概率测度的一些常用的性质.
定理 1.2.1 设 为概率空间,则对 中的事件,有
(1) .
(2) 有限可加性 若 两两互不相容,则
(3) .
(4) 单调性和可减性 若 ,则有
(5) 加法公式
(6) 上 (下) 连续性 若 ,则
若 ,则
证明 (1) 由于
从而,由概率 的可列可加性,有
这说明 .
(2) 由于
从而,由概率 的可列可加性,有
但 ,所以 (2) 成立.
(3) 由于 ,且 与 互不相容,所以由 (2) 的结论有
而 和 都为有限数,所以 .
(4) 由于 ,且 与 互不相容,所以由 (2) 的结论有
由定义 1.2.5 中的 (1) 即知 (4) 成立.
(5) 由于 ,而 ,从而由 和 知 (5) 成立.
(6) 这里只证下连续性 (上连续性留给读者证明). 由于 有 等事件互不相容,且
从而, 由概率的可列可加性有
例 1.2.6 一个箱子中装有 36 只灯泡, 其中 32 只为一等品, 4 只为二等品, 现从中任取 3 只, 试求取出的 3 只灯泡中至少有 1 只为二等品的概率.
解 记 取出的 3 只灯泡中至少有 1 只为二等品 取出的 3 只灯泡中恰有 只为二等品 ,则 互不相容,且 . 于是
而
所以
1.3 条件概率与独立性
由概率的公理化定义, 概率论的基础是抽象的测度论, 而概率论之所以有广泛的应用, 关键在于我们这里要引入的条件概率和独立性.
1.3.1 条件概率
对于一个随机试验,基本事件空间为 ,事件 的概率 是在 的每个基本事件都可能发生的前提下, 事件发生的可能性的大小. 如果预先知道, 每次试验中事件 一定发生,那么一次试验中,事件 出现的概率就称为事件 发生的条件下事件 发生的条件概率,记为 .
例如, 一副扑克牌中有 54 张, 除了黑桃, 红桃, 梅花, 方块各 13 张之外, 还有大王,小王各一张. 现从中任取一张,记 取得的扑克为黑桃 取得的扑克为黑桃}. 这里试验有 54 种不同的结果, 且是 “任取” 一张, 即每个结果发生的可能性相同, 所以按古典概型计算, 有
如果事先知道取得的扑克一定是黑桃,即每次试验中事件 一定发生,此时基本事件空间中就只有 13 个等可能事件,此时取得的扑克为黑桃 的 (条件) 概
率应为
对于一般的随机试验, 以下条件概率的定义是合理的.
定义 1.3.1 设 为概率空间, ,且 ,则定义
为 发生的条件下 发生的条件概率.
定义 1.3.1 中要求 ,是因为 (1.3.1) 中的分母不能为零. 这一要求从概率意义上讲并不苛刻,因为若事件 发生的可能性为零,在此条件下任意事件 发生的 (条件) 概率也应为零. 另外,从一般理论分析的角度讲,可通过引入 “条件数学期望” 的一般定义,涵盖 的情形,这已超出本书的知识范围.
显然,若取定 且 ,对任意事件 ,定义
则 仍为 上的概率测度,亦即 也是概率空间. 这一点,留给读者根据定义 1.2.5 去验证.
1.3.2 乘法公式
将 (1.3.1) 作等式变形, 得
公式 (1.3.2) 有重要的概率意义,我们称为乘法公式. 它告诉我们,两事件 与 乘积(AB)的概率等于 的概率乘 发生的条件下 发生的条件概率,这个公式所反映出的思想, 在进行较为复杂的分析计算时是很有指导意义的.
例 1.3.1 盒子中装有 10 只晶体管, 4 只坏的 6 只好的. 现从盒中任取两次, 一次取出一只, 第一次取出的不放回.
(1) 若已经发现第一次取出的是好的, 试求第二只也是好晶体管的概率.
(2)试求两次取出的都是好晶体管的概率.
解 记 第 次取出的是好的 .
(1) 方法 1 将 10 只晶体管从 1 到 10 编号, 按古典概型及 (1.3.1) 计算.
由于是任意地,无放回地抽取,试验有 种不同结果,各结果发生的可能性相同. 而第一次取出的是好晶体管的结果有 种,两次取出的都是好晶体管的结果有 种,所以
方法 2 第一次取出的是好的, 第二次抽取时, 盒中共有 9 只晶体管 5 只好的 4 只坏的,从中任取一只是好的概率为 ,亦即
(2)方法 1 将 10 只晶体管从 1 到 10 编号, 按古典概型及 (1.3.1) 计算
由于是任意地,无放回地抽取,试验有 种不同结果,各结果发生的可能性相同. 而两次取出的都是好晶体管的结果有 种结果,所以
方法 2 按 (1.3.2) 计算,
将 (1.3.2) 稍作推广, 我们得到下述定理.
定理 1.3.1 (乘法公式) 设 为概率空间, 且 ,则
证明 反复应用 (1.3.2), 有
例 1.3.2 在一副扑克牌中无放回地任取 4 张扑克, 试求以下事件的概率
(1)取出的扑克依次为黑桃,红桃,梅花和方块.
(2)取出的扑克各花色恰有一个.
(3) 取出的扑克全是黑桃.
解 (1) 由于试验是无放回抽取, 每抽取一次后扑克少 1 张, 但取走某花色的 1 张扑克后, 其他花色的扑克仍有 13 张, 所以依 (1.3.3) 有
.
(2)各花色的排列方式有 4 ! 种, 所以由概率的可加性有
.
(3)从 13 张黑桃中依次取出 4 张, 从第一次到第四次抽取, 分别有 13, 12, 11, 10 种不同取法, 而对于每种取法, 所以依 (1.3.3) 有
当然, 例 1.3.2 也可以用古典概型求解, 请读者具体计算一下, 以体会乘法公式的用处.
1.3.3 全概率公式与贝叶斯公式
由概率的定义 1.2.5, 大家看到, 概率测度除了非负性和规范性外, 就只有可列可加性了. 可以预见, 在分析计算较为复杂的事件的概率时, 可用的性质只有可列可加性. 也就是说, 通过将较为复杂事件分解为有限多个或可列多个互不相容的较为简单事件的和, 可以将复杂事件的概率表示为简单事件的概率之和. 这个思想虽然简单, 但却是贯穿概率论学科的基本思想.
在有些随机试验中,一个较为复杂的结果 可能与另外若干个不同时发生的结果 等相联系 (或者说 是导致 发生的原因). 也就是说,一次试验中 只能与 中某一个同时发生,且二者同时发生的概率容易计算,此时 的概率就可以用定理 1.3.2 给出的全概率公式计算. 还可以用定理 1.3.3 给出的贝叶斯 (Bayes) 公式计算 .
定理 1.3.2 (全概率公式) 设 为概率空间, ,且 ,则
证明 由 ,知 . 所以,由 互不相容和概率的可列可加性有
例 1.3.3 袋中装有 只白色乒乓球, 只黄色乒乓球. 现从中无放回地摸两次, 每次摸出 1 球. 试求第二次摸得黄球的概率.
解 记 第二次摸得黄球 . 由于是无放回抽取,所以第一次抽取的结果会引起第二次抽取时袋中白球和红球个数的变化, 从而影响到第二次抽取结果发生的可能性的大小,所以想到根据第一次抽取的结果来分别计算 的概率.
记 第一次摸得白球 第一次摸得黄球 ,则 和 互不相容 ,进而用 (1.3.5) 得到
例 1.3.4 某工厂有四条生产线制造同一种产品, 已知各生产线的产量占总产量的比例分别为 和 ,并且已知各生产线的产品不合格品率分别为 0.05,0.04,0.03 和 0.02. 现从该工厂的这一产品中任取一件,试求取得的产品为不合格品的概率.
解 记 取得的产品为不合格品 . 依题意,若知道取得的产品是哪条线生产的, 则该产品为不合格品的概率是已知的, 即为 0.05,0.04,0.03 或 0.02. 于是想到用产品来自的生产线来划分抽取一件产品的结果, 记
由题设知 . 而 ,从而利用 (1.3.5) 有
将 (1.3.5) 稍作变形, 我们得到定理 1.3.3.
定理 1.3.3 (贝叶斯公式) 在定理 1.3.2 的条件下,若 ,则
证明 由条件概率的定义和全概率公式, 即得
贝叶斯公式 (1.3.6) 是由英国学者贝叶斯首先给出的, 该公式的推导虽然简单, 但其结论却不同凡响, 甚至可以说它引领了一个学派. 在引入全概率公式时, 我们曾指出导致 发生的原因可能是 等事件,且往往 发生的概率 是预先知道的,我们称为先验概率,这些概率值是不知 是否发生时的无条件概率. 如果一次随机试验的结果是 发生了,那么此时 发生的概率就与先前的先验概率有所不同. 这种情况在人们的生活中大量存在. 比如, 花 2 元钱买一张体育福利彩票, 得大奖的可能性很小, 但有人告诉你中奖了, 那么你得大奖的可能性就大大增加了.
另外,还可以利用贝叶斯公式的思想作推断和判断. 设 是导致结果 发生的原因,那么, 的发生是由原因 导致的可能性的大小就是 . 比如, 医生在给一位症状为全身乏力的患者诊治时, 经验老到的医生知道何种原因 (比如贫血, 肝炎, 高血压等等) 可能会使患者全身乏力, 还知道人群中一个人患贫血, 患肝炎, 高血压等等的比率是多少, 从而他可以通过计算一个全身乏力的患者患贫血, 患肝炎, 高血压等等的条件概率的大小, 来帮助他判断该按贫血、 肝炎, 高血压等等的哪种疾病来治疗.
例 1.3.5 (系统维护人员的配置问题) 某无线电话运营商同时担负 3 种制式的通话网络. 通过市场调查知, 无线电话使用者中用各网络电话卡的百分比分别为 和 ,且各网络出现故障的概率分别为 和 . 为最大限度地保证网络出现故障时有维护人员及时抢修, 问该如何配置维护人员的百分比.
解 记 一用户使用时网络出现故障 一用户使用第 种网络 , . 由于在同一时间只能用一张电话卡通话,所以 互不相容. 依题意,
从而, 由 (1.3.5) 有
由 (1.3.6) 有
所以三网络应依次按 32.14%,32.14% 和 35.71% 的百分比配置维护人员.
1.3.4 事件的独立性
若对事件 和 ,有 ,则表明一次试验中, 发生或不发生. 不影响 发生的可能性. 或者说, 发生或不发生,不影响 发生或不发生. 此时,由 (1.3.2) 知, ,这引出事件独立性的概念,它在概率论中十分重要.
定义 1.3.2 设 为概率空间, ,如果
则称 与 相互独立.
需要说明, 虽然我们用条件概率来直观解释独立性定义的意义, 但相互独立的定义中并不是按条件概率来定义的,尤其是不要求 .
另外,从独立性的直观解释来看,若 与 独立,则 与 与 与 也应独立.
事实上,因为 ,若 与 独立,则
即
这说明 与 独立. 请读者证明另外两对事件也独立.
定义 1.3.3 设 为概率空间, ,如果以下 个等式
…
都成立,则称 相互独立.
按定义 个事件独立,就是其中任意 个事件乘积 (交) 的概率等于各自概率的乘积,而不仅仅是 个事件乘积 (交) 的概率等于各自概率的乘积,这一点读者必须注意. 另外,读者容易验证,若 相互独立,则其中 个也相互独立. 将其中 个换成其对立事件所得的 个事件也独立.
例 1.3.6 (系统的可靠性) 电器元件构成如图 1.2 和图 1.3 的两个系统 I 和 II. 假设每个元件能够正常工作的概率 (即元件的可靠性) 为 ,各元件是否正常工作相互独立. 试比较两个系统的可靠性 (系统正常工作的概率).
图 1.2 系统 I 示意图
图 1.3 系统 II 示意图
解 系统 I 正常工作当且仅当元件 同时正常工作 (记为 ), 或 同时正常工作 (记为 ). 因各元件是否正常工作相互独立,有
从而
.
系统 II 正常工作当且仅当 和 和 和 等并联组同时正常工作. 而并联组 和 正常工作的概率为
并联组 和 正常工作 ,
所以
用数学归纳法不难证明,当 时, ,可见系统 II 比系统 I 可靠性高.
1.3.5 独立试验概型
现实中遇到的大量随机试验都是可以重复进行的, 且各次试验出现何种结果互不影响. 由这种随机现象可以建立独立随机试验模型, 在该模型中, 利用事件的独立性, 有关事件的概率容易计算.
定义 1.3.4 设有随机试验 . 如果对 的任意结果 (事件) ,都有
则称随机试验 相互独立.
例 1.3.7 若试验 是用同一种方法掷一枚硬币,观察出现正反面的情况. 试验 是同一种方法掷一颗骰子,观察出现的点数. 如果每次试验是先掷一枚硬巾后掷一颗骰子,则硬币出现正反面和骰子出现哪个点互不影响,所以 和 相互独立.
感兴趣的读者, 可以写出例 1.3.7 中随机试验的概率空间, 不妨假定硬币和骰子都是均匀的.
在独立试验概型中,最常见的是 重独立试验,即 个试验的条件相同. 可能出现的结果也相同. 最简单的 重独立试验是所谓的 重伯努利 (Bernoulli) 试验,其中每个试验都只有两个可能的结果,比如成功(A)和失败 .
例 1.3.8 某批产品的不合格品率为 . 现从该批产品中有放回地任意抽取 5 次, 每次取 1 件. 试求以下事件的概率.
(1) 前两次抽得合格品后三次抽得不合格品 .
(2) 抽得产品中恰有两件不合格品 .
(3) 抽得产品中至少有 1 件不合格品 .
解 由于试验是有放回抽取, 所以前面抽取的结果不影响后面的抽取. 所以 5 次抽取相互独立,5 次抽取可以认为是 5 次独立的伯努利试验. 记 第 次抽取得不合格品 }, 则
(1)由试验的独立性有
(2)由于两只不合格品出现在 5 次抽取中的哪两次,共有 种情况,每种情况出现的概率相同, 所以
(3) 由于 {抽得产品中至少有 1 不合格品球}的对立事件是 {5 次都取得合格
品}, 所以
由例 1.3.8 的解题思路, 容易证得下面的定理 1.3.4.
定理 1.3.4 设伯努利试验中 ,则 重独立伯努利试验中恰好成
功 次的概率为
例 1.3.9 设某种药物对某种疾病的治愈率为 0.8. 现有 10 名患这种疾病的病人都用此药, 求其中至少有 6 人治愈的概率.
解 将每名患者用药并观察是否治愈作为一次试验, 那么 10 名患者用药就是 10 次独立伯努利试验, 所以由定理 1.3.4 有
第一章小结与注记
(1)本章明确了概率论与数理统计学科的研究对象是随机现象的统计规律, 该学科被广泛应用于分析和解决各种实际问题和自然科学问题. 它与其他数学分支最大的区别是用确定性的数学研究非确定性的现象, 因而有其特殊的思维方式. 概率论与数理统计将随机现象的观测和结果归结为随机试验和随机事件, 而把结果发生的不确定性用概率来刻画, 这就是本学科研究随机现象的基本模型.
(2)本章中引入的事件的运算及运算法则,就如同实数的运算及运算法则,极限的运算及运算法则等等, 对于计算概率和分析推理是至关重要的. 尤其是将一个较为复杂的事件表示为若干个互不相容事件的和, 是经常需要的或迫不得已的, 因为概率测度只有一个可用的性质: 可列可加性.
(3) 概率的公理化定义是概率论学科发展的重要的里程碑, 它为我们分析研究随机现象提供了基本框架, 它将随机试验、随机事件和概率等三个直观概念抽象为基本事件空间 (或称样本空间),事件域 (或称事件 代数) 和概率测度 ,从而把概率论建立在严密的测度论基础之上.
(4)可以说, 概率论与测度论的分水岭是概率论中引入了条件概率与独立性的概念. 特别是独立性 (事件的独立性和后文介绍的随机变量的独立性). 它是初等概率论与数理统计讨论中最核心的条件, 也就说, 其中绝大部分讨论都在此条件下进行的.
(4.1) 利用条件概率, 我们得到两个求概率的重要公式 ——全概率公式和 ♫ 叶斯公式. 对于这两个公式, 我们宁愿希望读者将其理解为两种概率思相 而不是简单的计算公式.
(4.2) 独立试验模型中我们学到了一种计算概率的方法. 但这里只是一种理想化模型或假定, 因为现实中随机现象的大部分都不是独立试验. 研究非独立试验模型需要更高深的数学知识和工具.
第一章习题
1.1. 试对下列随机试验写出相应的基本事件空间.
(1) 将一颗骰子掷两次, 分别观测朝上一面出现的点数.
(2)观察某商店一天中到达的顾客数.
(3) 在一批灯管中任意抽取一只, 测试它的寿命.
(4) 在区间 中随机地取两个数字.
1.2.一个袋中装有 12 个球, 分别标有号码 1 至 12, 现从中任取一球. 试写出基本事件空间,并用基本事件空间 的子集表示如下事件.
所取出球的号码为奇数 .
所取出球的号码不大于 8
所取出球的号码为 3 的倍数 .
1.3. 设 为三个事件,用 的运算表示下列各事件.
(1) 仅 发生.
(2)至少有一个事件发生.
(3) 恰有两个事件发生.
1.4. 记 “第 次击中目标”, ,记 “ 5 次射击中恰有 次击中目怀”, . 试给出下列各对事件的关系.
(1) 与 . (2) 与 . (3) 与 . (4) 与 .
1.5. 设基本事件空间 ,求
(1) . (2) .
1.6. 化简事件: (1) . (2) (2) .
1.7. 设盒中有 6 个白球, 4 个红球, 现从盒中任取 4 个球, 求取到两个红球两个白球的
概率. 1.8. 设盒中有 6 个白球, 4 个红球, 5 个黑球, 现从盒中任取 4 个球, 求取到两个红球两
个白球的概率. 1.9. 同时抛掷两颗均匀骰子,求事件 两颗骰子出现的点数之和为 6 的概率.
1.10. 设盒中有 6 个白球, 4 个红球, 10 个黑球, 现不放回地从袋中把球一个一个地摸出来,求第 次摸到红球的概率.
1.11. 从 5 双不同尺码的鞋子中任取 4 只, 4 只鞋子中至少有两只配成一双的概率是多
少? 1.12. 已知 10 个电子管中有 7 个正品和 3 个次品, 每次任意抽取 1 个来测试, 测后不放回, 直至把 3 个次品都测到为止, 求需要测 7 次的概率.
1.13. 任意地取两个不大于 1 的正数,试求其乘积小于 的概率.
1.14. 一个质地均匀的陀螺, 在其圆周的半圈上均匀地标明刻度 1, 另外半圈上均匀地刻上区间 上的诸数,在桌面上旋转它,求当它停下来时,圆周与桌面接触处的刻度位于区间 内的概率.
1.15. 随机地向半圆 ( 为正常数) 内掷一点,点落在半圆内任何区或的概率与区域的面积成正比,则原点和该点的连线与 轴的夹角小于 的概率是多少?
1.16. 设 为任意三个事件,试证明:
1.17. 假设三个人的准考证混放在一起,现在将其随意地发给三个人. 试求事件 没有一个人领到自己准考证}的概率.
1.18. 现从袋中抽取 5 个球,记 为事件 “抽取的 5 个球中有 个不是红球”,已知 . 求下列各事件的概率:
(1) 抽取的 5 个球均为红球.
(2)抽取的 5 个球至少有两个红球.
1.19. 已知 ,求 之值.
1.20. 已知 0. 求事件 “ 全不发生” 的概率.
1.21. 设事件 与 互不相容,且 ,求下列事件的概率: ,
1.22. 设事件 两两独立, ,且 ,证明: (1) . (2) .
1.23. 已知 ,求 .
1.24. 已知 ,试求 之值.
1.25. 设 为两随机事件,已知 ,试求 之值.
1.26. 掷两颗骰子, 在已知两颗骰子出现的点数之和为 7 的条件下, 求其中一颗出现点数
1.27. 假设箱中原来只有一个球, 此球是黑球还是白球的概率均为 0.5. 现在首先将一个白球放入箱中, 然后从箱中随意取出一个球, 在取出的球是白球条件下, 试求箱中原来的球为
1.28. 袋中有一个红球和一个白球, 从袋中随机摸出一球, 如果取出的球是红球, 则把此气球放回装中开且再加进一个红球, 然后从袋中再摸一个球, 如果还是红球, 则仍把此红球放回转中开且再加进一个红球, 如此继续进行, 直到摸出白球为止, 求第 9 次取出白球的概率
1.29. 袋中有 3 只白球和 4 只红球, 现从中随机地取两只球, 在采用不放回地摸球方式下, 求下列各事件的概率:
(1)两只球均为白球.
(2)第 1 只球为红球而第 2 只为白球.
(3) 红、白球各 1 只.
取 1 个, 求 1.30. 盒中装有 5 个产品, 其中 3 个一等品, 2 个二等品, 从中不放回地抽取产品, 每次
(1)取两次, 两次都取得一等品的概率.
(2)取两次, 第二次取得一等品的概率.
(3) 取两次, 已知第二次取得一等品, 求第一次取得的是二等品的概率
1.31. 某射击队共有 20 名射手, 其中一级射手 4 人, 二级射手 8 人, 三级射手 7 人 四级射手 1 人,一、三、四级射手能通过预选赛进入正式比赛的概率分别为 0.9.0.7.0.5 0.2, 求任选一名射手能进入正式比赛的概率.
1.32. 有 三个盒子, 盒中有 4 个白球和 2 个黑球, 盒中有 2 个白球和 1 个黑球, 盒中有 3 个白球和 3 个黑球. 今掷一颗骰子来选定盒子,若出现 1,2,3 点则洗 盒右出现 4 点则选 盒,若出现 5,6 点则选 盒. 在选出的盒中任取一球.
( 1 )求取出白球的概率.
(2)若取出的是白球,求此球来自 盒的条件概率.
1.33. 一袋中有 5 个红球, 5 个白球, 从袋中任意取出 1 个球, 然后放进 1 个另一颜色的球 (例如取出 1 个白球就放进 1 个红球). 如此取球, 已知第一次、第二次取出的两个球具有相同的颜色, 求它们都是白球的概率.
1.34. 某超市销售某种电子灭蚊器共 10 个, 其中有 3 个次品, 7 个合格品。某顾客选购时已售出 2 个, 该顾客从剩余 8 个中任选一台, 已知该顾客购到的是合格品. 求已出售的质个中一个为次品一个为合格品的概率.
1.35. 一袋中装有 只红球, 只白球,每次从袋中任取一球,记下该球颜色后将其放回袋中,同时再放进 只与该球同色的球,如此进行下去,记 ,试证明.
1.36. 一袋中装有 只红球, 只白球, 个黑球,每次从袋中任取一球. 记下该球颜色后将其放回袋中,同时再放进 只与该球同色的球,如此进行下去,记 第 次取到红球}. 试求 之值.
1.37. 某实验室在器皿中繁殖成 个细菌的概率为 并设所繁殖的每个细菌为甲类菌的概率为 0.4, 为乙类菌的概率为 0.6, 求下列事件的概率: (1) 器皿中所繁殖的全部是乙类菌的概率. (2) 已知所繁殖的全部是乙类菌, 求细菌个数为 3 的概率. 1.38. 设事件 相互独立,试证明: (1) 事件 相互独立. (2)事件 与 相互独立. 1.39 盒子中有 10 个球, 其中 4 个白球, 4 个黑球, 2 个红球. 现从盒中有放回地摸取 3 次, 每次只取一个球, 求
(1) 取到的 3 个球中恰好有两个白球的概率.
(2)取到的 3 个球中至少有一个白球的概率.
1.40. 做 10 次独立重复试验,每次试验中成功的概率为 ,试求下列事件的概率:
(1)10 次试验中恰有 3 次成功.
(2)获得第 3 次成功恰好出现在第 10 次试验.
1.41. 甲、乙、丙三个射手,他们每次击中目标的概率分别为0.4,0.5,0.7. 现三人同时独立向目标射击一次, 试求至少有一人命中目标的概率.
1.42. 假定具有症状 的疾病有 三种. 现从 20000 份患有疾病 的病史中, 统计得到下列数据:
疾病 | 人数出现症状 $S$ 的人数 |
${d}_{1}$ | 7500 8000 |
${d}_{2}$ | 4000 5000 |
${d}_{3}$ | 3500 7000 |
试求当一个具有症状 的病人前来就诊时,它患有疾病 的可能性各有多大? 若没有其他可依据的诊断手段的情况下, 诊断该病人患有这三种病中的哪一种较为合适?