条件概率
在第3节中,我们关注的是以下类型的问题。假设有一个装有100个灯泡的盒子,其中5个是次品。从盒子中选出一个灯泡是次品的概率是多少?这个问题的一个自然延伸如下。假设发现一个灯泡(从一个装有100个灯泡、其中5个是次品的盒子中选出)是次品;那么从盒子中(现在装有99个灯泡,其中4个是次品)抽出的第二个灯泡是次品的概率是多少?条件概率的概念为这个问题的陈述和求解提供了一个数学模型。
给定两个事件 和 ,事件 在给定事件 发生下的条件概率,记作 ,直观上是指,在假设 已经发生的前提下, 会发生的概率。换句话说, 代表了我们在得知 已经发生这一信息后,对 概率的重新评估。
为了引出我们将要给出的 的正式定义,让我们从概率的频率解释的角度来考虑 的含义(因为我们希望赋予 一个与其作为相对频率的含义相对应的数学意义)。假设我们观察一个随机现象的大量 次发生,其中定义了事件 和 。令 表示在这 次随机现象发生中事件 发生的次数。类似地,令 表示 发生的次数。接下来,令 表示随机现象发生中事件 和 同时发生的次数。
例4A 。30个容量为2的观测样本 。考虑以下从一个装有6个球(编号为1到6)的瓮中不放回地抽取容量为2的样本这一实验重复三十次的结果:
| , | , | , | , | , | |
| , | , | , | , | , | |
| , | , | , | , | , | |
| , | , | , | , | , | |
| , | , | , | , | , |
如果编号为1到4的球是白色的,编号为5和6的球是红色的,那么这三十次试验的结果可以记录如下:
| , | , | , | , | , | |
| , | , | , | , | , | |
| , | , | , | , | , | |
| , | , | , | , | , | |
| , | , | , | , | , |
令 表示第一次试验中出现白球的实验次数。令 表示第二次试验中出现白球的实验次数,并令 表示两次试验中都出现白球的实验次数。通过直接计数,可得 ,以及 。
根据频率定义,事件 和 的无条件概率由下式给出
另一方面,事件 在给定事件 发生下的条件概率 ,表示在 发生的那些实验中, 也发生的比例;用符号表示,
方程(4.2) 从频率的角度表示了条件概率概念的含义。现在,(4.2) 可以以一种方式来书写,这种方式将指示 的一个正式定义,该定义将体现条件概率在直观构想中的性质。我们重写(4.2) (在 不为零的情况下):
类比(4.3) ,我们现在给出 的如下正式定义:
条件概率的正式定义 。设 和 是样本描述空间 上的两个事件,在其子集上定义了一个概率函数 。事件 在给定事件 发生下的条件概率,记作 ,定义为
例4B 。计算一个条件概率 。考虑从一个装有四个白球和两个红球的瓮中不放回地抽取容量为2的样本的问题。令 表示第一个抽出的球是白球的事件, 表示第二个抽出的球是白球的事件。我们来计算 。根据(2.6) ,可得 ,而 。因此, 0.6,这与我们的直观想法一致,因为第二个球是从一个装有五个球(其中三个是白球)的瓮中抽出的。将这些理论计算的概率与例4A中观察到的相对频率进行比较。我们有 。
接下来我们给出一个公式,它可能有助于阐明一个事件 的无条件概率与条件概率之间的区别。对于任何满足 的事件 和 ,我们有
方程(4.5) 证明如下。根据(4.4) 给出的条件概率定义,我们有基本公式(4.6)
类似地,我们有 。现在,事件 和 是互斥的,且它们的并集是 。因此, 。由此可推出所需结论。
例4C 。对(4.5) 的数值验证 。再次考虑例4B中的问题。我们有 。因此, 。接下来,我们有 。然而,由此并不能得出 。相反,通过使用定义(4.4) , ;我们也可以通过直观推理得到这个结果(该推理在第3章第4节中被严格化),因为如果第一次没有抽到白球,那么瓮中剩下的五个球中将有四个白球,第二次抽取将从中进行。然后,根据(4.5) , 。
例4D得出的结论,学生们初次接触时,常常会感到惊讶并认为有悖直觉。
例4D 。考虑一个有两个孩子的家庭。假设每个孩子是男孩和是女孩的可能性相同。给定以下条件,求两个孩子都是男孩的条件概率:(i) 较大的孩子是男孩,(ii) 至少有一个孩子是男孩?
解
令 为较大的孩子是男孩的事件,令 为较小的孩子是男孩的事件。那么 是至少有一个孩子是男孩的事件,而 是两个孩子都是男孩的事件。给定较大的孩子是男孩,两个孩子都是男孩的概率等于
给定至少有一个孩子是男孩,两个孩子都是男孩的概率等于,由于
例4E 。给定样本结果,求某次抽取的结果 。从一个装有十二个球(其中八个是白球)的瓮中,有放回地(或无放回地)抽取一个容量为4的样本。求在给定样本包含三个白球的条件下,第三次抽取的球是白球的条件概率。
解
令 为样本恰好包含三个白球的事件,令 为第三次抽取的球是白球的事件。当前的问题是求 。在有放回抽样的情况下
在不放回抽样的情况下