条件概率

在第3节中,我们关注的是以下类型的问题。假设有一个装有100个灯泡的盒子,其中5个是次品。从盒子中选出一个灯泡是次品的概率是多少?这个问题的一个自然延伸如下。假设发现一个灯泡(从一个装有100个灯泡、其中5个是次品的盒子中选出)是次品;那么从盒子中(现在装有99个灯泡,其中4个是次品)抽出的第二个灯泡是次品的概率是多少?条件概率的概念为这个问题的陈述和求解提供了一个数学模型。

给定两个事件 A B ,事件 B 在给定事件 A 发生下的条件概率,记作 P [ B A ] ,直观上是指,在假设 A 已经发生的前提下, B 会发生的概率。换句话说, P [ B A ] 代表了我们在得知 A 已经发生这一信息后,对 B 概率的重新评估

为了引出我们将要给出的 P [ B A ] 的正式定义,让我们从概率的频率解释的角度来考虑 P [ B A ] 的含义(因为我们希望赋予 P [ B A ] 一个与其作为相对频率的含义相对应的数学意义)。假设我们观察一个随机现象的大量 N 次发生,其中定义了事件 A B 。令 N A 表示在这 N 次随机现象发生中事件 A 发生的次数。类似地,令 N B 表示 B 发生的次数。接下来,令 N A B 表示随机现象发生中事件 A B 同时发生的次数。

例4A 30个容量为2的观测样本 。考虑以下从一个装有6个球(编号为1到6)的瓮中不放回地抽取容量为2的样本这一实验重复三十次的结果:

( 1 , 6 ) ( 4 , 5 ) ( 1 , 4 ) ( 5 , 3 ) ( 3 , 2 ) ( 4 , 3 )  
( 3 , 1 ) ( 5 , 1 ) ( 2 , 1 ) ( 2 , 3 ) ( 4 , 5 ) ( 5 , 6 )  
( 5 , 4 ) ( 3 , 1 ) ( 6 , 3 ) ( 5 , 6 ) ( 2 , 5 ) ( 6 , 4 )  
( 1 , 3 ) ( 6 , 2 ) ( 4 , 1 ) ( 1 , 5 ) ( 4 , 6 ) ( 6 , 3 )  
( 2 , 3 ) ( 5 , 2 ) ( 3 , 6 ) ( 6 , 4 ) ( 6 , 4 ) ( 1 , 2 )  

如果编号为1到4的球是白色的,编号为5和6的球是红色的,那么这三十次试验的结果可以记录如下:

( W , R ) ( W , R ) ( W , W ) ( R , W ) ( W , W ) ( W , W )  
( W , W ) ( R , W ) ( W , W ) ( W , W ) ( W , R ) ( R , R )  
( R , W ) ( W , W ) ( R , W ) ( R , R ) ( W , R ) ( R , W )  
( W , W ) ( R , W ) ( W , W ) ( W , R ) ( W , R ) ( R , W )  
( W , W ) ( R , W ) ( W , R ) ( R , W ) ( R , W ) ( W , W )  

N A 表示第一次试验中出现白球的实验次数。令 N B 表示第二次试验中出现白球的实验次数,并令 N A B 表示两次试验中都出现白球的实验次数。通过直接计数,可得 N A = 18 , N B = 21 ,以及 N A B = 11

根据频率定义,事件 A , B A B 的无条件概率由下式给出 

另一方面,事件 B 在给定事件 A 发生下的条件概率 P [ B A ] ,表示在 A 发生的那些实验中, B 也发生的比例;用符号表示, 应当注意,(4.2) 仅在 N A 不为零时才有意义。如果 N A 为零,我们必须认为 P [ B A ] 是未定义的。

方程(4.2) 从频率的角度表示了条件概率概念的含义。现在,(4.2) 可以以一种方式来书写,这种方式将指示 P [ B A ] 的一个正式定义,该定义将体现条件概率在直观构想中的性质。我们重写(4.2) (在 N A 不为零的情况下): 

类比(4.3) ,我们现在给出 P [ B A ] 的如下正式定义:

条件概率的正式定义 。设 A B 是样本描述空间 S 上的两个事件,在其子集上定义了一个概率函数 P [ ] 。事件 B 在给定事件 A 发生下的条件概率,记作 P [ B A ] ,定义为如果 并且如果 P [ A ] = 0 ,则 P [ B A ] 是未定义的。 

例4B 计算一个条件概率 。考虑从一个装有四个白球和两个红球的瓮中不放回地抽取容量为2的样本的问题。令 A 表示第一个抽出的球是白球的事件, B 表示第二个抽出的球是白球的事件。我们来计算 P [ B A ] 。根据(2.6) ,可得 P [ A B ] = ( 4 3 ) / ( 6 5 ) = 12 30 ,而 P [ A ] = 4 6 = 20 30 。因此, P [ B A ] = 12 2 2 0 = 0.6,这与我们的直观想法一致,因为第二个球是从一个装有五个球(其中三个是白球)的瓮中抽出的。将这些理论计算的概率与例4A中观察到的相对频率进行比较。我们有 N A B / N = 11 30 , N A / N = 18 30 , N A B / N A = 11 18 = 0.611

接下来我们给出一个公式,它可能有助于阐明一个事件 B 的无条件概率与条件概率之间的区别。对于任何满足 0 < P [ A ] < 1 的事件 B A ,我们有 

方程(4.5) 证明如下。根据(4.4) 给出的条件概率定义,我们有基本公式(4.6)  

类似地,我们有 P [ A c B ] = P [ A c ] P [ B A c ] 。现在,事件 A B A c B 是互斥的,且它们的并集是 B 。因此, P [ B ] = P [ A B ] + P [ A c B ] 。由此可推出所需结论。

例4C (4.5) 的数值验证 。再次考虑例4B中的问题。我们有 P [ A ] = 2 3 。因此, P [ A c ] = 1 3 。接下来,我们有 P [ B A ] = 3 5 。然而,由此并不能得出 P [ B A c ] = 2 5 。相反,通过使用定义(4.4) P [ B A c ] = 4 5 ;我们也可以通过直观推理得到这个结果(该推理在第3章第4节中被严格化),因为如果第一次没有抽到白球,那么瓮中剩下的五个球中将有四个白球,第二次抽取将从中进行。然后,根据(4.5) P [ B ] = ( 3 5 ) ( 2 3 ) + ( 4 5 ) ( 1 3 ) = 10 15 = 2 3

例4D得出的结论,学生们初次接触时,常常会感到惊讶并认为有悖直觉。

例4D 。考虑一个有两个孩子的家庭。假设每个孩子是男孩和是女孩的可能性相同。给定以下条件,求两个孩子都是男孩的条件概率:(i) 较大的孩子是男孩,(ii) 至少有一个孩子是男孩?

 

A 为较大的孩子是男孩的事件,令 B 为较小的孩子是男孩的事件。那么 A B 是至少有一个孩子是男孩的事件,而 A B 是两个孩子都是男孩的事件。给定较大的孩子是男孩,两个孩子都是男孩的概率等于 

 

给定至少有一个孩子是男孩,两个孩子都是男孩的概率等于,由于 ( A B ) ( A B ) = A B  

例4E 给定样本结果,求某次抽取的结果 。从一个装有十二个球(其中八个是白球)的瓮中,有放回地(或无放回地)抽取一个容量为4的样本。求在给定样本包含三个白球的条件下,第三次抽取的球是白球的条件概率。

 

A 为样本恰好包含三个白球的事件,令 B 为第三次抽取的球是白球的事件。当前的问题是求 P [ B A ] 。在有放回抽样的情况下 

 

在不放回抽样的情况下 更一般地,可以证明(见理论练习4.4)如果一个容量为 n 的样本包含 k 个白球,那么在任意指定的一次抽取中抽到白球的概率是 k / n 。注意,无论瓮中球的组成如何,也无论样本是放回还是不放回抽取的,这个结果都是相同的。从某种意义上说,刚才陈述的结果可以表述为:在任何一次给定的抽取中,样本中的所有球出现的可能性是相等的。许多学生试图通过以下推理来解决这里给出的问题:在第三次抽取时,样本中四个球中的任何一个都可能出现,而其中三个是白球,因此第三次抽取时抽到白球的(条件)概率是 3 4 ,这与前述方程一致。然而,这种推理思路是在我们推导这些方程时所做的假设之外,又添加了额外的假设。我们期望证明这些新假设是推导 (4.9) (4.10) 时所假设的模型的一个推论

 

理论练习

4.1 。证明以下陈述,对于任意事件 A , B C ,满足 P [ C ] > 0 。这些关系说明了这样一个事实:所有关于概率的一般定理对于关于任意特定事件 C 的条件概率也同样有效。 其中是必然事件。如果的子事件。如果

4.2 。设 B 是一个具有正概率的事件。证明对于任意事件 A

意味着意味着

4.3 。设 A B 是两个事件,每个都具有正概率。证明陈述 (i) 为真,而陈述 (ii) 和 (iii) 通常为假:

4.4 。一个瓮中有 M 个球,其中 M W 个是白球(其中 M W M )。从瓮中抽取一个容量为 n 的样本,可以是放回或不放回抽取。对于 j = 1 , 2 , , n ,设 B j 是第 j 次抽取的球是白球的事件。对于 k = 1 , 2 , , n ,设 A k 是样本(容量为 n )恰好包含 k 个白球的事件。证明 P [ B j A k ] = k / n 。用文字表述这一事实。

4.5 。一个瓮中有 M 个球,其中 M W 个是白球。抽取 n 个球并放在一边(不放回瓮中),未记录其颜色。再抽取另一个球(假设 n 小于 M )。它是白球的概率是多少?提示:比较例子 2B

练习

4.1 。一个人抛掷2枚公平硬币。已知他至少抛出了1个正面,求他抛出了2个正面的条件概率是多少?

 

答案

1 3

 

4.2 。一个瓮中有12个球,其中4个是白球。抽取五个球并放在一边(不放回瓮中),未记录其颜色。

(i) 再抽取另一个球。它是白球的概率是多少?

(ii) 抽取一个容量为2的样本。它恰好包含一个白球的概率是多少?

(iii) 已知它至少包含1个白球,求它恰好包含2个白球的条件概率是多少?

4.3 。在一个自助市场的牛奶区有150夸脱牛奶,其中100夸脱是新鲜的,50夸脱是放了一天的。

(i) 如果选取2夸脱,两者都是新鲜的概率是多少?

(ii) 假设在从该区域移走50夸脱后选取这2夸脱。两者都是新鲜的概率是多少?

(iii) 已知至少1夸脱是新鲜的,求两者都是新鲜的条件概率是多少?

 

答案

(i), (ii) 66 149 ; (iii) 99 149  

 

4.4 。某大学的学生群体由 60 % 的男生和 40 % 的女生组成。学生吸烟的比例为:男生中 40 % ,女生中 60 % 。求一个吸烟的学生是男生的概率是多少?是女生的概率是多少?

4.5 。考虑两个事件 A B ,满足 P [ A ] = 1 4 , P [ B A ] = 1 2 , P [ A B ] = 1 4 。对于以下4个陈述,判断其真假:(i) 事件 A B 互斥,(ii) A B 的子事件,(iii) P [ A c B c ] = 3 4 ;(iv) P [ A B ] + P [ A B c ] = 1

 

答案

(i) 假,因为 P [ A B ] = 1 8 ;(ii) 假;(iii) 真;(iv) 假。

 

4.6 。考虑一个装有12个球的瓮,其中8个是白球。抽取一个容量为4的样本,采用放回(不放回)方式。已知样本恰好包含 (i) 2个白球,(ii) 3个白球,求第一个抽出的球是白球的条件概率是多少?

4.7 。考虑一个装有6个球的瓮,其中4个是白球。抽取一个容量为3的样本,采用放回(不放回)方式。设 A 表示样本恰好包含2个白球的事件,设 B 表示第三次抽取的球是白球的事件。通过数值验证在这种情况下 (4.5) 成立。

4.8 。考虑一个装有12个球的瓮,其中8个是白球。抽取一个容量为4的样本,采用放回(不放回)方式。已知样本恰好包含三个白球,求第二个和第三个抽出的球是白球的条件概率是多少?

4.9 。考虑3个瓮;瓮I装有2个白球和4个红球,瓮II装有8个白球和4个红球,瓮III装有1个白球和3个红球。从每个瓮中各选一个球。已知抽取的样本恰好包含2个白球,求从瓮II中选出的球是白球的概率是多少?

 

答案

10 11

 

4.10 。考虑一个瓮,按照以下方案放入4个球。抛掷一枚公平硬币;如果硬币正面朝上,则向瓮中放入一个白球,如果硬币反面朝上,则向瓮中放入一个红球。

(i) 瓮中恰好有3个白球的概率是多少?

(ii) 已知放入瓮中的第一个球是白球,求瓮中恰好有3个白球的概率是多少?

4.11 。一个人抛掷2个公平骰子。求两个骰子点数之和为7的(条件)概率,已知 (i) 和为奇数,(ii) 和大于6,(iii) 第一个骰子的结果是奇数,(iv) 第二个骰子的结果是偶数, ( v ) 至少一个骰子的结果是奇数,(vi) 两个骰子结果相同,(vii) 两个骰子结果不同,(viii) 两个骰子点数之和为13?

 

答案

(i) 1 3 ;(ii) 2 7 ;(iii), (iv) 1 8 ;(v) 2 9 ;(vi) 0;(vii) 1 5 ;(viii) 未定义。

 

4.12 。一个人从一副桥牌中的4张A和4张K共8张牌中,逐张抽取一个3张牌的样本(不放回)。已知样本包含 (i) 黑桃A,(ii) 至少一张A,求样本至少包含2张A的(条件)概率是多少?解释为什么 (i) 和 (ii) 的答案不一定相等。

4.13 。考虑4张卡片,每张卡片上都标有面1和面2。在卡片1上,面1和面2都是红色。在卡片2上,面1和面2都是黑色。在卡片3上,面1是红色,面2是黑色。在卡片4上,面1是黑色,面2是红色。随机选择一张卡片。如果所选卡片的一面是红色,求另一面是黑色的(条件)概率是多少?如果检查所选卡片的第1面并发现是红色,求第2面是黑色的(条件)概率是多少?提示:比较例子 4D

 

答案

2 3 , 1 2

 

4.14 。一个骰子被做了手脚,使得出现某个点数的概率与该点数成正比(例如,出现4点的概率是出现2点概率的两倍)。

(i) 已知出现奇数点,求掷出5点的概率是多少。

(ii) 已知出现小于5的点数,求掷出偶数点的概率是多少。