等可能描述的有限样本描述空间

在许多涉及有限样本描述空间的概率情境中,可以假设所有描述都是等可能的;也就是说, S 中的所有描述具有相等的发生概率。更精确地说,我们定义样本描述空间 S = { D 1 , D 2 , , D N } 具有等可能描述,如果 S 上的所有单成员事件具有相等的概率,那么 

 

应该清楚,每个单成员事件 { D i } 的概率为 ( 1 / N ) ,因为有 N 个这样的事件,每个事件具有相等的概率,并且它们的概率之和必须等于1,即必然事件的概率。

在具有等可能描述的样本描述空间上定义的事件的概率计算,可以简化为事件大小的计算。根据(6.1) E 的概率等于 ( 1 / N ) 乘以 E 中描述的数量。换句话说, E 的概率等于 E 的大小与 S 的大小之比。如果对于一个有限大小的集合 E ,我们用 N [ E ] 表示 E 的大小( E 中成员的数量),那么上述结论可以总结为一个基本公式:

当样本描述空间 S 有限且所有描述等可能时,计算事件概率的公式:对于 S 上的任何事件 E 的大小的大小 

这个公式可以用文字表述。如果一个事件被定义为一个有限样本描述空间的子集,且该空间中的所有描述都是等可能的,那么该事件的概率就是属于它的描述数量与总描述数量之比。这一陈述可以被视为经典的“等可能性”概率定义的精确表述,该定义由拉普拉斯于1812年首次明确提出。

拉普拉斯随机事件概率的“等可能性”定义。随机事件的概率是有利于它的情况数与所有可能情况数之比,当没有任何因素使我们相信其中一种情况应该比其他情况更可能发生时。这使得它们对我们而言是等可能的。

鉴于(7.2),我们可以看到,采用第5节中给出的概率的公理化定义,并不因此拒绝拉普拉斯的概率定义。相反,拉普拉斯定义是公理化定义的一个特例,对应于样本描述空间有限且样本描述空间上的概率分布是均匀分布的情况。这是说所有描述都是等可能的另一种方式。

我们现在可以为一个从装有六个球(编号为1到6,其中1到4号球为白色,其余两个球为非白色)的瓮中抽取一个球的实验,陈述一个数学模型。对于该实验的样本描述空间 S ,我们取 S = { 1 , 2 , 3 , 4 , 5 , 6 } 。抽出的球是白色的事件 A ,则作为 S 的一个子集给出,即 A = { 1 , 2 , 3 , 4 } 。为了计算 A 的概率,我们必须在 S 上采用一个概率函数 P [ ] 。如果我们假设 S 中的描述是等可能的,那么 P [ ] 由(7.2)确定,且 P [ A ] = 2 3 。另一方面,我们可以指定一个不同的概率函数 P [ ] ,在 S 的单成员事件上指定:

P [ { 1 } ] = P [ { 2 } ] = P [ { 3 } ] = P [ { 4 } ] = 1 8 , P [ { 5 } ] = P [ { 6 } ] = 1 4 .  

然后函数 P [ ] (6.1) 确定,且 P [ A ] = 1 2

因此,我们为从瓮中抽取一个球的实验陈述了两个不同的数学模型。只有实际实验的结果才能决定这两个模型中哪一个更符合现实。然而,随着我们在本书中研究各种模型的性质,理论依据将会出现,以支持某些类型的模型优于其他模型。

例7A 。求随机选择的一个月的第13天是星期五的概率。

 

观察随机选择的一个月的第13天是星期几的实验,其样本描述空间显然是 S = {星期日, 星期一, 星期二, 星期三, 星期四, 星期五, 星期六 } 。我们正在求 P [ { 星期五 } ] 。如果我们假设描述是等可能的,那么 P [ { 星期五 } ] = 1 7 。然而,面对以下替代数学模型,人们会相信这个结论吗?为了在 S 上定义一个概率函数,请注意我们的日历有一个400年的周期,因为每四年是一个闰年,除了像1700、1800和1900这样的年份,这些年份是一个新世纪的开始(或一个旧世纪的结束),但不是400的倍数。在400年中有97个闰年,恰好有20,871周。对于1600年到2000年之间的4800个日期(每个日期都是某个月的第13天),可以确定它落在星期几。对于一周中的任何给定的一天 x ,我们定义 P [ { x } ] x 在作为某个月第13天而产生的4800个星期几的列表中出现的相对频率。通过直接但繁琐的枚举可以证明[见《美国数学月刊》,第40卷(1933年),第607页]:

 

x  星期日星期一星期二星期三星期四星期五星期六
P [ { x } ]   687 4800   685 4800   685 4800   687 4800   684 4800   688 4800   684 4800  

请注意,(7.3)给出的概率模型得出的结论是,一个月的第13天是星期五的可能性比一周中的任何其他日子都大!

例7B 。考虑一个州(例如伊利诺伊州),其中汽车的牌照按顺序编号,从1开始。假设该州注册了3,000,000辆汽车,随机选择的一辆汽车的牌照上第一个数字是数字1的概率是多少?

 

作为汽车牌照上的第一个数字,人们可以观察到集合 { 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 } 中的任何整数。因此,人们可能会倾向于采用这个集合作为样本描述空间。如果假设这个空间中的所有样本描述都是等可能的,那么人们会得出这样的结论:从伊利诺伊州注册的汽车中随机选择的一辆汽车,其牌照上第一个数字是数字 1 的概率是 1 9 。然而,面对以下替代模型,人们会相信这个结论吗?作为观察牌照上数字的结果,人们可以观察到集合 S 中的任何数字,该集合由从1到 3 , 000 , 000 的所有整数组成。观察到牌照第一个数字是1的事件 A 由表7A中列举的整数组成。集合 A 的大小为 N [ A ] = 1 , 111 , 111 。如果采用集合 S 作为样本描述空间,并假设 S 中的所有描述都是等可能的,那么

 

P [ A ] = N [ A ] N [ S ] = 1 , 111 , 111 3 , 000 , 000 = 0.37037 .  

以下区间内的所有牌照第一个数字为 1  此区间内的整数个数
11
10 19  10
100 199  100
1000 1999  1000
10 , 000 19 , 999  10,000
100 , 000 199 , 999  100,000
1 , 000 , 000 1 , 999 , 999   1 , 000 , 000  
表7A 。第一个数字为 1  的牌照

 

练习

7.1 。假设一个骰子(面标记为 1 到6)被加载,使得对于 k = 1 , , 6 ,掷骰子时标记为 k 的面朝上的概率与 k 成正比。求掷骰子结果为偶数的事件概率。

 

答案

12 / 21

 

7.2. 一个月的第13天是(i) 星期五或星期六,(ii) 星期六、星期日或星期一,的概率是多少?

7.3 。从整数1到100中以每个数字等可能被选中的方式选择一个数字。选中的数字是(i) 7的倍数,(ii) 14的倍数,的概率是多少?

 

答案

(i) 0.14, (ii) 0.07。

 

7.4 。考虑一个州,其中汽车的牌照按顺序编号,从1开始。假设该州注册的汽车数量等于(i) 999,999, (ii) 1 , 000 , 000 , (iii) 1 , 500 , 000 , (iv) 2 , 000 , 000 , (v) 6 , 000 , 000 ,随机选择的一辆汽车的牌照上第一个数字是数字1的概率是多少?

7.5 。从一个装有3个红球、4个白球和5个蓝球的瓮中抽出一个球,它是白球的概率是多少?仔细陈述你所做的任何假设。

 

答案

1 3

 

7.6 一个研究问题。使用与推导(7.3)中表格相同的假设,求圣诞节(12月25日)是星期一的概率。实际上,证明圣诞节落在给定星期几的概率由下表提供:

x  星期日星期一星期二星期三星期四星期五星期六
P [ { x } ]   58 400   56 400   58 400   57 400   57 400   58 400   56 400