泊松概率定律

近年来,随着越来越多适用泊松概率定律的随机现象被研究,泊松概率定律变得日益重要。在物理学中,真空管灯丝或光敏物质在光照下随机发射电子,以及放射性原子核的自发衰变,都会导致服从泊松概率定律的现象。该定律在运筹学和管理科学领域也频繁出现,因为无论是百货商店的收银员或售货员、工厂的库存管理员、机场跑道、港口货物装卸设施、机修车间的维修工、电话交换局的中继线所面临的服务需求,还是提供服务的速率,往往都会导致恰好或近似服从泊松概率定律的随机现象。这类随机现象也与事故、差错、故障及其他类似灾祸的发生有关。

要理解导致泊松概率定律的随机现象类型,最好先考虑导致二项概率定律的现象类型。二项概率定律通常适用于以下情形:观察到某个实验的 n 次独立重复。然后可以确定 (i) 某一事件发生的试验次数,以及 (ii) 该事件未发生的试验次数。然而,有些随机事件并非作为实验的确定试验结果出现,而是在时间或空间中的随机点出现。对于此类事件,可以计算在一段时间(或空间)内该事件发生的次数。但是,谈论在一段时间(或空间)内该事件未发生的次数是没有意义的。例如,假设观察一小时内到达某个机场的飞机数量。可以报告有多少架飞机到达了机场;然而,询问有多少架飞机没有到达机场是没有意义的。类似地,如果观察单位体积某种液体中的生物数量,可以计算存在的生物数量,但谈论计算不存在的生物数量是没有意义的。

接下来,我们指出一些条件,在这些条件下,可以预期在时间或空间中发生的随机事件(例如在三维空间中某点存在生物,或在时间中某点有飞机到达)的发生次数服从泊松概率定律。我们做出基本假设:存在一个正数 μ ,使得对于任意小的正数 h 和任意长度为 h 的时间区间,

(i) 在该区间内恰好发生一个事件的概率近似等于 μ h ,其意义是它等于 μ h + r 1 ( h ) ,且当 h 趋于0时, r 1 ( h ) / h 趋于0;

(ii) 在该区间内恰好发生零个事件的概率近似等于 1 μ h ,其意义是它等于 1 μ h + r 2 ( h ) ,且当 h 趋于0时, r 2 ( h ) / h 趋于0;并且,

(iii) 在该区间内发生两个或更多事件的概率等于一个量 r 3 ( h ) ,使得当区间长度 h 趋于0时,商 r 3 ( h ) / h 趋于0。

参数 μ 可以解释为事件在单位时间(或空间)内发生的平均速率;因此,我们将 μ 称为(事件的)平均发生率

例3A. 假设观察汽车到达收费桥收费站亭的时间。假设我们得知汽车到达的平均速率 μ 为每分钟 μ = 1.5 辆。那么,前述假设表明,在长度为 h = 1 = ( 1 60 ) 分钟的时间段内,恰好有一辆车到达的近似概率为 μ h = ( 1.5 ) ( 1 60 ) = 1 40 ,而恰好没有车到达的近似概率为 1 μ h = 39 40

除了关于参数 μ 存在性及其所述性质的假设外,我们还假设:如果一个时间区间被分成 n 个子区间,并且对于 i = 1 , , n , A i 表示在第 i 个子区间内至少发生一个我们所观察类型的事件这一事件,那么对于任意整数 n , A 1 , , A n 是相互独立的事件。

现在,我们在这些假设下证明:在长度为(或面积、体积为) t 的一段时间(或空间)内,事件的发生次数服从参数为 μ t 的泊松概率定律;更精确地说,在长度为 t 的时间段内恰好发生 k 个事件的概率等于

 

因此,我们可以简要地描述一系列在时间(或空间)中发生且满足前述假设的事件,即称这些事件以每单位时间(或单位空间) μ 个事件的速率服从泊松概率定律

注意,如果 X 是在长度为 t 的时间区间内发生的事件数,那么 X 服从均值为 μ t 的泊松概率定律。因此, μ 是单位时间内事件发生的平均速率,其意义是:在长度为1的时间区间内发生的事件数服从均值为 μ 的泊松概率定律。

为证明(3.1),我们将长度为 t 的时间段分成 n 个长度为 h = t / n 的时间段。那么,在时间 t 内发生 k 个事件的概率近似等于在原始区间所分成的 n 个子时间区间中,恰好有 k 个子区间内恰好发生一个事件的概率。根据前述假设,这等于在 n 次独立重复伯努利试验中恰好获得 k 次成功的概率,其中每次试验成功的概率为 p = h μ = ( μ t ) / n ;这等于

 

现在,(3.2) 只是对在时间 t 内发生 k 个事件的概率的一个近似。为了得到精确值,我们必须让子区间的数量增加到无穷大。那么,(3.2) 趋于 (3.1),因为将 (3.2) 重写为

1 k ! ( μ t ) k ( 1 μ t n ) n k ( n ) k n k 1 k ! ( μ t ) k e μ t  

n 时。

应当注意,上述对 (3.1) 的推导并非完全严格。要给出 (3.1) 的严格证明,必须将所考虑的随机现象视为一个随机过程。在第5节中,将给出一个使用微分方程的此类证明的概述。

例3B. 已知某种细菌在水中以每立方厘米两个细菌的速率出现。假设该现象服从泊松概率定律,那么一个两立方厘米的水样中 (i) 没有细菌,(ii) 至少有两个细菌的概率是多少?

 

根据所作假设,两立方厘米水样中的细菌数服从参数为 μ t = ( 2 ) ( 2 ) = 4 的泊松概率定律,其中 μ 表示细菌在单位体积中出现的速率, t 表示所考虑水样的体积。因此,水样中没有细菌的概率等于 e 4 ,水样中有两个或更多细菌的概率等于 1 5 e 4

 

例3C. 印刷错误。 在一本已出版的520页的书中,出现了390个排版错误。随机选取四页作为印刷商工作样本,这四页完全没有错误的概率是多少?

 

所述问题无法用数学方法求解。然而,让我们将问题重新表述如下。假设某印刷商的工作中排版错误按照泊松概率定律发生,速率为每页 390 / 520 = 3 4 个错误。那么四页中的错误数服从参数为 (3) 4 = 3 的泊松概率定律;因此,这四页中没有错误的概率是 e 3

 

例3D. 电子管中的散粒噪声。 电子放大器和设备所能达到的灵敏度固有地受到这些器件中存在的自发电流波动的限制,这种波动通常称为噪声。真空管中噪声的一个来源是散粒噪声,它是由受热阴极随机发射电子引起的。假设阴极和阳极之间的电势差非常大,以至于阴极发射的所有电子都具有很高的速度,从而在阴极和阳极之间没有电子积累(因此没有空间电荷)。如果我们将阴极发射一个电子视为一个事件,那么可以证明 (3.1) 之前的假设是满足的(参见 W. B. Davenport, Jr. 和 W. L. Root 所著《随机信号与噪声理论导论》,McGraw-Hill,纽约,1958年,第112–119页)。因此,在长度为 t 的时间区间内,阴极发射的电子数服从参数为 λ t 的泊松概率定律,其中 λ 是阴极发射电子的平均速率。

泊松概率定律于1837年由泊松在其著作《关于刑事案件和民事案件判决概率的研究》中首次发表。1898年,在一部题为《小数定律》的著作中,博特凯维茨描述了泊松分布的各种应用。然而,直到1907年,泊松分布更多地被视为一种奇闻异事而非有用的科学工具,因为其应用对象是诸如妇女儿童自杀以及普鲁士军队中被马踢死等此类现象。由于它是作为二项分布的极限推导出来的,泊松定律通常被描述为:在大量独立重复试验中,每次试验成功的概率非常小的情况下,成功次数的概率定律。

1907年,著名统计学家 W. S. 戈塞特(按照他的习惯,以笔名“学生”发表文章)推导出泊松定律,作为在液体样本液滴中发现的微小颗粒数量的概率定律,其假设是颗粒在液体中随机分布;参见“学生”的《关于使用血细胞计数器计数的误差》,《生物统计》,第5卷,第351页。1910年,泊松定律被证明符合“从钋薄膜上每 1 8 分钟或 1 4 分钟间隔内释放的 α 粒子数”;参见卢瑟福和盖革的《 α 粒子分布的概率变化》,《哲学杂志》,第20卷,第700页。

尽管能够陈述随机现象在何种假设下会服从具有某个参数 λ 的泊松概率定律,但常数 λ 的值不能从理论上推导出来,而必须通过经验确定。 λ 的确定是一个统计问题。以下确定 λ 的程序可以基于多种理由得到证明。给定在时间中发生的事件,选择一个长度为 t 的区间。观察大量 N 个长度为 t 的时间区间。对于每个整数 k = 0 , 1 , 2 , ,令 N k 为恰好发生 k 个事件的区间数。令

 

为在 N 个长度为 t 的区间中观察到的事件总数。那么比值 T / N 表示每个长度为 t 的时间区间内观察到的事件平均发生数。作为参数 λ 值的估计 λ ^ ,我们取

 

如果我们相信所观察的随机现象服从参数为 λ ^ 的泊松概率定律,那么我们可以计算在长度为 t 的时间区间内恰好发生 k 次成功的概率 p ( k ; λ ^ )

例3E. 美国最高法院的空缺。 W. A. 沃利斯在《泊松分布与最高法院》一文中(《美国统计协会杂志》,第31卷(1936年),第376–380页)报告说,在1837年至1932年的96年间,美国最高法院因成员死亡或辞职而出现的空缺情况如下:

k = 一年内的空缺数 N k = k 个空缺的年数
059
127
29
超过31

由于 T = 27 + 2 9 + 1 3 = 48 N = 96 ,由 (3.4) 可得 λ ^ = 0.5 。如果相信最高法院的空缺按照泊松概率定律以平均每年0.5个的速率发生,那么可以得出,下任总统在其四年任期内不会任命任何最高法院法官的概率等于 e 2

上述数据也提供了一种检验假设的方法,即最高法院的空缺是否以每年0.5个空缺的速率服从泊松概率分布。如果是这种情况,那么一年内有 k 个空缺的概率由下式给出 p ( k ; 0.5 ) = e 0.5 ( 0.5 ) k k ! , k = 0 , 1 , 2 , .  

N 年中,出现 k 个空缺的期望年数,等于 N p ( k ; 0.5 ) ,可以计算出来并与观察到出现 k 个空缺的年数进行比较;参见表3A。

 96年中出现 k 个空缺的年数
3-4 空缺数 k   k 个空缺的概率 p ( k ; 0.5 ) 期望年数 ( 96 ) p ( k ; 0.5 )  观测年数 N k  
00.606558.22459
10.303329.11727
20.07587.2779
30.01261.2101
超过30.00180.1730
表 3A 

然后可以通过各种统计准则(例如拟合优度的 χ 2 检验)比较观测值和期望值,以确定观测结果是否与假设相容,即空缺数是否服从平均率为0.5的泊松概率律。

泊松概率律及其相关定律在排队(等待线)的数学理论以及库存和生产控制的数学理论中以多种方式出现。我们给出一个非常简单的库存问题示例。应注意,为了使以下示例更符合实际,必须考虑各种可用行动的成本。

例3F. 一个库存问题。假设某零售商发现,在给定时间段内,顾客对某种商品的需求数量服从参数已知为 λ 的泊松概率律。该零售商在时间段开始时手头应持有该商品多少库存 K ,才能以0.99的概率保证他能立即满足在所考虑时间段内所有要求该商品的顾客?

 

问题是求数 K ,使得在该时间段内,当商品被需求时,该事件发生次数为 K 次或更少的概率为0.99。由于该事件的发生次数服从参数为 λ 的泊松概率律,我们寻求整数 K 使得

 

 

不等式(3.5)中第二个不等式的解 K 可从Molina的表中读出(E. C. Molina, Poisson's Exponential Binomial Limit, Van Nostrand, 纽约, 1942)。如果 λ 大到可以使用正态近似来逼近泊松律,那么(3.5)可以显式解出 K 。由于(3.5)中的第一个和近似等于 Φ ( K λ + 1 2 λ ) , K 应选择使得 ( K λ + 1 2 ) / λ = 2.326  

 

理论习题

3.1. 空中搜索问题。陈述以下断言成立的条件:如果 N 艘船随机分布在面积为 A 的海洋区域上,并且一架飞机每小时飞行可搜索 Q 平方英里的海洋,那么一架飞机在 T 小时的飞行中发现的船只数量服从参数为 λ = N Q T / A 的泊松概率律。

3.2. 匹配数近似服从泊松概率律。考虑将 M 个编号为1到 M 的球分配到 M 个瓮中,使得每个瓮恰好包含1个球,求所得的匹配数。证明当 M 趋于无穷大时,恰好有 m 个匹配的概率趋于 e 1 ( 1 / m ! ) ,因此对于大的 M ,匹配数近似服从参数为1的泊松概率律。

习题

仔细陈述你在解决以下问题时所依据的概率假设。请记住经验观察到的事实:事故、错误、故障等的发生在许多情况下似乎服从泊松概率律。

3.1. 1949–1954年间,脊髓灰质炎的发病率约为每10万人口25例。在一个有4万人口的城市中,出现5例或更少病例的概率是多少?在一个有 1 , 000 , 000 人口的城市中,出现5例或更少病例的概率是多少?陈述你的假设。

 

答案

0.0671 0.000

 

3.2. 一家羊毛毯制造商通过计算缺陷数来检查毯子。(缺陷可能是撕裂、油渍等。)根据过去记录,已知每条毯子的平均缺陷数为5。计算一条毯子包含2个或更多缺陷的概率。

3.3. 某银行的出纳员在录入分类账时,每页录入的错误率为0.75个错误。问在4页中出现2个或更多错误的概率是多少?

 

答案

0.8008。

 

3.4. 某工厂的工人发生事故的比率是每周2起。计算在(i) 1周,(ii) 2周内发生2起或更少事故的概率;(iii) 计算在2周中的每一周都发生2起或更少事故的概率。

3.5. 一个放射源在4个时间间隔内被观测,每个间隔为6秒。记录每个期间发射的粒子数。如果发射的粒子服从泊松概率律,发射率为每秒0.5个粒子,求以下概率:(i) 在4个时间间隔的每一个中,发射3个或更多粒子,(ii) 在4个时间间隔中至少有1个间隔发射3个或更多粒子。

 

答案

(i) 0.111; (ii) 0.968。

 

3.6. 假设某州的自杀率为每周每25万居民中1起自杀。

(i) 求在一个有50万人口的城镇中,一周内发生6起或更多自杀的概率。

(ii) 一年中预期有多少周该城镇会报告6起或更多自杀。

(iii) 如果在一年中至少有2周报告了6起或更多自杀,你会觉得惊讶吗?

3.7. 假设顾客以每小时30人的速率进入某商店。

(i) 在2分钟的时间间隔内,要么没有人进入商店,要么至少有2人进入商店的概率是多少?

(ii) 如果你观察了30个2分钟间隔内进入商店的人数,发现有20个或更多的间隔具有要么无人进入、要么至少有2人进入的特性,你会觉得惊讶吗?

 

答案

(i) 0.632; (ii) 不惊讶,因为在一小时内,要么无人进入、要么有2人或更多人进入的2分钟间隔数服从二项概率律,均值为19.0,方差为6.975。

 

3.8. 假设打入某交换机的电话呼叫服从泊松概率律,速率为每分钟16次呼叫。如果该交换机每分钟最多能处理24次呼叫,使用正态近似,求在1分钟内交换机收到的呼叫超过其处理能力的概率(假设所有线路均空闲)。

3.9. 在一个大型送货卡车车队中,由于维修原因,每天平均有2辆无法使用。现有两辆备用卡车。问在任何一天,(i) 不需要备用卡车的概率,(ii) 备用卡车数量不足的概率是多少。

 

答案

(i) 0.1353; (ii) 0.3233。

 

3.10. 一家大型公交公司的公交车每天发生重大发动机故障的比率为2起。假设每次发动机故障需要一名机械师工作一整天,该公司应雇佣多少名机械师,以确保至少有0.95的概率在每台发动机发生故障时都有机械师可进行维修?(更准确地说,求最小的整数 K ,使得一天内发生 K 次或更少发动机故障的概率大于或等于0.95。)

3.11. 考虑一家位于城市商业区的餐厅。如果它希望在给定的一小时内为至少 95 % 希望得到服务的顾客提供服务,假设潜在顾客(每位至少需要一小时用餐)按照以下方案到达,它应设置多少个座位:

(i) 在给定的一小时内有1000人经过该餐厅,每人有 1 / 100 的概率希望在该餐厅用餐(即,每个经过餐厅的人每100次中有1次进入该餐厅);

(ii) 每人有 1 / 100 概率希望在该餐厅用餐的人,以每小时1000人的速率经过该餐厅;

(iii) 希望成为该餐厅顾客的人,以每小时10人的速率到达餐厅。

 

答案

15。

 

3.12. 伦敦的飞弹命中。以下数据(R. D. Clarke, “An application of the Poisson distribution”, Journal of the Institute of Actuaries, Vol. 72 (1946), p. 48)给出了二战期间伦敦南部576个各为 t = 1 4 平方公里的小区域中记录的飞弹命中次数。

k =  每区域飞弹   命中次数  N k =  有  k  次命中   的区域数  0 229 1 211 2 93 3 35 4 7 5  或以上  1  

使用例 3 E 中的步骤,证明这些观测结果与泊松概率律吻合良好。

3.13. 对于以下每个数值随机现象,陈述在何种条件下可以预期它精确地或近似地服从泊松概率律:(i) 某给定交换机每分钟接到的电话呼叫数;(ii) 高速公路上某给定点每分钟通过的汽车数;(iii) 显微镜载玻片上每0.01平方毫米给定培养物中的细菌菌落数;(iv) 每75手桥牌中拿到4张A的次数;(v) 每盒100个螺丝中的次品数。