指定数值型随机现象的概率函数

考虑一个数值随机现象的概率函数 P [ ] 。问题在于如何方便地表述该函数,而无需对每一个实数集 E 都实际给出 P [ E ] 的值。一般来说,要表述函数 P [ ] ,如同表述任何函数一样,必须枚举函数 P [ ] 定义域中的所有成员,并对定义域中的每个成员给出函数的值。在特殊情况下(幸运的是,这些情况涵盖了实践中遇到的大多数情形),有更方便的方法可用。

对于许多概率函数,存在一个对所有实数 x 都有定义的函数 f ( ) ,通过该函数,对于任何事件 E ,都可以通过积分得到 P [ E ]  

给定一个概率函数 P [ ] ,如果它可以借助某个函数 f ( ) 表示为 (2.1) 的形式,我们称函数 f ( ) 为该概率函数 P [ ] 概率密度函数,并称该概率函数 P [ ] 由概率密度函数 f ( ) 所指定。

一个函数 f ( ) 必须具有某些性质才能成为概率密度函数。首先,它作为一个函数必须足够良好,使得 (2.1) 中的积分1 是良定义的。其次,在 (2.1) 中令 E = R ,有  

f ( ) 必须满足 (2.2) ;换言之, f ( ) 的积分必须等于 1。

如果一个函数 f ( ) 满足 (2.2) ,并且还 2 满足条件 对于中的所有 则称该函数为概率密度函数,因为满足 (2.2) (2.3) 的函数 f ( ) 是一个唯一概率函数 P [ ] 的概率密度函数,该概率函数在任何事件 E 处的值 P [ E ] (2.1) 给出。 

一些典型的概率密度函数如 图 2A 所示。

图 2.4.1
图 2A 。所示练习中给出的概率密度函数的图形。

例 2A 验证一个函数是概率密度函数。假设有人告诉你,在某个街角等公交车的时间是一个数值随机现象,其概率函数由概率密度函数 f ( ) 指定,该函数由下式给出 如果否则

函数 f ( ) 对于 x 的多个值都是负的;特别地,对于 0 x 1 4 它是负的(证明此陈述)。因此, f ( ) 不可能是一个概率密度函数。接下来,假设概率密度函数 f ( ) 由下式给出 如果否则 

(2.5) 给出的函数 f ( ) 是非负的(证明此陈述)。然而,它从 的积分, f ( x ) d x = 8 3 , 不等于 1。因此,由 (2.5) 给出的函数 f ( ) 不是一个概率密度函数。然而,由下式给出的函数 f ( ) 如果否则是一个概率密度函数。

例 2B 从概率密度函数计算概率。让我们再次考虑例 1A 中讨论过的数值随机现象,即观察在某个公交站等车的时间。让我们假设该现象的概率函数 P [ ] 可以通过 (2.1) 用函数 f ( ) 来表示,其图形如 图 2B 所示。 f ( ) 的代数公式可以写为:对于对于对于对于对于对于对于 

图 2.4.1
图 2B 。由 (2.6) 定义的概率密度函数 f ( ) 的图形。

(2.1) 可知,如果 A = { x : 0 x 2 } B = { x : 1 x 3 } ,则 这与例 1A 中假设的值一致。

例 2C 真空管的寿命。考虑一个数值随机现象,即观察一个真空管从首次投入使用起总共燃烧的时间。假设该现象的概率函数 P [ ] 通过 (2.1) 用如下给出的函数 f ( ) 来表示 对于对于 

E 为真空管燃烧时间在 100 到 1000 小时(含)之间的事件,设 F 为真空管燃烧时间超过 1000 小时的事件。事件 E F 可以表示为实数轴上的子集: E = { x : 100 x 1000 } F = { x : 1000 < x } E F 的概率由下式给出  

对于许多概率函数,存在一个对所有实数 x 都有定义的函数 p ( ) ,但除了在有限个或可数无限个 x 值处 p ( x ) 为正外,对于所有其他 x ,其值 p ( x ) 等于 0,使得通过 p ( ) ,对于任何事件 E ,都可以通过求和得到 P [ E ] 的值:遍及中所有使得的点 为了使 (2.7) 中的和有意义,只需施加条件 [在 (2.7) 中令 E = R ] 即 遍及所有使得的点 

给定一个概率函数 P [ ] ,如果它可以表示为 (2.7) 的形式,我们称函数 p ( ) 为该概率函数 P [ ] 概率质量函数,并称该概率函数 P [ ] 由概率质量函数 p ( ) 所指定。

一个对所有实数都有定义的函数 p ( ) ,如果 (i) 除了在有限个或可数无限个 x 值处 p ( x ) > 0 外,对于所有其他 x p ( x ) 等于零,并且 (ii) (2.8) 中的无穷级数收敛且和为 1,则称该函数为概率质量函数。这样的函数是定义在实数轴子集上的唯一概率函数 P [ ] 的概率质量函数,该概率函数在任何集合 E 处的值 P [ E ] (2.7) 给出。 

例 2D 从概率质量函数计算概率。让我们再次考虑例 1A 和 2B 中考虑的数值随机现象。假设该现象的概率函数 P [ ] 可以通过 (2.7) 用函数 p ( ) 来表示,其图形如 图 2C 所示。

图 2.4.1

图 2C 。由 (2.9) 定义的概率质量函数的图形。

p ( ) 的代数公式可以写为:除非对于某个对于对于对于 

由此可得 这与例 1A 中假设的值一致。

“密度函数”和“质量函数”这两个术语源自数值随机现象的 P [ ] 概率函数的以下物理表示。我们设想将某种物质的单位质量分布在实数轴上,使得在任何实数集 B 上的质量等于 P [ B ] 。该物质的分布在点 x 处具有密度,记为 f ( x ) ,如果对于包含点 x 且长度为 h (其中 h 是一个足够小的数)的任何区间,附着在该区间上的物质质量等于 h f ( x ) 。该物质的分布在点 x 处具有质量,记为 p ( x ) ,如果存在正的质量 p ( x ) 集中在该点。

我们将在第3节中看到,概率函数 P [ ] 总是具有概率密度函数和概率质量函数。因此,为了使概率函数由其概率密度函数或概率质量函数来指定,有必要(并且从实际角度来看,也是充分的)使其中一个函数恒等于零。

习题

验证习题 2.1 2.5 中给出的每个函数 f ( ) 都是概率密度函数(通过证明它满足(2.1)(2.3)),并绘制其图形。3提示:可自由使用本节附录中推导出的事实。

2.1.对于其他情况。对于其他情况。对于对于对于其他情况。 

2.2.对于其他情况。对于其他情况。对于其他情况。

2.3.对于其他情况。对于其他情况。

2.4.对于

2.5.对于其他情况。对于其他情况。

证明习题2.6和2.7中给出的每个函数 p ( ) 都是概率质量函数[通过证明它满足(2.8)],并绘制其图形。 
提示:可自由使用本节附录中推导出的事实。

2.6.对于对于其他情况。对于其他情况。对于其他情况。对于其他情况。 

2.7.对于其他情况。对于其他情况。对于其他情况。

2.8.某面包店一天能售出的面包数量(以百磅计)是一个数值随机现象,其概率函数由概率密度函数 f ( ) 指定,如下所示

对于对于其他情况 

  1. 求使 f ( ) 成为概率密度函数的 A 值。
  2. 绘制概率密度函数的图形。
  3. 明天售出的面包磅数分别为(a)超过500磅, ( b ) 少于500磅,(c)介于250到750磅之间的概率是多少?
  4. 分别用 A , B C 表示一天售出的面包磅数( a )大于500磅, ( b ) 少于500磅, ( c ) 介于250到750磅之间的事件。求 P [ A B ] , P [ A C ] A B 是独立事件吗? A C 是独立事件吗?

2.9.某年轻女士打电话的时间长度(以分钟计)是一个随机现象,其概率函数由概率密度函数 f ( ) 指定,如下所示 对于其他情况。 

(i) 求使 f ( ) 成为概率密度函数的 A 值。

(ii) 绘制概率密度函数的图形。

(iii) 该年轻女士打电话的分钟数 ( a ) 超过10分钟, ( b ) 少于5分钟, ( c ) 介于5到10分钟之间的概率是多少?

(iv) 对于任意实数 b ,令 A ( b ) 表示该年轻女士通话时间长于 b 分钟的事件。求 P [ A ( b ) ] 。证明,对于 a > 0 b > 0 , P [ A ( a + b ) A ( a ) ] = P [ A ( b ) ] 。用文字表述,即已知一次电话通话已经持续了至少 a 分钟,其持续时间将超过 a + b 分钟的条件概率,等于其持续时间将超过 b 分钟的无条件概率。

 

答案

(i) A = 1 5 ; (iii) (a) 0.1353, (b) 0.6321, (c) 0.2326; (iv) P [ A ( b ) ] = e b / 5

 

2.10.某报童一天能卖出的报纸数量是一个数值随机现象,其概率函数由概率质量函数 p ( ) 指定,如下所示

对于对于其他情况。 

(i) 求使 p ( ) 成为概率质量函数的 A 值。

(ii) 绘制概率质量函数的草图。

(iii) 明天将售出的报纸数量为(a)超过50份,(b)少于50份,(c)等于50份,(d)介于25到75份之间(含),(e)为奇数的概率是多少?

(iv) 分别用 A , B , C D 表示一天售出的报纸数量为(a)大于 50 , ( b ) 小于 50 , ( c ) 等于50,(d)介于25到75之间(含)的事件。求 P [ A B ] , P [ A C ] , P [ A D ] P [ C D ] A B 是独立事件吗? A D 是独立事件吗? C D 是独立事件吗?

2.11.某设备(例如,一个电灯开关)在必须报废之前能够操作的次数是一个随机现象,其概率函数由概率质量函数 p ( ) 指定,如下所示

对于其他情况。 

(i) 求使 p ( ) 成为概率质量函数的 A 值。

(ii) 绘制概率质量函数的草图。

(iii) 设备在必须报废之前将操作的次数为(a)大于 5 , ( b ) 偶数(将0视为偶数),(c)奇数的概率是多少?

(iv) 对于任意实数 b ,令 A ( b ) 表示设备操作的次数严格大于或等于 b 的事件。求 P [ A ( b ) ] 。证明,对于任意整数 a > 0 b > 0 , P [ A ( a + b ) A ( a ) ] = P [ A ( b ) ] 。用文字表述该公式的含义。

 

答案

(i) A = 2 3 ; (iii) (a) ( 1 3 ) 6 , (b) 3 4 , (c) 1 4 ; (iv) P [ A ( b ) ] = ( 1 3 ) b

 

附录:积分与求和的求值

如果(2.1)(2.7)要成为计算事件概率的有用表达式,那么就必须有可用的求和与积分求值技巧。本附录的目的是陈述学生应熟悉的一些概念和公式,并收集一些读者应学会使用的重要公式,即使他们缺乏证明这些公式的数学背景。

首先,让我们注意以下原则。如果一个函数在不同的区域由不同的解析表达式定义,那么要计算被积函数为该函数的积分,必须将该积分表示为对应于该函数不同定义区域的积分之和。例如,考虑由下式定义的概率密度函数 f ( ) 对于对于其他情况。 要证明 f ( ) 是一个概率密度函数,我们需要验证(2.2)(2.3)成立。显然,(2.3)成立。接下来, 因此(2.2)已被证明成立。可以注意到,(2.10)中的函数 f ( ) 可以用绝对值符号更简洁地写成: 对于其他情况 接下来,为了检验自己对基本积分技巧的掌握程度,读者应验证以下公式成立: e x ( 1 + e x ) 2 d x = 1 1 + e x , e x 1 + e 2 x d x = tan 1 e x = arctan e x ,  

一个通过分部积分法得到的重要积分公式如下,对于任何使积分有意义的实数 t 因此,对于 t = 2 ,我们得到  

接下来我们考虑伽马函数 Γ ( ) ,它在概率论中扮演着重要角色。对于每个 t > 0 ,它定义为  

The Gamma function is a generalization of the factorial function in the following sense. From (2.13) it follows that Therefore, for any integer r , 0 r < t , Since, clearly, Γ ( 1 ) = 1 , it follows that for any integer n 0  

Next, it may be shown that for any integer n > 0 which may be written for any even integer n since  

We prove (2.21) by showing that Γ ( 1 2 ) is equal to another integral of whose value we have need. In (2.15) , make the change of variable x = 1 2 y 2 , and let t = ( n + 1 ) / 2 . Then, for any integer, n = 0 , 1 , , we have the formula  

In view of (2.22) , to establish (2.21) we need only show that  

We prove (2.23) by proving the following basic formula; for any u > 0  

Equation (2.24) may be derived as follows. Let I be the value of the integral in (2.24) . Then I 2 is a product of two single integrals. By the theorem for the evaluation of double integrals, it then follows that  

We now evaluate the double integral in (2.25) by means of a change of variables to polar coordinates. Then I 2 = 1 2 π 0 2 π 0 e 1 2 u r 2 r d r d θ = 0 e 1 2 u r 2 r d r = 1 u , so that I = 1 / u , which proves (2.24) .

For large values of t there is an important asymptotic formula for the Gamma function, which is known as Stirling’s formula . Taking t = n + 1 , in which n is a positive integer, this formula can be written in which r ( n ) satisfies 1 1 / ( 12 n + 1 ) < r ( n ) < 1 . The proof of Stirling’s formula may be found in many books. A particularly clear derivation is given by H. Robbins, “A Remark on Stirling’s Formula”, American Mathematical Monthly , Vol. 62 (1955), pp. 26–29.

We next turn to the evaluation of sums and infinite sums . The major tool in the evaluation of infinite sums is Taylor’s theorem, which states that under certain conditions a function g ( x ) may be expanded in a power series: in which g ( k ) ( 0 ) denotes the value at x = 0 of the k th derivative g ( k ) ( x ) of g ( x ) . Letting g ( x ) = e x , we obtain  

Take next g ( x ) = ( 1 x ) n , in which n = 1 , 2 , Clearly  

Consequently, for n = 1 , 2 , which is a special case of the binomial theorem. One may deduce the binomial theorem from (2.30) by setting x = ( b ) / a .

We obtain an important generalization of the binomial theorem by taking g ( x ) = ( 1 x ) t , in which t is any real number. For any real number t and any integer k = 1 , 2 , define the binomial coefficient  

Note that for any positive number n  

By Taylor’s theorem, we obtain the important formula for all real numbers t and 1 < x < 1 ,  

For the case of n positive we may write, in view of (2.32) ,  

Equation (2.34) , with n = 1 , is the familiar formula for the sum of a geometric series:  

Equation (2.34) with n = 2 and 3 yields the formulas  

From (2.33) we may obtain another important formula. By a comparison of the coefficients of x n on both sides of the equation ( 1 + x ) s ( 1 + x ) t = ( 1 + x ) s + t , we obtain for any real numbers s and t and any positive integer n  

If s and t are positive integers (2.37) could be verified by mathematical induction. A useful special case of (2.37) is when s = t = n ; we then obtain (5.13) of Chapter 2 .

Theoretical Exercises

2.1 . Show that for any positive real numbers α , β , and t  

2.2 . Show for any σ > 0 and n = 1 , 2 ,  

2.3 . The integral which converges if m and n are positive, defines a function of m and n , called the beta function . Show that the beta function is symmetrical in its arguments, B ( m , n ) = B ( n , m ) , and may be expressed [letting x = sin 2 θ and x = 1 / ( 1 + y ) , respectively] by  

Show finally that the beta and gamma functions are connected by the relation Hint: By changing to polar coordinates, we have

2.4 . Use (2.41) and (2.42) , with m = n = 1 2 , to prove (2.23) .

2.5 . Prove that the integral defining the gamma function converges for any real number t > 0 .

2.6 . Prove that the integral defining the beta function converges for any real numbers m and n , such that m > 0 and n > 0 .

2.7 . Taylor’s theorem with remainder . Show that if the function g ( ) has a continuous n th derivative in some interval containing the origin then for x in this interval

Hint : Show, for k = 2 , 3 , , n , that

2.8 . Lagrange’s form of the remainder in Taylor’s theorem . Show that if g ( ) has a continuous n th derivative in the closed interval from 0 to x , where x may be positive or negative, then for some number θ in the interval 0 < θ < 1 .


  1. 我们通常假设(2.1) 中的积分是在黎曼意义下定义的;为确保这一点,我们要求函数 f ( ) 在除有限个点外的所有点上都有定义且连续。那么(2.1) 中的积分仅对事件 E 有定义,这些事件要么是区间,要么是有限个互不相交区间的并集。在高等概率论中,(2.1) 中的积分是通过亨利·勒贝格在20世纪初发展的一种积分理论来定义的。此时函数 f ( ) 必须是一个波莱尔函数,这意味着对于任意实数 c ,集合 { x : f ( x ) < c } 是一个波莱尔集。可以证明,一个在除有限个点外处处连续的函数是波莱尔函数。还可以证明,如果一个波莱尔函数 f ( ) 满足(2.1) (2.3) ,那么对于任意波莱尔集 B f ( ) B 上的积分作为勒贝格意义下定义的积分是存在的。如果 B 是一个区间,或是有限个互不相交区间的并集,并且 f ( ) B 上连续,那么 f ( ) B 上勒贝格意义下定义的积分,与 f ( ) B 上黎曼意义下定义的积分具有相同的值。此后,在本书中,“函数”一词(除非另有说明)将指波莱尔函数,“(实数)集”一词将指波莱尔集。 ↩︎ 
  2. 就本书的目的而言,我们还要求概率密度函数 f ( ) 在除有限个点外的所有点上都有定义且连续。 ↩︎ 
  3. 读者应注意本书习题中使用的约定。当一个函数 f ( ) 由对所有 x < x < 范围内的单一解析表达式定义时, x 之间变化这一事实并未明确指明。 ↩︎