随机变量的特征函数

已经指出,随机变量 X 的概率律可以通过多种方式指定。首先,可以陈述其概率函数 P X [ ] 或其分布函数 F X ( ) 。其次,如果已知该概率律是连续的或离散的,则可以通过陈述其概率密度函数 f X ( ) 或其概率质量函数 p X ( ) 来指定。我们现在描述另一个函数,记作 ϕ X ( ) ,称为随机变量 X 的特征函数,它具有这样的性质:知道 ϕ X ( ) 就能指定随机变量 X 的概率律。此外,我们将看到,特征函数具有一些性质,使其对于研究独立随机变量之和特别有用。

为了开始介绍特征函数,让我们注意关于随机变量 X 的概率函数 P X [ ] 和分布函数 F X ( ) 的以下事实。这两个函数都可以视为各种博雷尔函数 g ( ) 关于 X 的概率律的期望值。因此,对于每一个实数博雷尔集 B

 

其中 I B ( ) 是一个实变量函数,称为集合 B 的指示函数,在任意点 x 处的值 I B ( x ) 由下式给出 如果属于如果不属于另一方面,对于每一个实数 y 其中 I y ( ) 是一个实变量函数,定义为 如果如果因此我们看到,如果知道每一个有界博雷尔函数 g ( ) 关于随机变量 X 的概率律的期望 E X [ g ( x ) ] ,那么通过 (2.1) 和 (2.3) 就能知道 X 的概率函数和分布函数。反之,知道 X 的概率函数或分布函数,就能知道对于每一个期望存在的函数 g ( ) E [ g ( X ) ] 。因此,陈述一个随机变量的期望泛函 E X [ ] [它是一个函数,其自变量是一个函数 g ( ) ] 构成了指定随机变量概率律的另一种等价方式。

问题来了:除了 (2.2) 和 (2.4) 形式的那类函数之外,是否存在其他实直线上的函数族,使得知道这些函数关于随机变量 X 的概率律的期望就足以指定该概率律?我们现在证明,复指数函数提供了这样一个函数族。

我们定义关于随机变量 X 的、取值为复数的函数 g ( ) 的期望如下

 

其中符号 Re Im 分别是短语“实部”和“虚部”的缩写。注意

g ( x ) = Re g ( x ) + i Im g ( x ) .  

可以证明,在这些定义下,对于期望存在的复值函数,取期望运算的所有通常性质仍然成立。如果 E [ | g ( X ) | ] 有限,我们定义 E [ g ( X ) ] 存在。如果情况如此,那么可以推出

 

或者更明确地,

 

(2.7) 的有效性在理论练习 2.2 中得到证明。用文字来说,(2.6) 表明复值函数期望的模小于或等于该函数模的期望。

现在有了定义随机变量 X 的特征函数 ϕ X ( ) 的概念。我们定义 ϕ X ( ) 为实变量 u 的函数,其值是复指数函数 e i u x 关于 X 的概率律的期望;用符号表示,

 

对于任意实数 x u ,量 e i u x 定义为

 

其中 i 是虚数单位,定义为 i = 1 i 2 = 1 。由于 | e i u x | 2 = ( cos u x ) 2 + ( sin u x ) 2 = 1 ,因此对于任何随机变量 X , E [ | e i u X | ] = E [ 1 ] = 1 。因此,特征函数总是存在的。

随机变量的特征函数具有随机变量矩母函数的所有性质。随机变量 X 存在的所有矩都可以通过以下公式从特征函数的知识中获得

 

要证明 (2.10),必须使用第 5 节讨论的技巧。

更一般地,从随机变量的特征函数的知识中,可以获得其分布函数、其概率密度函数(如果存在)、其概率质量函数以及许多其他期望的知识。这些事实在第 3 节中建立。

特征函数在概率论中的重要性源于它们具有以下基本性质。考虑任意两个随机变量 X Y 。如果它们的特征函数近似相等 [即对于每个实数 u ,有 ϕ X ( u ) ϕ Y ( u ) ],那么它们的概率律在区间上近似相等(即对于任意有限数 a b , P [ a X b ] P [ a Y b ] ),或者等价地,它们的分布函数近似相等 [即对于所有实数 a ,有 F X ( a ) F Y ( a ) ]。这一论断的精确表述和证明在第 10 章给出。

特征函数是研究独立随机变量加法问题的理想工具,因为两个独立随机变量 X 1 X 2 之和 X 1 + X 2 的特征函数是 X 1 X 2 的特征函数的乘积;用符号表示,对于每个实数 u  

 

如果 X 1 X 2 是独立的。很自然地会问,是否存在其他函数具有类似于特征函数的性质。答案似乎是否定的。E. Lukacs 在其论文“分布函数的傅里叶变换的一个本质性质”,《美国数学学会会刊》,第 3 卷 (1952),第 508-510 页中证明了以下定理。设 K ( x , u ) 是两个实变量 x u 的复值函数,它是 x 的有界博雷尔函数。对于任意随机变量 X 定义 ϕ X ( u ) = E [ K ( X , u ) ] .  

为了使函数 ϕ X ( u ) 满足 (2.11) 和唯一性条件 对所有当且仅当对所有 其必要且充分条件是 K ( x , u ) 具有形式 K ( x , u ) = e i u A ( x ) , 其中 A ( x ) 是一个适当的实值函数。

例 2A. 如果 X 服从 N ( 0 , 1 ) ,那么其特征函数 ϕ X ( u ) 由下式给出

 

为了证明 (2.13),我们利用指数函数的泰勒级数展开:

 

(2.14) 中求和与积分次序的交换可以通过无穷级数被可积函数 exp ( | u x | 1 2 x 2 ) 控制这一事实来证明。

例 2B. 如果 X 服从 N ( m , σ 2 ) ,那么其特征函数 ϕ X ( u ) 由下式给出

 

为了证明 (2.15),定义 Y = ( X m ) / σ 。那么 Y 服从 N ( 0 , 1 ) ,且 ϕ Y ( u ) = e 1 / u 2 。由于 X 可以写成一个线性组合 X = σ Y + m ,(2.15) 的有效性由以下一般公式得出

如果 

例 2C. 如果 X 服从均值为 E [ X ] = λ 的泊松分布,那么其特征函数 ϕ X ( u ) 由下式给出

 

为了证明 (2.17),我们写出

 

例 2D. 考虑一个随机变量 X ,对于某个正常数 a ,其概率密度函数为

 

这被称为拉普拉斯分布。其特征函数 ϕ X ( u ) 由下式给出

 

为了证明 (2.20),我们注意到由于 f X ( x ) x 的偶函数,我们可以写出

 

理论练习

2.1. 累积量与对数特征函数。随机变量 X 的特征函数的对数(以 e 为底)通常易于求导。它的 n 阶导数可以用来构造 X 的第 n 累积量,记作 K n [ X ] ,定义为

 

如果 n 阶绝对矩 E [ | X | n ] 存在,那么 ϕ X ( ) log ϕ X ( ) 都是 n 次可微的,并且可以用它们的前 n 阶导数展开;特别地,

 

其中余项 R n ( u ) 满足当 | u ˙ | 趋于 0 时, | u | n R n ( u ) 趋于 0。从概率律的累积量的知识中,可以获得其矩和中心矩的知识。通过计算 e K ( t ) t = 0 处的导数,其中 K ( t ) = log ϕ X ( t ) ,证明 通过计算 e K m ( t ) 的导数,其中 K m ( t ) = log ϕ X ( t ) itm m = E [ X ] ,证明

2.2. 平方和开方不等式。通过证明对于任意两个随机变量 X Y ,有

 

来证明 (2.7) 成立。提示:证明并使用以下事实:对于满足 x 0 y 0 0 的实数 x , y , x 0 , y 0 ,有

x 2 + y 2 x 0 2 + y 0 2 [ ( x x 0 ) x 0 + ( y y 0 ) y 0 ] / x 0 2 + y 0 2

练习

2.1. 计算一个随机变量 X 的特征函数,其概率律为 (i) 均值为 3、标准差为 3 2 的二项分布,(ii) 均值为 3 的泊松分布,(iii) 参数为 p = 1 4 的几何分布,(iv) 均值为 3、标准差为 3 2 的正态分布,(v) 参数为 r = 2 λ = 3 的伽马分布。