概率论作为随机现象的研究
当今时代最显著的特征之一,就是概率论的思想在极其广泛的科学领域中得到日益广泛的应用,涉及的问题既遥远又多样,例如:遗传学家预测各种特征在个体群体中出现的相对频率;电话工程师计算电话通信量的密度;工业工程师将制造产品的质量维持在某一标准;通信与自动控制系统设计工程师在噪声存在的情况下传输信号;物理学家研究电路中的热噪声以及悬浮在液体或气体中粒子的布朗运动。概率论中究竟研究的是什么,使其能有如此多样的应用?为了回答这个问题,我们必须首先定义那些现象所共有的性质,例如:拥有某种遗传特征的个体数量、某城市在一天中特定时段内拨打的电话数量、通过某种工艺制造的产品的质量标准、某条特定公路上每天发生的汽车事故数量,等等。这些现象中的每一个,通常都可以根据以下定义被视为一个随机现象。
一个随机(或偶然)现象是一种经验现象,其特征是:在一组给定的条件下对其进行观测,并不总是得到相同的观测结果(因此不存在确定性的规律),而是以某种方式得到不同的结果,使得存在统计规律性。这意味着,存在介于0和1之间的数字,它们代表了在对该现象的独立发生进行的一系列观测中,不同可能结果被观测到的相对频率。
与随机现象的概念密切相关的是随机事件和随机事件概率的概念。一个随机事件是指,在可能发生该事件的随机选择情形下,进行一长串观测时,其发生的相对频率会随着观测次数增加到无穷大而趋近于一个稳定的极限值;这个相对频率的极限值被称为该随机事件的概率。
为了更详细地阐明随机现象的含义,让我们考虑一个典型的随机事件,即汽车事故。显然,一次特定事故究竟在何处、何时以及如何发生,取决于数量庞大的因素,其中任何一个因素的微小改变都可能极大地改变事故的性质,甚至完全避免它。例如,在两车相撞的事故中,如果其中一位驾驶员早十秒或晚十秒出发,如果他停下来买香烟,为了躲避一只碰巧穿过马路的猫而减速,或者因为无数类似原因中的任何一个而改变路线,那么这次特定的事故就绝不会发生;而即使方向盘的一个微小不同转动,也可能完全避免事故,或彻底改变其性质,无论是变得更好还是更糟。对于任何一位驶上某条特定公路的驾驶员,无法预测他是否会卷入汽车事故。然而,如果我们观察在某一天驶上这条公路的所有(或仅仅是数量非常大的)驾驶员,我们就能确定其中发生汽车事故的比例。如果这个比例日复一日地保持不变,那么我们就可以相信,在这条公路上驾驶的驾驶员所遇到的情况是一个随机现象,而他发生汽车事故这一事件是一个随机事件。
另一个典型的随机现象出现在我们考虑从瓮中抽球的实验时。具体来说,让我们检查一个装有六个球的瓮(或碗),其中四个是白色的,两个是红色的。除了颜色之外,这些球在每一个细节上都完全相同。抽取一个球并记录其颜色。我们可能会忍不住问:“从瓮中抽出的球会是什么颜色?”然而,很明显这个问题没有答案。如果一个人实际进行了从这样一个瓮中抽球的实验,他抽出的球的颜色有时是白色,有时是红色。因此,抽球实验的结果是不可预测的。
然而,关于这个实验,有些事情是可以预测的。在表1A中,给出了600次独立试验的结果(即,我们取一个装有四个白球和两个红球的瓮,将球充分混合,抽取一个球并记录其颜色,之后将抽出的球放回瓮中;这些操作重复了600次)。可以看到,在每100次试验的组块中(以及在整个600次试验中),抽出白球的实验比例大约等于。因此,人们可能会倾向于断言,比例对这个实验具有某种真实的意义,并且在一个相当长的试验系列中,抽出的球中将有是白色的。如果一个人屈从于这种倾向,那么他就断言了该实验(从一个装有六个球,其中四个白球两个红球的瓮中抽球)的结果是一个随机现象。
| 试验编号 | 抽出的白球数 | 试验编号 | 抽出白球的比例 |
|---|---|---|---|
| 1–100 | 69 | 1–100 | 0.690 |
| 101–200 | 70 | 1–200 | 0.695 |
| 201–300 | 59 | 1–300 | 0.660 |
| 301–400 | 63 | 1–400 | 0.653 |
| 401–500 | 76 | 1–500 | 0.674 |
| 501–600 | 64 | 1–600 | 0.668 |
更一般地说,如果一个人相信,从瓮中抽球的实验在一长串试验中,会以某个确定的比例(可能未知)抽出白球,那么他就断言了(i)从这样一个瓮中抽球是一个随机现象,并且(ii)抽出一个白球是一个随机事件。
让我们举例说明人们如何利用一个现象是随机的这一知识(或信念)。考虑一个由300人组成的群体,他们是某所学校的入学申请者,而该校仅有容纳200名学生的设施。为了公平起见,决定使用一种随机机制从申请者中选择学生。一种可能的随机方法是,将300名申请者聚集在一个房间里。每位申请者从一个装有六个球(其中四个是白球)的瓮中抽取一个球;抽到白球的人被录取为学生。对于单个学生而言,无法预知他是否会通过这种选择方法被录取。然而,如果我们相信抽球实验的结果具有统计规律性,那么基于表1A所代表的实验(该表表明抽到白球的概率是),我们相信抽到白球并因此被录取为学生的申请者人数将大约等于200(注意,200代表(i)实验的试验次数与(ii)实验产生白球这一事件的概率的乘积)。通过更仔细的分析,可以证明,抽到白球的申请者人数在186到214之间的概率相当高。
本书的目标之一是展示如何借助概率论,使用相同的数学程序来解决截然不同的问题。为了说明这一点,我们考虑前述问题的一个变体,它具有重大的实际意义。许多大学发现,他们录取的学生中只有一定比例最终实际入学。因此,大学必须决定录取多少学生,以确保有足够的学生入学。假设一所大学发现其录取的学生中只有三分之二入学;那么可以说,一个学生入学的概率是。如果该大学希望确保大约200名学生入学,它就应该录取300名学生。
练习
1.1. 分别举出一个会被以下人员研究的随机现象的例子:(i)物理学家,(ii)遗传学家,(iii)交通工程师,(iv)质量控制工程师,(v)通信工程师,(vi)经济学家,(vii)心理学家,(viii)社会学家,(ix)流行病学家,(x)医学研究员,(xi)教育工作者,(xii)电视广播公司的高管。
1.2. 《美国统计摘要》(1957年版,第57页)报告称,在美国出生的数百万婴儿中,每1000名女婴对应的男婴出生数在所列年份如下:
| 年份 | 每1000名女婴对应的男婴出生数 |
|---|---|
| 1935 | 1053 |
| 1940 | 1054 |
| 1945 | 1055 |
| 1950 | 1054 |
| 1951 | 1052 |
| 1952 | 1051 |
| 1953 | 1053 |
| 1954 | 1051 |
| 1955 | 1051 |
你会说新生儿是男孩这一事件是一个随机事件吗?如果是,这个随机事件的概率是多少?解释你的推理。
1.3. 一个讨论题。描述你将如何向外行解释以下陈述的含义:一家保险公司并非在与它的客户赌博,因为它以足够的准确性知道每千人、每万人或每百万人中会发生什么,即使该公司无法预知其中任何单个个体身上会发生什么。