随机现象的样本描述空间

有人曾指出，概率论是对随机现象数学模型的研究；换言之，概率论关注的是，在人们对某一随机现象假定了某些性质之后，能够对该现象做出哪些陈述。问题随之而来：如何构建关于随机现象的假设？这需要通过引入该随机现象的样本描述空间来实现。

随机现象的样本描述空间，通常用字母 $S$ 表示，是该现象所有可能结果的描述所构成的空间。

更具体地说，假设某人正在进行一项实验或观察一个现象。例如，他可能正在抛一枚硬币、两枚硬币或一百枚硬币；或者他可能正在测量人们的身高，或同时测量身高和体重，或测量身高、体重、腰围和胸围；又或者他可能正在测量并记录电路中某一点、两个点或整个时间段内的电压（通过拍摄电压在示波器上的影响）。在所有这些情况下，人们都可以想象一个空间，它包含了实验或观察结果的所有可能描述。我们称其为样本描述空间，因为实验或观察的结果通常被称为一个样本。因此，样本是已被观察到的东西；样本描述则是可观察事物的名称。

关于“空间”一词的使用，或许需要稍作说明。读者不应将本书中所用的空间概念，与用来指称我们所生活的世界中某些部分（例如行星之间的区域）的“空间”一词相混淆。现代数学中一个极为重要的概念——集合的概念，是所有数学理论的出发点。集合是对象的汇集（既可以是具体对象，如书籍、城市和人；也可以是抽象对象，如数字、字母和词语）。一个在某种意义上完备的、从而只考虑其中所含对象的集合，被称为一个空间。在发展任何数学理论时，首先必须定义该理论将要处理的事物的类别；这样一个代表论域的类别，就被称为一个空间。空间既没有维度也没有体积；更确切地说，空间是一个完备的对象汇集。

构建随机现象样本描述空间的技术，将在第2章中系统讨论。就目前而言，为了让读者对样本描述空间的样子有所了解，我们考虑几个简单的例子。

假设从一个装有六个球的瓮中抽取一个球，其中四个是白球，两个是红球。抽取的可能结果可以用 $W$ 和 $R$ 表示，我们根据抽出的球是白色还是红色，相应地记作 $W$ 或 $R$ 。用符号表示，我们写作 $S = {W, R}$ 。另一方面，我们可以将球编号为1到6；那么我们就写作 $S = {1, 2, 3, 4, 5, 6}$ ，以表示一次抽取的可能结果是一个数字，从1到6。

接下来，假设某人从一个装有编号为1到6的六个球的瓮中抽取两个球。我们需要一种记法来记录两次抽取的结果。假设第一个抽出的球编号为5，第二个抽出的球编号为3；我们记下两次抽取的结果为 $(5, 3)$ 。对象 $(5, 3)$ 被称为一个二元组。我们假设球是一个接一个地抽取的，并且抽取的顺序是重要的。那么 $(3, 5)$ 表示先抽出3号球、后抽出5号球的结果。此外， $(3, 5)$ 和 $(5, 3)$ 代表不同的可能结果。按照这种记法，从装有编号为1到6的球的瓮中抽取两个球的实验（假设按顺序抽取，且在第二次抽取前，第一次抽出的球不放回瓮中）的样本描述空间有30个元素：

接下来我们考虑一个涉及数值量测量的例子。假设某人正在观察某个城市中申请结婚证的夫妇的年龄（以年为单位）。我们采用以下记法来记录观察结果。假设观察到一对男女（正在申请结婚证），他们的年龄分别是24岁和22岁；我们通过写出二元组 $(24, 22)$ 来记录这次观察。类似地， $(18, 80)$ 表示一对夫妇的年龄，其中男方年龄为18岁，女方年龄为80岁。现在假设男性或女性可以结婚的年龄（以年为单位）是1到200之间的任意数字。显然，观察一对结婚夫妇年龄的可能结果数量太多，不便于一一列出；实际上，有 $(200) (200) = 40, 000$ 种可能的结果！由此可见，通常更便捷的做法是描述构成样本描述空间 $S$ 的样本描述，而不是将其列出。为了描述手头这个例子中的 $S$ ，我们写作 $元组是任意整数，从到是任意整数，从到$

我们有以下构建集合的记法。我们画出一对花括号来表示正在定义一个集合。接下来，我们可以通过列举其元素（例如， $S = {W, R}$ 和 $S = {1, 2, 3, 4, 5, 6}$ ）或通过描述其元素（如(3.2)所示）来定义集合。当使用后一种方法时，花括号内总会出现一个冒号。在冒号的左侧，将描述某种一般类型的对象；在冒号的右侧，将指定这些对象必须满足的性质，以便属于正在定义的集合。

到目前为止所考虑的所有样本描述空间都是有限大小的。¹然而，样本描述空间在逻辑上并不必须是有限的。事实上，有许多重要问题需要无限大小的样本描述空间。我们简要提及两个例子。假设我们正在观察一台用于记录宇宙射线计数的盖革计数器。记录的计数可以是任意整数。因此，作为样本描述空间 $S$ ，我们将采用所有正整数的集合 ${1, 2, 3, \dots}$ 。接下来，假设我们正在测量心电图或其他波动记录上两个相邻波峰之间的时间（以微秒为单位）；那么我们可以取集合 $S =$ {实数 $x$ : $0 < x < \infty}$ ，即所有正实数，作为我们的样本描述空间。

应该指出，一个随机现象的样本描述空间可以用不止一种方式来定义。对可能观察到什么持有不同概念的观察者，会得出不同的样本描述空间。例如，假设某人正在抛一枚硬币。样本描述空间可能由两个元素组成，我们将其记作 $H$ （代表正面）和 $T$ （代表反面）。用符号表示， $S = {H, T}$ 。然而，如果我们希望包含硬币可能侧立或边缘着地的可能性，样本描述空间也可能由三个元素组成。那么 $S = {H, T, R}$ ，其中描述 $R$ 代表硬币边缘着地的可能性。还有第四种可能性；硬币可能因被抛出视线之外或在落地时滚走而丢失。那么样本描述空间将是 $S = {H, T, R, L}$ ，其中描述 $L$ 表示丢失的可能性。

就概率论是对随机现象数学模型的研究而言，它无法给出构建样本描述空间的规则。相反，随机现象的样本描述空间是数学理论起始时未定义的概念之一。人们选择正确的样本描述空间来描述随机现象时所依据的考量，是将概率的数学理论应用于现实世界研究的一门艺术。

给定任意一个由任何类型对象组成的集合 $A$ ， $A$ 的大小定义为 $A$ 中元素的个数。如果一个集合的大小是有限数 ${1, 2, 3, \dots}$ 中的一个，则称该集合为有限大小。有限大小集合的例子如下：世界上所有大洲的集合，其大小为7；宇宙中所有行星的集合，其大小为9；从1到15的所有素数集合 ${1, 2, 3, 5, 7, 11, 13}$ ，其大小为7；介于1和6之间且和为5的整数二元组集合 ${(1, 4), (2, 3), (3, 2), (4, 1)}$ ，其大小为4。
然而，也存在无限（即非有限）大小的集合。例子包括所有素数的集合 ${1, 2, 3, 5, 7, 11, 13, 17, \dots}$ ，以及实数轴上介于0和1之间的所有点的集合，称为0到1之间的区间。如果一个集合 $A$ 拥有的元素个数与整数 $1, 2, 3, 4, \dots$ 一样多（这意味着可以在 $A$ 的元素与所有整数的集合 ${1, 2, 3, \dots}$ 的元素之间建立一一对应关系），则称 $A$ 是可数无限的。偶数集合 ${2, 4, 6, 8 \dots}$ 包含可数无限个元素，奇数集合 ${1, 3, 5, \dots}$ 和素数集合也是如此。一个既非有限也非可数无限的集合被称为不可数无限的。实数轴上的一个区间，比如0到1之间的区间，包含不可数无限个元素。 ↩︎