当样本空间有限,试验中每个基本事件发生的可能性相同的时候,称为古典概型。这时可以(也是一般用到的)取样本空间的所有的子集作为事件。然而,当样本空间不是有限的时候,特别是当样本空间是实数的时候,就不能取所有的子集作为事件了。其中的根本原因在于概率的定义。一般来说,当研究一个随机事件的时候,我们希望知道它发生的概率。事件发生的概率是一个介于0和1之间的数。当样本空间是不可数的时候,如果我们取样本空间所有的子集,那么概率论的公理系统会产生数学上的矛盾,也就是说,会有一些子集无法被定义概率。具体地说,概率论的公理系统是由三个部分
(
Σ
,
F
,
P
)
{\displaystyle (\Sigma ,{\mathcal {F}},\mathbb {P} )}
组成的,又称为概率空间。这个空间包括:样本空间
Σ
{\displaystyle \Sigma }
、事件集合
F
{\displaystyle {\mathcal {F}}}
(又称为事件体)以及定义在这上面的一个取概率的运算:
P
{\displaystyle \mathbb {P} }
。其中的事件集合
F
{\displaystyle {\mathcal {F}}}
是一个σ-代数,而取概率的运算
P
{\displaystyle \mathbb {P} }
需要满足概率的加法公理(σ-Additive):
如果一系列事件
A
1
,
A
2
,
⋯
{\displaystyle A_{1},A_{2},\cdots }
两两互斥(也就是说对任意的
i
,
j
{\displaystyle i,j}
,
A
i
∩
A
j
{\displaystyle A_{i}\cap A_{j}}
都是空集。此亦称为pairwise disjoint)那么就有:
P
(
⋃
i
=
1
∞
A
i
)
=
∑
i
=
1
∞
P
(
A
i
)
{\displaystyle \mathbb {P} (\bigcup _{i=1}^{\infty }A_{i})=\sum _{i=1}^{\infty }\mathbb {P} (A_{i})}
这个公理是符合一般人的直觉的:如果几件事情互相之间相互排斥,那么“它们几个中有一个发生”的概率应该等于其中每一个发生的概率的和。
然而,对于不可数的样本空间,如果选全部的子集作为事件的话,会有一些子集,无论怎样为他们定义概率,都会违反加法公理。[1]
一个反例
编辑
假设小明和小华玩一个游戏,让小华随意说一个0到1之间的实数。小明为了研究概率,选择了所有[0,1]的子集作为概率集合。他将所有的0到1之间的有理数取出来。由于0到1之间的有理数是可数集合,所以可以做标号:
q
1
,
q
2
,
⋯
{\displaystyle q_{1},q_{2},\cdots }
。对于每一个0到1之间的实数
a
{\displaystyle a}
,小明将
a
+
q
1
,
a
+
q
2
,
⋯
{\displaystyle a+q_{1},a+q_{2},\cdots }
作为一个集合,如果其中有大于1的,就减去1。这个集合是由可数个数构成的,小明把它记作
S
a
{\displaystyle S_{a}}
。构造多个这样的集合
S
a
{\displaystyle S_{a}}
满足其并集是区间[0,1],且它们之间两两不相交。然后将每个
S
a
{\displaystyle S_{a}}
写成:
S
a
=
s
a
,
1
,
s
a
,
2
,
⋯
{\displaystyle S_{a}=s_{a,1},s_{a,2},\cdots }
再令:
T
1
=
{\displaystyle T_{1}=}
遍历所有
S
a
{\displaystyle S_{a}}
集合中的
s
a
,
1
{\displaystyle s_{a,1}}
所构成的集合。
T
2
=
{\displaystyle T_{2}=}
遍历所有
S
a
{\displaystyle S_{a}}
集合中的
s
a
,
2
{\displaystyle s_{a,2}}
所构成的集合。
如此等等,
那么所得到的事件(也就是集合)
T
1
,
T
2
,
⋯
{\displaystyle T_{1},T_{2},\cdots }
的并集也是区间[0,1],而且它们之间两两不相交。由于这些事件之间地位相等,所以它们的概率
P
(
T
n
)
{\displaystyle \mathbb {P} (T_{n})}
都是一样的。
如果
P
(
T
n
)
>
0
{\displaystyle \mathbb {P} (T_{n})>0}
,那么根据加法原则,
1
=
P
(
[
0
,
1
]
)
=
P
(
⋃
i
=
1
∞
T
i
)
=
∑
i
=
1
∞
P
(
T
i
)
=
∑
i
=
1
∞
P
(
T
1
)
=
+
∞
{\displaystyle 1=\mathbb {P} ([0,1])=\mathbb {P} (\bigcup _{i=1}^{\infty }T_{i})=\sum _{i=1}^{\infty }\mathbb {P} (T_{i})=\sum _{i=1}^{\infty }\mathbb {P} (T_{1})=+\infty }
而如果
P
(
T
n
)
=
0
{\displaystyle \mathbb {P} (T_{n})=0}
,那么根据加法原则,仍然有:
1
=
P
(
[
0
,
1
]
)
=
P
(
⋃
i
=
1
∞
T
i
)
=
∑
i
=
1
∞
P
(
T
i
)
=
0
+
0
+
⋯
=
0
{\displaystyle 1=\mathbb {P} ([0,1])=\mathbb {P} (\bigcup _{i=1}^{\infty }T_{i})=\sum _{i=1}^{\infty }\mathbb {P} (T_{i})=0+0+\cdots =0}
因此无论如何,都会导致矛盾。也就是说小明无法为事件
T
1
{\displaystyle T_{1}}
定出一个概率。在一般的测度理论中,这种集合称为(勒贝格)不可测集合。[2]