2. 概率和检验的严格性
3个月前 作者: 卡尔·波普尔
我们的检验的严格性能够客观地加以比较;如果我们愿意的话,我们也可对它们的严格性规定一个尺度。
在这个限定以及本附录后面的讨论中,我将在概率演算的意义上利用概率的思想;或者更确切地说,利用相对概率的思想:
p(x,y),
它读做“对于给定的y,x的概率”。绝对概率的思想:
p(x),
它读做“x的绝对概率”,这里将用相对概率来加以定义,它的显定义是
p(a,b)=p(a,c))。
这里“(a)”是“对于每一个a”的缩写;“(Ea)”是“存在着一个a”的缩写;“”是“当且仅当”的缩写;“…………”是“如果……那么……”的缩写。(后面我们还要用“&”作为“和”的缩写。)为了直观地解释D(AP),我们可以选择c的否定作为d。
相对概率p(x、y)的思想这里像在D(AP)中一样,将主要用作定义者。它本身又可用一个公理系统隐含地定义,就像在我的《科学发现的逻辑》(新的附录*Ⅳ和*Ⅴ)中一样。那里给出的六条公理可以简并为三条,其中的一条A是一条存在公理,另外两条B和C是(“创造性的”(5))定义形式的公理:
A
(Ea)(Eb)p(a,b)≠p(b,b)
就是说,至少存在两种不同的概率。
公理B用p(x,y)定义乘积ab(读做“a和b”)。
公理C用p(x,y)定义补-a(读做“非a”)。
对这三条公理,我们还可以添加三条(非创造性的或普通的)定义:上面用D(AP)定义的绝对概率p(a)的定义;布尔恒等式a=b的定义;和相对于b的n项的独立的定义。
恒等式定义如下:
我们认为如果所谓(相对于b的)“特殊乘法定理”适用于An集的2n-1个非空子集中的每一项,那么一个n个元素的集成n项的序列An=a1,…,an,是“n项独立的(相对于b)”。令ai,…,am为任何这种子集(或子序列)的元素;那么,如果An是n项独立的,则我们有
(m) p(ai…am,b)=p(ai,b)·p(ai+1,b)…p(am,b)式中右边是m-i概率的乘积。在这些2n-1方程中,对应于An的2n-1非空子集,将存在n个无足轻重的方程(对于单元子集),因为对于m=i,我们的方程(m)退化为
(i)
p(ai,b)=p(ai,b);
这就是说,每一单个元素不过是1项独立的(相对于每一个b)。因此,An的n项独立乃由2n-n-1个重要的方程定义。(6)
这个运用2n-n-1个方程的有点笨拙的定义可加以简化,为此引入“Indpn(a1,…,an;b)”的一个递归定义,它读做“a1,…,an是n项独立的(相对于b)”:
D(Indp) (i)Indp1(a1;b),对于我们可能选择的任意的元素a1和b。
(ii)Indpn+1(a1,…,an+1;b),当且仅当
(a)Indpn(a1,…,an;b);
(b)Indpn(a1,…,an;(an+1b));
(c)p(ai,(an+1b))=p(ai,b),对于每一个元素ai(1≤i≤n)。
这里我们可以用
(b′)p(an+1,aj…amb)=p(an+1,b,)其中aj…am(对于j≤m≤n)是An的任何子集的元素的合取,
取代(b)和(c)。
这些定义可以加强:对于一个无穷的理论,在最后的括号前,例如在(c)中插入一个仅仅在假设p(ai,b)≠0之下从(c)推出的方程
“&p(an+1,ai,b)=p(an+1,b)”,
可能是合适的。
现在,我们可以转到检验的严格性的定义上了。
设h是有待检验的假说;设e是检验陈述</a>(证据),b是“背景知识”,也即我们在检验该理论时认为(暂时地)没有问题的那一切东西。(b也可以包含初始条件性的陈述。)让我们先假定,e是h和b的一个逻辑推论(这个假定后面将要放宽),这样p(e,hb)=1。例如,e可以是从牛顿的理论h和我们对火星过去位置的知识(构成b之一部分)推出的一个关于火星的一个预言位置的陈述。
于是,我们可以说,如果我们把e作为h的一个检验,那么,在只给出b(没有h)时,e越不可几,解释为支持证据的这检验的严格性就越高;也就是说,对于给定的b的e的概率p(e,b)就越小。
定义检验e对于给定b的严格性S(e,b),主要有两种方法。(7)两者都从内容度量C t出发。第一种方法把概率的补作为内容的度量Ct:
(1)
Ct(a)=1-p(a);
第二种方法把概率的倒数作为内容的度量:
(2)
Ct′(a)=1/p(a)
第一种方法提出了一个像S(e,b)=1-p(e,b)这样的定义,或者更好地表达为
(3)
S(e,b)=(1-p(e,b))/(1+p(e,b))
就是说,它建议我们用C t度量检验的严格性,或者更好地用“正规化的”Ct(利用1/(1+p(e,b))作为一个正规化因子)来度量它。第二种方法提议我们只要用检验的内容Ct′来度量它的严格性:
(4)
S′(e,b)=Ct′(e,b)=1/p(e,b)。
现在我们来推广这些定义,为此我们放宽e应逻辑地从h和b推出这个要求,甚或放宽下列更弱的要求:
p(e,hb)=1
就是说我们现在假定存在某种概率,p(e,hb),它可能等于1,也可能不等于1。
这意味着,为了得到(3)和(4)的一个推广,我们在这两个公式中都用更一般的项“p(e,hb)”代替“1”。因此,我们得出了下面两个解释为理论h的支持证据的(对于给定的背景知识b)检验e的严格性的推广定义。
(5)S(e,h,b)=(p(e,hb)-p(e,b))/(p(e,hb)+p(e,b));
(6)
S′(e,h,b)=p(e,hb)/p(e,b)。
这些就是我们对作为支持证据的检验的严格性的度量。这两种度量之间没有选择余地,因为从一种到另一种的转移是保序的;(8)就是说,两者都是拓扑不变的。(如果我们用C t′和S′的对数(9)例如log2Ct″和log2S′代替Ct′和S′——以使这些度量成为加性的,情形同样如此。)
在定义了我们的检验的严格性的度量后,现在我们可以用同样的方法来定义理论h在b出现的条件下关于e的解释力E(h,e,b)(而且如果我们愿意的话,也可以类似方式定义h的确证度(10)):
(7)
E(h,e,b)=S(e,h,b);
(8)
E′(h,e,b)=S′(e,h,b)。
这些定义表明,对理论h的一次检验e越严格,理论h(关于某个被解释者e)的解释力就越大。
现在显而易见,一个理论的解释力的最大程度或者它的检验的严格性的最大程度乃取决于该理论的(信息的或经验的)内容。
因此,知识的进步或潜在增长的标准将是我们理论的信息内容或经验内容的增加;同时,是它们可检验性的增加,也是它们有关(已知的和未知的)现象的解释力的增加。