第三篇 关于偶然的学说[26]
3个月前 作者: 皮尔士
一
人们普遍认为,科学最初是通过量化才变得精确,而精确科学(exact sciences)则首推数学。化学家一开始的推理并不明确,直到拉瓦锡展示了如何用平衡的概念来检验各种化学理论,于是化学一下子变成了精确无疑的科学的一个典范,所以我们经常把它与光学、热学、电学等等量齐观。然而,后几门学科主要是对普遍法则的研究,而化学则仅限于研究某一类物质的关系与类别。所以,化学实际与植物分类学、动物学属于一类。不过,与这些学科相比,我们可以明显发现化学从量化处理中获得的优势。
就算是最简单的量化标准,比如矿物学家用来区分硬度的标准等,都有一定的作用。单单是计算出雌蕊和雄蕊的数量,这种简单的方式就足以让植物学脱离混乱的状态。不过,数学处理方法的优势更多地来自测量而非计数,更多的来自连续的量而非离散的数。数字只不过在我们的思维中建立了一个准确的量,虽然有一定的好处,但极少能发展成崇高的思想,更多地是化成了一些平淡无奇的东西。培根所说的两个派别,一个注重差异,一个注重共性,对数字的使用可能只对数字较少的一方有所帮助,而对其过分使用又会导致思想变得狭隘。但不管通过何种方式追求精确,“持续的量”这个概念都有很大的用处。它本身就是最精细的归纳工具,绝无放大差异之虞。若一位博物学家要研究某一物种,他会搜集许多类似的标本。经过仔细的观察后,他会发现其中一些在某个方面有相似之处。例如,它们可能都有一个S形的标记。他发现,这些标本并不是完全相似,比如它们的S形标记可能形状并不是完全相同。不过,由于这些差异我们可能会发现,这些标本的任意两个之间都存在某种模式,在它们之间建立联系。然后他发现其他的模式可能差异非常明显,例如有的标记可能是C形的。问题是,他是否可以找到在这个标记和其他标记类型之间建立联系的中间项。在某些情况下,有些起初他觉得不太可能实现的,但最终却是成功的;而有些起初觉得可能的,最终却没有找到。这样,他从自然的研究中就问题的特征建立了一个新的概念。例如,他获得了这样的观点:一片叶子中包含花朵的各个部分,椎骨中包含头骨。我也不必解释其中的逻辑动机。这就是博物学方法的精髓[27]。用这样的方法,他先后得出不同特点,最终得出某个动物种群的概念。一个种群中个体的差异无论有多大,都有一定的局限,这里我们也不会再多涉及。随后我们也会讨论完整的分类方法,但是目前我只想指出,博物学观念的构成是通过持续性的观点或者模式之间的过渡来实现的。目前,博物学家是伟大的观念构建者,这一点是其他科学领域望尘莫及的,我们也必须在逻辑学中师从他们。“连续性”这一概念能够极大地帮助形成真实的、合理的观念,这一点也是随处可见的。通过这种方法,我们可以将巨大的差异分解开来,在不同程度的基础上加以解决。不断采用这种方法对于观念的扩展有着很大的价值。我建议大家好好利用这一观点,至于那些因为对其忽略而产生的谬论,已经对哲学产生了很大危害,所以我们应该对其进行更进一步的研究。当下,我希望所有读者都能对该观念的使用加以注意。
在数字研究方面,连续性是须臾不可或缺的。就算是在不存在连续性的地方,人们也在不断地引入这个概念。例如,美国平均每平方英里人口数为10.7人,纽约每栋房屋的住户人数为14.72人[28]。另一个例子是凯特勒(Quetelet)、高尔顿(Galton)成功地将误差分布用于生物学与社会学的研究。将连续性用于实际上不存在持续性的实例中,也说明了另一个方面的问题,这里需要单独加以说明——虚构有时候也在科学中有着重要的作用。
二
概率论就是量化的逻辑学。对任何前提而言,概率都有两种必然的情况,即真实的必然情况与虚假的必然情况。在积分演算中,数字1和0就代表着知识的两个极端。我们大致可以这样说,两者之间的数字代表着证据倾向哪一端的程度。一般来看,概率论的问题就是,根据给定的事态,量化地确定某一事实发生的可能性。这就相当于在证明或证否一个事实上,某个事态的价值有多大。于是,概率的问题也就归约成了逻辑学的普遍问题。
概率是一个连续的量,所以用这种方法来研究逻辑学是有很大好处的。有些学者的研究表示,通过概率微积分的方法,每一个可靠的推理都可以根据有限范围内的数字,通过合理的算术运算来表示。如果这一点属实,那么逻辑学的主要问题,即对某一事实的观察如何给予我们另一无关事实的知识,就简化成了算术的问题。这样看来,在对这个悖论进行更深层次的解读之前,最好了解一下这个观点。
不过,概率论的学者在这一方面并未达成共识。在我看来,它应该是数学所有分支中最容易得出错误结论的一个。在基础几何中</a>,推理往往会得到看似荒谬的结果,但基本不会有错误的结论。也许我们会问,是否存在具有广泛性的概率学专著,其中不存在错误的结论。这种探问部分源自对常规方法的需求。由于这一课题中含有太多微妙的东西,因此没有这类方法的帮助,很难把其中的问题简单地进行公式化解决。然而在此之外,微积分的基本原则多多少少地存在着一些争论。对于实用导向的问题,可疑之处相对较少。然而,将微积分扩展到其他领域的工作尚未取得共识。
要想克服上面所说的最后一个难题,唯一的方法就是在脑海中对概率形成清晰的观点,方法详见上篇文章。
三
若想就概率形成清晰的观点,我们需要考虑不同程度的概率之间真实的、可感知的差别。
毫无疑问,概率只对某些推理特别有用。洛克(Locke)对此是这样解释的:“注意到这一点之后,一位数学家肯定地认为,三角形中三个内角之和等于两个直角之和,这是因为他掌握了几何证据。”他又表示:“但是有另一个人,他从未付出任何努力进行观察和证明,他只是听到一位著名数学家的言论,表示三角形中三个内角之和等于两个直角之和,于是他也表示赞成这一观点,即作为一个正确的观点加以接受。在这个实例中,他表示赞同的基础是该事件的概率,其证据很大程度上会是正确的。接受这个证据的人,通常不会提出任何反对的或是在他所掌握知识之外的主张,尤其是在这种情况下。”洛克的《人类理解论》(An Essay Concerning Human Understanding)中包括许多类似的段落,这些段落完成了最初几个步骤的深层次分析,但并未做进一步的发展。本文集的第一篇说明,推理是否有效与人们是否倾向于接受它无关,无论这种倾向有多么强烈。然而,普遍的事实是,如果论证的领域为真实的,则与之相关的结论也为真实的。值得注意的是,从逻辑学看来,任何一个论证都不能被孤立地来看,而是要放到由同样的方法构建起来的论证“类”中来看,也就是若前提为真结论也必然为真的论证。一个论证如果是演绎的,那么它就永远为真;如果是或然的,那么就是在大多数情况下为真。如洛克所说,或然性的论证“大部分为真理”。
根据这一说法,不同概率程度之间真实的、可感知的差异就是,在对两种不同推理模式的经常性运用中可以发现,某一程度比另一程度更经常地具有真实性,这也就是区别的意义所在。很明显,这是事实中唯一存在的差别。在某些前提下,一个人得出了某个结论,只从推论本身出发,唯一有意义的问题就是结论是否为真,存在与不存在之间是否存在某种中间项。巴门尼德(Parmenides)曾说:“只有存在是存在的,而非存在是完全不存在的。”这一观点与我们上一篇文章对“真实”这个概念的分析完全一致。我们发现,真实与虚幻之间的差别在于,充分的研究是否会让某个观点被普遍接受,而其他观点均遭拒绝。这一预想关乎现实和虚幻的概念,需要将二者完全分离。这也属于人类思想中非黑即白、非天堂即地狱之类的问题。然而,长远看来,概率论的观点还以某种固定比率与某个事实对应,给定的某种推理模式有时有效,有时则不然。我们接连不断地进行某种类型的推理,在最初的十几个或几百个实例中,成功的比率可能有着极大的波动性。但是,如果有成千上万个案例,波动就变得越来越小了。只要我们能够尽量将推理持续下去,这个比率就会愈发贴近某个固定的限值。因此,我们也许就可以通过实例的比例来对某种概率进行定义。
从前提A到结论B的推理依赖于相应的主导原则。如果A中的某个事实是真实的,则B中的事实也是真实的。这种概率由某种分数组成,分子是A、B均成立的次数,分母是A成立的次数(B不考虑)。就算不称其为推理概率,我们将其称为“在A发生的情况下B也发生”的概率是不会有人提出异议的。而对于B的概率,条件里没有给出,在这里也就没有意义。的确,当条件真正的含义十分明显的时候,我们也容许省略的情况。但是我们应该尽量避免这样的习惯(该习惯是非常普遍的),因为这样会导致思考的模糊。就像某种带来因果关系的行为要么决定某事件的发生,要么决定它不发生,或者是让它要么更轻易地发生,要么轻易地不发生,从而于发生[29]这个概念产生某种内在概率。我认为很清楚的一点是,在概率论的运用中出现的那些最糟糕的、最持久的错误都是源自这个表达[30]的恶性循环。
四
不过,还有一个关键的问题需要澄清。根据我们的讨论,概率的观点从本质上看属于一种可以无限期重复的推理。就单独的某次推论而言,要么全对,要么全错,无所谓概率。单次实例没有概率可言。如果一个人要在有25张红色卡片和1张黑色卡片的一叠卡片中抽取卡片,或是从有25张黑色卡片和1张红色卡片中抽取卡片,且如果抽到红色,他就会获得幸福,而抽到黑色则代表不幸,那么他当然应该从红色卡片较多的一叠中抽取。不过,因为不能重复,所以依然存在着风险。这一点与我们之前谈过的概率论是很难调和的。然而,就算他选择了红色多的那一叠,最后还是抽到了黑色,又该如何宽慰他呢?他也许会说,自己完全是按理行事,但是在他身上,道理仿佛还是成了无用的东西。而就算他抽到了红色,也许还是会当成一次幸运的意外。倒不是说如果他从另一叠中抽取,他就会抽到黑色,因为“如果A,那么B”这种前提对于单个实例来说是没有意义的。真理在于真实的前提所对应的事实。与“如果A,那么B”这个前提对应的事实也许是“只要A发生,B就会发生”,但是在我们的虚构实例中,只考虑这个人的话是没有可比性的,“他如果从另一叠中抽取,就会抽到黑色卡片”这种说法就没有依据。的确,有效的推理离不开真实的前提,如果前提属实,结论也就属实。唯一与这种前提对应的事实是:只要前件A为真,则后件B也为真。就此而论,从个别实例中进行推理是没有意义的。
这些想法的出现首先是为了排除上述的难点。然而,穷举是做不到的。比方说,如果我们试验一千次,然后把成功和失败的比例得出来,那么这很有可能就是大概率的结果。但是,如前所述,这不过是说:概率的结果迟早会显示出来而已。
在人的一生中,或然事件的数量、可能的推理数量是无穷的,于是人无法完全肯定最后的结果会与概率一致。那么,即便我们把所有已经发生的或然事件都考虑进来,他也不能肯定一定不会失败,而他的境况与之前相比也不会有什么质的变化,最多是量的变化。概率论中毋庸置疑的一点是久赌必输。就算他采用了鞅的方法(有些人觉得这种方法是不会出错的),而据我所知,这种方法通常不允许在赌场中使用。在这种情况下,他首先赌1美元,如果输了就要赌2美元,再输了就是4美元,然后是8美元。之后他如果赢了,就一共输了1+2+4=7,赢了1美元。他无论输了多少,只要赢了一次,就会比最初的时候多得1美元。用这种方法,他一开始也许会赢,但是最后总会有用尽运气的时候,没有钱再抵押,于是不得不放弃所有的赌注。可能还没等到赢得足够的钱,他就开始输了,然后变得比开始的时候还要穷。这个情形是一定会发生的,不过是早晚而已。的确,不管赌注有多大,只要银行付得起,他总是有机会赢到手的。但是,这会导致一个著名的悖论:尽管他最后一定会失败,根据通常规则(这种规则没有考虑他必然会输的情况)看,他预期能获得的价值仍然是很大的。然而,不管这个赌博者使用这种方法还是其他方法,可以肯定的是,只要他持续的时间够长,失败就一定会出现,之前赢到的全部也就付诸东流。
对于保险公司来说也是同样的情况。他们会努力规避所有的重大灾难,但精算师依然会告知主管,根据概率论,损失总会发生。他们可以借助一些巧妙的手段平安渡过危机,但是之后他们的起点会比之前更为薄弱,然后很快损失会再次发生。精算师也许更倾向于否认这一点,因为他知道,自己供职的公司期望值很高,或者说(忽略利率)可能是无限的。然而对于期望值的计算可能不会考虑我们上述提到的忧虑之处,因为它很可能带来极大的反转结果。不过,我并不是说保险在这一方面与其他业务相比就具有了很大的缺陷。所有的人类活动都与概率有关,类似的事实也随处可见。如果人可以长生不老,那么一定会有一天,所有的信念都变成背叛,让人深陷无望的痛苦之中。和财富消失、朝代瓦解、文明陨落一样,曾经的辉煌只会变成今天的幻灭。为了避免这种情况的发生,我们就有了死亡。
但是如果没有死亡,活着的人身上会发生什么呢?无论如何,死亡一定会发生在部分人的身上。同时,死亡也让或然事件、或然推理有了一定的限度,让平均数实际上变得不可知。概率和或然性推理建立在数量无穷大的基础上。于是我们遭遇了和过去一样的难题,难以找到解决的办法。在我看来,似乎我们都受到了这种观点的驱使,即逻辑无情地要求我们不能把兴趣局限在自己身上,而要扩展到所属的群体;甚至也不能局限在群体上,而要扩展到一切我们能够直接或间接地发生思想关联的事物上。我们的视线必须超出当前的地质时期,要越过一切界限,不管我们的视线多么模糊。我认为,一个人如果不能为了世界的利益而牺牲自己,他就不是一个懂逻辑的人。逻辑是扎根于社会原则中的。
一个讲究逻辑的人不可以是自私的。他不像别人想象的那般自私。有意地实践自己的愿望并非自私。守财奴并不是自私,他的钱财并不会给他带来任何好处,他在乎的是自己死后这些钱会带来什么。我们总是在谈我们在太平洋上的产业领地,谈论我们这个国家的命运,从不谈及个人利益,显得我们把视野放得更加远大。我们也会焦虑地讨论,几百年后煤炭资源很可能耗尽,上亿年后太阳可能也失去了光辉。许多宗教信条中也都离不开舍生取义、为救赎他人而下地狱的佳话。
就逻辑学而言,一个人做出自我牺牲的英雄壮举,未必需要这种做法符合逻辑,而只需要他认识到这种壮举具有可能性。他只要能参照这个标准看待自己的推理,这一推理就可以被视为具有逻辑的思想。
这种方式让逻辑性变得简单易懂。有些时候,我们可以在自己身上实现英雄主义。一个冒着危险爬上墙壁的士兵一定知道他很可能会被子弹击中,但他并不在乎。他也知道,如果自己所在的队伍一起冲锋进攻,也许就会拿下这个要塞。我们之前例子中那个抽牌的人,他如果不懂逻辑,却从红色多的那一叠中抽取,这也许仅仅只是一种习惯。他如果懂得逻辑,而关心的仅仅是自身的命运,那么也不能被看作一个讲究逻辑的人。他如果考虑了所有可能的状况,看待每一种情况都不会有偏心,他才能以逻辑的方法行事,从红色的那一叠中抽取卡片。因此,尽管逻辑学家不一定能完成英雄壮举,但是为了坚持逻辑,也会去模拟这种勇气带来的效果。
然而,所有这些都需要我们对个体的利益与无限集体的利益有所认同和了解。当前,认为人类或任何高等智慧的种族会永存,这种想法是无理可循的,后面我们也会对这一点加以讨论。而从另一方面来看,我们也找不到反对的理由[31]。幸运的是,根据总体的要求,我们应该持有某种观点或感情,也没有什么事实可以阻止我们怀有某种希望,那种平静愉悦的希望,希望这个群体可以一直存在下去,不受任何规定日期的制约。
我提出将无限群体的利益、认同这种利益至高无上的可能、对思想活动无限延续的希望这三个方面作为逻辑不可或缺的要求,可能有些奇怪。然而,我们不妨想一想,逻辑依赖于摆脱疑惑的努力,而在行动无法进行时,情感便会开始发挥力量。此外,我们之所以要依靠推理来摆脱疑惑,唯一的原因是其他方法不符合我们与他人交往的冲动。那么,在推理中发现社会的根源又有什么好奇怪的呢?对于我认为必要的另外两种观点,它们仅作为支持和附属品存在。让我觉得有趣的是,这三种观点似乎与“信、望、爱”十分相似。圣保罗认为,这三个要素是最伟大、最高尚的思想天赋。《旧约》和《新约》都不能被看作逻辑学的教科书,但显然后者在评判人的天性禀赋方面具有较高的权威。
五
我将这样的平均数字——例如每平方英里的居民数、每周的死亡人数、每个刑事案件的定罪数,或者用更一般的说法,每个y的x——称为“相对数”(rtive numbers)。此处的x是一类事物,它们与另一类事物,也就是这些x的y,存在着关联。我将x称为“相关群体”(rte),而将y称为“相关项目”(corrte)。
概率是一个相对的数字,也就是在某一类事物中另一类事物成立的比率。从这一点可以轻易地得出计算概率的规则。由于这些规则非常简单,我们可以在此进行罗列。有时,掌握一些基础的计算法则是很有用的。
规则1:直接计算——直接计算任何相对数字,例如有轨电车旅程中的平均乘客数等。我们要通过以下方法进行计算。
数出每次旅程中的乘客数目,将这些数目相加,再除以旅途次数。有些情况下,我们也可以简化这个规则。假设我们想知道纽约某住所中的住户人数。一个人不可能同时居住在两处住所中;如果他有两处住宅,则在每一处都算半个住户。在这种情况下,我们只需要用纽约所有居民人数除以他们的住宅数即可,不需要分别去数清每所住宅中的人数。如果每个“相关群体”中的个体只能拥有最多一个“相关项目”,那就都可以采取类似的方法。我们如果需要知道每个y中x的个数,且没有x同时属于两个或两个以上的y,那么用y中所有x的数量除以y的数量即可。如果用这种方法去计算每次有轨电车旅程中平均乘客的数量,那就肯定是无效的。我们不能用总乘客数除以旅程数,因为有很多乘客可能会往返多次。
要从给定前提类别A和结论B中计算概率,只需要确定前提正确和结论正确的比例,也就是只要用A和B同时发生的次数除以A事件发生的次数即可。
规律2:相对数之和——若两个相对数字有着相同的关联群体,例如求每个y中x的数量和每个y中z的数量,我们需要统计每个y中x和z的总数。如果没有x和z属于同一个y的情况,则这两个数字之和就是所需答案。例如,假设我们已知一个人平均有多少个朋友以及平均有多少个敌人,则二者之和就是对一个人有利害关系之人的数量。而从另一种情况来说,如果将体质虚弱的人数与超过兵役年龄的人数相加,以获得享受兵役豁免的平均人数,这是不可行的,因为有许多人同时享受两次或更多次的豁免。
这个规则直接适用的概率是,两个不同的且相互独立存在的事件有可能在同样的一系列情况下发生。例如,已知“如果A那么B”的概率以及“如果A那么C”的概率,则两种概率之和是“如果A那么B或C”的概率,只要没有同时属于B和C的事件即可。
规则3:相对数之积——假设我们已知每个y中x的相对数字,以及每个y的x中z的相对数字;或者举个更加准确的例子,假设我们首先已知纽约家庭中孩子的平均数量,之后我们又知道了一个纽约儿童牙齿的平均个数,于是通过这两个数字,我们可以得出一个纽约家庭中孩子牙齿的平均总数。然而,这种方式有两个限制条件:第一,如果同一个孩子同时属于不同家庭,那么结果就不准确了,因为这样的孩子牙齿数量也许会格外多或格外少,从而影响一个家庭中孩子的牙齿平均数量。这种影响要大于对每个孩子平均牙齿数量的影响。第二,如果不同的孩子可以共用牙齿,这种计算也不属实。在这种情况下,单个家庭孩子牙齿的平均总数会与一个孩子牙齿的平均数量有很大差异。
使用这种概率法则,我们必须根据以下条件进行:假设我们已知前提A带来结论B的概率,B与A代表某种类型的前提,我们还已知以B为前提的推论的概率,以及结论C的前提,这就是所需的信息。首先,我们有了每个A中B的相对数量,之后我们也有了每个B中C的相对数量。然而,这两类前提是经过挑选的,所以C在B中的总体概率与C可以从A中推导出的B的概率一致。两种概率可以相乘,来给出C在A中的概率。加法中的限制条件依然存在。从A类事件几种不同命题下会得到B类事件命题,也有可能B从A中得出的概率会受到B类事件命题的影响。但是,从实际的角度看,这些限制条件几乎不会带来什么后果,并且人们普遍认为存在一条通用的概率原则,即“如果A那么B”的概率乘以“如果B那么C”的概率,得出的就是“如果A那么C”的概率。
概率乘法能发挥很大的作用,但还有一条辅助的规则。这条规则并非举世通用,而且用时必须非常谨慎,有两方面需要注意。首先,涉及重大失误时不要使用。其次,如果有机会可以使用的话,不要错过。该规则基于以下事实:“如果C为真则B为真”的概率与“如果C为真则A为真”的概率大体一致。举个例子,假设我们现在知道纽约每年出生的男童平均数量,又知道纽约每年冬季出生的男女童平均数量,我们就可以推断,这至少是一个很近似的命题(对于概率学来说没有完美的估算),即在纽约出生的男童比例与在纽约夏季出生的男童比例相同。因此,如果将一年之内出生的所有孩子的名字放入一个罐子中进行抽取,我们可以将抽中男童名字的概率和抽中夏季出生的男女童名字的概率相乘,就可以知道抽中夏季出生的男童的概率为多少。在许多论述此问题的相关论文中,这样的概率问题通常与抽签游戏和纸牌游戏等联系起来。在这些情形下,“事件独立性”的概念非常简单,也就是在假设A和假设B的前提下,C发生的概率相同。但是,概率在解决日常生活的问题时,有一个很值得我们思考的问题,即两个事件是否可以有足够的证据被认为是独立的。在纸牌游戏中,为了保证牌之间没有关联,牌一定要洗开。然而,实际情况是,牌很少有完全洗开的时候。因此,在惠斯特纸牌游戏中,一共有四种花色,同花色的牌可能还是会排在一起,哪怕已经洗过牌了。或者说,至少有一些牌没洗开的痕迹。比如,所谓“短套花色”[32]的数量比正确估算的要少,也就是说,由于洗牌分牌不均导致“长套花色”数量增加。所以,当一副烂牌被充分洗过时,我们通常就会说下一把会有很多“短套花色”了。几年前,我有一个很喜欢玩惠斯特纸牌的朋友,他曾经计算过在165手牌中他被发到黑桃的数量。在这一样本中,洗牌彻底程度肯定至少超出了平均水平。最后根据计算,我朋友本应拿到3张或4张黑桃的数量为85手,但实际上他拿到了94手,这个例子说明了洗牌不彻底的影响。
以上就是概率计算的全部基本原则了。但还有一个原则是从人们对概率的不同理解中衍生出来的,这在一些论文中也提到过,如果最后被合理论证的话,那么很有可能成为一个推理理论的基础。虽然我个人认为这很荒谬,但对此进行的思考却有可能把我们带向真理。正是由于讨论这个话题的缘故,我才在学习科学逻辑之初就提前向读者介绍了概率理论。