分享

概率真实存在吗?——它的概念、历史与意义

 嘟嘟7284 2025-04-02

引言

自然科学的知识大厦,为我们建立起对世界“确定性”的信念。比如,“力是物体运动状态改变的原因”及万有引力定律,让我们发现一切地星生命都在“坐地日行八万里,巡天遥看一千河”;再比如,“化学反应的实质是化学键的断裂与重新形成”及元素周期表,让点石成金、发酵发霉等物质变化有迹可循。

但是,走出科学知识的大厦,生活中又有如此多的现象给我们以“不确定”的感受:天气预报明天不下雨,是阴天,但不带伞会不会被淋?市场房价起起落落,现在买入/出手房子,能赚还是会赔?这些问题都有两种以上的可能结果,并非“确定性”情境下那么简单。怎么处理这类问题?

统计工作者说,我们需要【概率】。

那什么是“概率”?概率存在吗?为什么概率能解决这些问题?

一、概率是“理想化模型”

在19世纪巴黎天文台的穹顶之下,热力学家、数学家贝特朗(Joseph Louis Bertrand, 1822-1900)向世界抛出了他的问题:在单位圆内随机取弦,其长度超过√3的概率是多少?这个看似简单的概率问题,却因对弦的不同'随机'取法导出了1/2、1/3、1/4这三个“正确答案”,贝特朗“悖论”由此诞生——

解法一:在圆上随机取两个点为弦的端点,使弦对应的圆心角大于120°。其概率为1/3。

解法二:在任意一条半径上随机取一点为弦的中点,使弦长大于√3。其概率为1/2。

解法三:在圆内随机取点为弦的中点,使弦长大于√3。其概率为1/4。

图2:贝特朗问题示意图

这一“悖论”像一把锋利的手术刀,剖开了古典概率论直觉上的合理性,让人们开始以更严格的眼光重新审视概率:什么是“随机”?什么是“等可能”?同时,也让更深刻的哲学命题得以展现——概率究竟是世界的本真属性,还是人类认知构建的数学模型?

贝特朗悖论到底“悖”在何处?不难发现,“什么是随机”这一问题的产生,已经初步给出了回答:与刚体、电子云、点、线、面、实数系等类似,【概率】是一个理想化的模型。

无独有偶,样本空间、随机变量的概念出现,尤其是“零概率事件不意味着不发生”的结论,使概率的模型化特征更加清晰。

概率本是人类为处理不确定现象、定量刻画各种结果的可能性而形成的概念,其大小表示结果发生的可能性。在理想情况下,概率为0代表该结果没有可能,为1代表必然,从0到1表示可能性逐渐增大。

然而,在现代概率论中,概率为1并非必然事件,概率为0也并非不可能发生。例如:对于掷一枚质地均匀硬币的试验,可设

这是经典的二项分布,也符合我们掷硬币的常识。但应注意到,在该分布下,硬币掷出后立起来的概率为0 ——而这在现实中可能发生。实际上,掷硬币的结果既与硬币的材质相关,也与抛掷时的环境、地面、掷法等等相关。

图3:不确定的硬币

在这里,我们再次回到了怎样掷硬币才是“随机”的问题;同时发现,在数学化(概率论化)【掷硬币试验】的过程中,忽略了大量因素,甚至忽略了一些具有微小可能性的结果;显然,这就在建立模型

所谓模型,就是为突出现实事物的一定(或本质)特征而对其进行的简化表示,是认知目的与简洁性、代表性的辩证统一,是人类认识世界不可或缺的工具。由于忽略了次要因素以求简洁,模型既在某个方面简明地代表了事物,又必然与现实事物有偏差,即具有简明度和失真度,这是衡量模型优劣的核心指标。

若进一步考察“独立试验”、“均匀分布(等可能事件)”等概念,会发现这些也都建立在忽略次要因素、控制“无关”变量的基础上。

因此,在【概率是模型】这一科学哲学的视角下,概率是“不存在”的,是人为建构的认识,正如点、直线、平面并不实际存在一样。那么,为什么概率还能解决大量不确定性的问题?为什么概率这么有用?

这一问题的答案,蕴含在“概率”概念的发展历程中。

二、概率的“前世今生”

14-17世纪的欧洲,瘟疫肆虐。

在“牛顿奇迹年”的伦敦鼠疫大暴发前夕,商人、统计学家格兰特(John Graunt,1620-1674)为探究瘟疫、战争、饥荒等导致居民死亡的原因及其与人口变动的关系,在伦敦开展人口调查分析,并于1662年发表《关于死亡公报的自然观察和政治观察》(Natural and Political Observations Made upon the Bills of Mortality)。

在书中,他开创性地编制了世界上第一张统计寿命表,从中发现了诸多人口统计学规律。

比如,根据伦敦教会资料,在1629-1661年间,伦敦受洗(出生)人数中有139782名男性和130866名女性,他基于历年数据,推算出伦敦男女性别之比约为14:13。这是历史上首次通过具体的人口学统计资料证明得出男婴出生率高于女婴的结论(你没有看错,男女出生的概率统计不是1 : 1!)。同时,他发现男孩的夭折率高于女孩,结果适婚年龄段的男、女比例差不多刚好是一比一[1]。

值得注意的是,在那时,近代自然科学还在萌芽中。当时,鼠疫的暴发被广泛认为是由一组特定的行星排列散发出的某种恶臭气体导致病人吸入后,经人与人之间接触而传播,因此大多数医生习惯在治疗时把填满干花和有香味植物的长皮喙放在鼠疫患者鼻下。

图4:引发鼠疫的行星排列

格朗特对此很不赞同。通过对寿命表的细致分析,他发现在众多死因中慢性病、事故和自杀经常占有稳定的比率,而鼠疫等急性传染病和恶性疾病所导致的死亡率波动却很大。因此,对比鼠疫死亡率的不规律性同慢性病死亡率的规律性,表明鼠疫极可能与环境因素有关。正是这一结论,推翻了当时对鼠疫公认已久的看法[2]。

更为重要的是,书中以鼠疫病因推断为代表的诸多案例分析,体现出明显的统计推断思想和“大数”思想。正是这些,奠定了格兰特“人口统计学之父”的历史地位。

他在书中写到,“我相信,几个全年人口公报是确定人口数最简便的办法”,“为了提出一个要在许多年中形成的规律,需要进行多次地观察”。在那个瘟疫、战乱伴随着文艺复兴的时代,他继承了培根(Francis Bacon, 1561—1626)科学归纳-假设检验的经验主义思想,形成“数据归约”思想,强调要把庞大、杂乱无章的数据逐一分类并整理成简明清晰的表格,从而突显出有价值的信息,从自然现象和社会现象中探索一系列统计规律。之后,这一系列思想萌芽演变为了统计学的基本原理和方法,如大数定律。

幽默地说,格兰特“不相信牧师们的解释,只相信数字和事实”。这本著作不仅标志着人口统计学的开端,也是生物统计学思想的萌芽,是欧洲封建时代从“占卜观星”治病走向以数据分析、假设检验的科学方法确定病因的节点之一,是人类文明从上帝世界走向科学宇宙的历史进程中的重要一环。

在这一进程中,“大数法则”揭示的统计规律性——频率具有“稳定性”——直接与笛卡尔“自然法则恒定”的机械论世界观相呼应,统计推断思想(尤其是贝叶斯定理)蕴含的归纳-演绎法,也与实践认识论揭示的人对自然现象及其规律的认识发展过程相呼应。

为什么频率会具有稳定性?如何定量刻画频率的稳定性?

这个问题,困扰了科学家几百年。对它的哲学和数学探寻,导致了“概率”概念产生。

纵览对赌博的早期研究和古典概率论的创立[3],最早是意大利医生、占星学家(和资深赌徒)卡尔达诺(Girolamo Cardano, 1501-1576)撰写《游戏机遇的学说》,研究如何在掷骰子赌博中不输。一个世纪后,法国贵族公子哥德·梅尔(Chevalier de Méré)向帕斯卡(Blaise Pascal, 1623-1662)提出一系列赌博问题(比如他发现,将一枚骰子连掷四次至少出现一个六点的机会比同时将两枚骰子掷24次至少出现一次双六的机会多,但给不出合理解释),使得帕斯卡与费马多次通信讨论“赌本分配问题”,与惠更斯同时期形成“期望”概念。

五十多年后,伯努利的《猜度术》发表,大数定律第一次被严格论述。又过了五十年,贝叶斯的《论机会学说问题的求解》发表,系统阐述了贝叶斯公式及贝叶斯定理。十九世纪初,拉普拉斯《概率的分析理论》发表,古典概率论走向成熟[4]。

图5:《关于概率的哲学随笔》封面

容易看出,古典概率的概念,正是一个个“资深赌徒”先以大量经验为基础提出了问题,经过数学家把问题数学化并运用组合数学来分析解决的过程中诞生的。促使卡尔达诺、德·梅尔思考赌博游戏的“机遇”及其规律的动因,是他们在大量赌博游戏中发现骰子不同点数组合的频率趋于了不同的稳定值。这个稳定值,即后来数学家所定义的“概率”

十九到二十世纪,俄国和苏联数学家切比雪夫、柯尔莫哥洛夫提出随机变量等概念及概率的公理化定义,为大数法则和概率论提供了严格的逻辑基础。至此,现代概率论走向成熟,并在今天AI时代作为理论基石而大放异彩。可以预见,迈向AGI时代,概率论还将进一步展现其价值。

需指出的是,在高度抽象的公理化定义下,概率似乎成了一种先验的、脱离现实事物及其模型化的纯主观构造。但这实质上是主观抽象带来的失真。概率之所以被认识和定义、之所以这么有用,正因为它是对统计规律性的定量描述,是人们在认识和改造自然的过程中对不确定性现象中的确定性的发掘。倘若不顾客观事实和统计结果,任意构造概率,如把抛掷均匀硬币的概率测度定义为非均匀分布,而且信以为真,只会在主观臆测中与实际渐行渐远。

三、总结

迄今为止的概率概念都是理想化模型,是人们为了更好地认识世界、描述世界而进行主观抽象的产物。因此,概率并非实际的客观存在。

追溯概率的历史能发现,虽然骰子游戏在数千年前已存在,但概率概念的形成、现代概率论的发展和完备化,发生于近代科学和自然哲学思想普及的年代,伴随着欧洲国家在人口、经济、航海、军工等社会领域统计学需要的大量增加(事实上,伯努利大数定律建立后,18到20世纪的概率统计研究与天文学、气象学、物理学、生物学、射击学、弹道论等密切相关[5])。因此,尽管作为模型的概率并不实际存在,但它作为人类思维的产物,反映着一定的客观实在——统计规律性。

有趣的问题在于,若不确定性现象中的统计规律性客观存在,那么是否有某种定义方式,能让概率概念能脱离模型范畴而直达不确定性现象中的确定性本质?进一步追问,不确定性与确定性,究竟何者是世界的本质?

另外,即使通过统计知道了某些现象频率的稳定性,如何根据统计结果得到符合实际的概率分布,从而分析其机理?比如,格兰特发现的伦敦男婴:女婴出生率为14:13、男婴夭折率高于女婴、老年男性死亡率高于女性,是否是客观事实(可参考历年人口统计年鉴作对比)?其中蕴含着怎样的规律?

这些问题的解答,还在进行时。

参考文献:

1.吴嘉桐. 格朗特统计思想研究——以《关于死亡公报的自然和政治观察》为例[D]. 上海:上海师范大学,2020.

2.吴倩,叶冬青,潘海峰. 人口统计学之父:约翰·格朗特[J].中华疾病控制杂志,2020,24(5):617-620

3.梁旭. 古典概率的历史研究——走出赌博[D]. 天津:天津财经大学,2010.

4.华中科技大学. 概率发展史. https://maths./info/1187/3353.htm

5.华中科技大学. 统计学的历史.https://maths./info/1187/3354.htm

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多