导读:本文为大家详细介绍概念学习中常见的贝叶斯理论。通过一个简单示例,了解概率的基本定理之一。 作者:Jaime Zornoza 翻译:李洁 来源:数据派THU(ID:DatapiTHU) 本文需要你有一些概率和统计的基本知识。如果你没有,别怕,我已经收集了一系列我能找到的最好的资源来为你介绍这些主题,以便你阅读,理解和充分享受文章内容。 在这篇文章中,我们将讨论概率论中最著名和最常用的定理之一:贝叶斯定理。从未听说过吗? 那你就有福了!已经了解了吗?那就继续读下去,用一个简单例子来巩固你的知识,以便你也可以用简单的术语向别人解释。 在以后的文章中,我们将学习一些更实用的贝叶斯定理的简化,以及其他机器学习的概率方法,例如隐马尔可夫模型。 我们开始吧! 01 概率介绍在本节中,我列出了三个非常棒的简洁的资源(主要是前两个,第三个更广泛一点),以提供理解本文所需要了解的概率基础。不用担心,这些概念非常简单,只要快速阅读一下你就肯定能完全理解它们。
好了,现在你可以继续读剩下的内容了,坐下来,放松并享受吧。 02 贝叶斯定理谁是贝叶斯?托马斯·贝叶斯(Thomas Bayes,1701年-1761年)是英国神学家、数学家,皇家学会(世界上最古老的国家科学学会,也是英国促进科学研究的领先国家组织)会员。其他的科学家也加入了皇家学会, 例如牛顿,达尔文和法拉第。他提出了最重要的概率定理之一,并以他的名字命名:贝叶斯定理,或条件概率定理。 ▲尊敬的托马斯·贝叶斯的画像,贝叶斯定理之父 03 定理:条件概率为了解释这个定理,我们将举一个非常简单的例子。假设你被诊断出患有非常罕见的疾病,这种病患的比例仅是人口的0.1%,即每千人中有1人。
▲贝叶斯的条件概率公式 等号左边的P(H|E)项是已经在疾病测试中诊断为阳性(E)的条件下患病(H)的概率,这是我们实际想要计算的。概率项中的竖线(|)表示条件概率(即, B的条件下A的概率表示为P(A|B))。
▲解构了测试结果为阳性的概率
▲描述贝叶斯定理公式所涉及的每一项 对于我们来说,请记住,假设H患有疾病,事件E为在此类疾病的测试中被诊断为阳性。
▲条件概率的计算
▲计算结果 9%!我们得这种病的几率只有9%!“这怎么可能呢?”你可能在问自己。魔法吗?不,我的朋友们,这不是魔法,这只是概率:应用数学的常识。 像丹尼尔·卡尼曼(Daniel Kahneman)在《思考,快与慢》中所描述的那样,人的大脑很难估计和计算概率,就像前面的示例所展示的一样,所以我们应该警惕直觉的惯性思考,后退一步,使用所能用的概率工具。
▲计算第二次检验为阳性后的条件概率 ▲第二次检验为阳性的结果 现在我们实际患此病的几率变高了,为91%。尽管情况看起来很糟糕,但在两次检测呈阳性后,我们仍然不能完全确定我们是否患有这种疾病。确定性似乎不存在于概率的世界。 04 定理背后的事实这个著名定理背后的事实是,我们永远不可能完全确定这个世界,因为它是一个不断变化的存在,变化是现实的本质。然而,我们可以做的是,就像这个定理所表达的,随着我们获得越来越多的数据或证据,我们对现实的认识有了更新和提高。
随着越来越多的黄球落地,并且你知道它们相对于第一个蓝球的落地位置,逐渐增多了对蓝球的可能位置的了解,而排除了花园的某些部分:随着我们获得更多证据(更多的黄球)我们更新了知识(蓝球的位置)。
就这些,我希望你喜欢这个帖子。你可以在LinkedIn上和我联系,或者在Twitter上关注我@jaimezorno。另外,你也可以看看我其他关于数据科学和机器学习的文章。祝你阅读愉快! 原文标题:Probability Learning I: Bayes' Theorem 原文链接: https://www./2019/10/probability-learning-bayes-theorem.html 关于译者:李洁,香港科技大学电信学硕士毕业生,现任北京师范大学香港浸会大学联合学院 数据科学系助教。喜欢数据科学,喜欢阅读,喜欢研究代码和做手工。希望一直保持学习的状态和对生活的热爱,每天都快乐而有进步~ |
|