亲爱的,我在寻找真爱, 穿过这浓雾是如此艰苦。 请指出通往你内心之路, 我会重整旗鼓加快速度。 本书告诉你如何使用真实的数据(比如你自己的数据)来进行贝叶斯数据分析。本书从概率与程序设计的基本概念出发,逐渐进阶到实际数据分析中用到的高级模型。你不需要具备统计与编程的基础。 本书面向的是社会科学及生物科学领域的一年级研究生或高年级本科生:在乌比岗湖长大,但不是接受过核物理学家的训练又决定来学习贝叶斯数据分析的神话般的人物。(本书第 1 版出版后,真的有这样神话般的人联系了我!所以,即使你确实接受过核物理学家的训练,我同样希望你能从本书中有所收获。) 下面列出了学习本书所需具备的具体的预备知识。但首先说明一点:正如你在读本章内容时所看到的,本书每一章的开端都是一位著名诗人所写的优雅而富有见解的诗。这些是由扬抑抑韵格的四音步诗行构成的四行诗,俗称“乡村华尔兹”韵律。通过引用华尔兹时代不朽的人类主题,这些诗传达了每一章的概念主题。 如果你觉得它们并不是那么有趣, 如果它们令你想要回你花费的钱, 好吧,亲爱的,你花费的金钱实际很少, 因为,如果你继续阅读,将会学到很多。 预备知识 数据分析中总是不可避免地要用到数学。不过,本书绝对不是一本数理统计教材,也就是说,本书的重点并不是定理证明或者数学分析。但是我确实希望阅读本书的你具有一些数学分析知识,也就是微积分的基础知识。具体地说,如果你理解表达式的含义,你就可以继续阅读本书了。 注意前面这句话是要你“理解”积分的含义,而不是要你自己来“创造”它的含义。因为数学的推导过程有助于理解,所以本书将向你呈现一系列的中间步骤。这样会使你熟悉整个旅途的过程与目的地并感到安心,而不是像被蒙住眼睛扔到后排座椅上然后在高速路上绕弯一样而感到晕车。 如果你有一些计算机编程的基础经验——虽然这种经验并不是必需的——那么你将更快地上手。计算机程序只是计算机可以执行的一系列命令而已。如果你曾经把等号输入到 Excel 电子表格的单元格中,那么你就已经写过编程命令了。如果你曾经利用 Java、C、Python、Basic 或其他任何一种计算机编程语言写过一系列的命令,那么说明你已经准备好了。我们将使用的语言是 R、JAGS 和 Stan,它们都是免费的,本书中会对其进行详细的解释。 本书分为三大部分。第一部分介绍基础知识:贝叶斯推断的基本思想、模型、概率以及 R 语言编程。 第二部分涵盖了现代贝叶斯数据分析的所有关键思想,使用的是最简单的数据类型,比如同意/不同意、记住/忘记、男性/女性等二分数据。 由于这些数据非常简单,内容的重点就可以集中在贝叶斯技术上。特别地,这部分深入且直观地解释了现代技术“马尔可夫链蒙特卡罗”(Markov chain MonteCarlo,MCMC)方法。因为这一部分用的是简单的数据,所以我们可以用丰富的图形细节来帮助我们直观地想象层次模型的意义。第二部分也探讨了用来计算得出特定精度的结论所需要的数据量的方法,也就是“功效分析”(power analysis)。 第三部分将在实际数据上应用贝叶斯方法。这些应用是围绕所要分析的数据类型和所采用的解释或预测数据的方法类型组织的。不同类型的方法需要不同类型的数学模型,但它们隐含的概念总是相同的。之后将列举所涵盖内容的更多细节。 请按顺序阅读本书各章,以学习基本的贝叶斯数据分析技巧。尤其是第一部分和第二部分,如果按顺序阅读,你会更容易掌握其中的知识。但如下文所述,你也可以采用更短的阅读路线。 以下是本书的极简浏览列表。
如果你只想了解基本概念并以最快的速度获得操作经验,并且你已经具有一些传统概率统计的知识,比如 t 检验,那么我的建议如下。首先阅读本书第 2 章,获得概念基础。然后阅读 Kruschke有关两组数据的贝叶斯估计的文章(Kruschke,2013a,与传统的 t 检验类似)。基本上,这时你已经跳到了本书的第 16 章。这篇文章提供了帮助你获得操作经验的软件。该软件有一个版本是基于JavaScript 的,无须安装其他软件即可在你的浏览器中使用。有关详细信息,请访问印第安纳大学伯明顿分校网站。 在阅读完上面的极简浏览内容之后,如果你想深入了解更多的具体应用,需要阅读以下各章。
传统的统计方法关注的往往是我们能否拒绝一个零假设,而不是估计它的幅度及其不确定性。有关零假设的贝叶斯观点,请阅读以下两章。
由于许多读者在阅读本书之前已经熟悉了传统的统计方法,也就是零假设显著性检验(nullhypothesis significance testing,NHST),因此,本书将提供与 NHST 课本上常见的主题类似的贝叶斯方法。表 1-1 列出了标准统计学入门教科书中涵盖的各种统计检验方法,以及与它们类似的贝叶斯方法在本书中的第几章。 表 1-1 中提到的统计检验方法均被称为“广义线性模型”。已经熟悉这一术语的人,可以直接翻到表 15-3 以查看哪些章节涵盖了哪些实例。那些还不熟悉这一术语的人,请不要担心,因为第 15 章的全部内容都在介绍并解释这些思想。 表 1-1 可能使人得出一个肤浅的结论:“呀,这张表格告诉我们,在所有情况中,传统统计检验方法与贝叶斯方法所做的事情都类似,所以花费时间和精力来学习贝叶斯数据分析是没有意义的。”这个结论是错误的。首先,传统的 NHST 有深层次的问题,我们会在第 11 章讨论。其次,贝叶斯数据分析提供了多种内容更丰富且信息量更大的统计推理方法,本书中的许多例子将证明这一点。 这一版中主题的基本进程与上一版相同,但是从封面到封底,本书的所有细节都有所变化。本书里的所有程序全部进行了重新编写。以下是一些较为重要的变化。
哦,我是不是提到过本书这一版的封面与第 1 版不同?明确一下小狗与贝叶斯法则之间的关系:后验小狗的折叠耳朵,是似然小狗的直立耳朵与先验小狗的松软耳朵折中的结果。MCMC 方法通常不计算边际概率,因此分母中的小狗因为没事可做而昏昏欲睡。我希望本书封面与封底之间的内容就像封面上的小狗一样友好且迷人。 1.美国加州大学伯克利分校博士,特罗兰研究奖获得者,美国印第安纳大学心理学和脑科学名誉教授、统计学副教授约翰·K. 克鲁施克,拥有近25年的统计学教学经验总结! 2.极佳的贝叶斯统计入门书籍!如果你认为统计学很难,或许是因为你在入门时错过了本书。 3.原著豆瓣高达9.4分!全面覆盖实用的贝叶斯统计知识,可读性强!
《贝叶斯的博弈:数学、思维与人工智能》 作者:黄黎原 译者:方弦 法国数学类科普书、大学数学参考及教材类图书畅销书目,在机器学习、人工智能、逻辑学和哲学等众多领域中,探索贝叶斯定理蕴藏的智慧与哲理。 贝叶斯定理一旦与算法相结合,就不再是一套枯燥的数学理论或认识论,而变成了应用广泛的知识宝库,催生了众多现代数学定理,以及令人称道的实践成果。
《趣学贝叶斯统计:橡皮鸭、乐高和星球大战中的统计学》 本书用十余个趣味十足、脑洞大开的例子,将贝叶斯统计的原理和用途娓娓道来。你将从直觉出发,自然而然地习得数学思维。读完本书,你会发现自己开始从概率角度思考每一个问题,并能坦然面对不确定性,做出更好的决策。 03 《谁在掷骰子?不确定的数学》 几个世纪以来,在好奇心以及精确预测未来的“野心”驱动下,具有开拓意识的数学家希望从概率论和统计学着手,减少各种“不确定性”。但他们发现,某些问题始终难以解决,而直觉也在不断误导人类。 本书探讨了关于“不确定性”的有趣故事和相关科学知识。知名科普作家伊恩·斯图尔特巧妙地建立起一个易于理解、充满想象力的数学框架,从概率论、统计学、贝叶斯方法、混沌理论等角度展现了“不确定性”在金融市场、天气预报、人口普查、医学、量子物理学和宇宙学等诸多领域中的重要作用,展望了与不确定性问题紧密相关的科学门类的广阔研究前景。 04 《普林斯顿概率论读本》 本书讲解概率论的基础内容, 包括组合分析、概率论公理、条件概率、离散型随机变量、连续型随机变量、随机变量的联合分布、期望的性质、极限定理和模拟等, 内容丰富, 通俗易懂, 并配有丰富的例子和大量习题, 涉及物理学、生物学、化学、遗传学、博弈论、经济学等多方面的应用,极具启发性。 Google Gemini 1.5 Pro和 OpenAI Sora的一些资料 用GPT-4学习董宇辉的文旅小作文风格,回复城市名,自动撰写同款 叫板GPT-4的Gemini,我做了一个聊天网页,可图片输入,附教程 |
|