
贝叶斯网络:从概率推理到智能决策
引言 假设你是一个医生。一位患者走进诊室,告诉你他有发烧和咳嗽的症状。你会怎么做? 直觉上,你可能会想:“发烧加咳嗽,可能是感冒,也可能是流感,或者更严重一点是肺炎。” 这个简单的推理过程,其实蕴含了深刻的数学原理——你在根据观察到的证据(症状),推断潜在的原因(疾病)。这正是概率推理的核心。 但问题在于,现实世界远非这么简单。如果患者还告诉你他刚从高原旅行回来呢?如果他还有吸烟史呢?如果有十个、二十个相关因素呢?你如何在这些复杂的因素之间建立联系,做出准确的判断? 这正是贝叶斯网络(Bayesian Network)诞生的原因。它为我们提供了一种优雅的方式来表示复杂的概率关系,让我们能够在不确定的世界中,进行理性的推理和决策。 第一章:为什么要发明贝叶斯网络? 1.1 不确定性是世界的常态 让我们从一个简单的场景开始。假设你有一个朋友,某天你看到他带着一把雨伞出门。你可能会想:“他带伞,是因为今天会下雨吗?” 这个推理看起来理所当然,但仔细想想,其实包含了多层不确定性: 他可能知道今天会下雨(看了天气预报) 他可能只是习惯带伞 他可能要用伞遮阳 他可能不知道天气,但天上乌云密布让他有所警觉 不确定性无处不在。 我们无法百分之百确定任何事情——天气预报可能不准,仪器测量会有误差,人的决策充满随机性。传统数学擅长处理确定的、因果关系明确的问题,但在面对不确定性时,我们需要新的工具。 1.2 概率论:处理不确定性的语言 早在 17 世纪,数学家们就开始系统研究不确定性。概率论应运而生,为我们描述"某事发生的可能性"提供了精确的语言。 最基本的概率概念是:事件 $A$ 发生的概率记为 $P(A)$,取值在 0 到 1 之间。0 表示不可能发生,1 表示必然发生,0.5 表示一半对一半。 但真正革命性的突破来自 18 世纪的一位英国牧师——托马斯·贝叶斯(Thomas Bayes)。他在去世后(1763 年)发表的一篇论文中,提出了一个看似简单却影响深远的公式: $$P(H|E) = \frac{P(E|H) \cdot P(H)}{P(E)}$$ 这就是著名的贝叶斯定理。其中: $P(H)$ 是先验概率(Prior):在看到证据之前,我们对假设 $H$ 的相信程度 $P(E|H)$ 是似然(Likelihood):如果假设 $H$ 成立,观察到证据 $E$ 的概率 $P(H|E)$ 是后验概率(Posterior):在看到证据 $E$ 之后,我们对假设 $H$ 的更新相信程度 这个公式告诉我们:信念是可以随着证据而更新的。 这正是人类推理的核心——我们不断根据新信息修正自己的看法。 1.3 朴素贝叶斯:一个简单但有缺陷的起点 贝叶斯定理如此优雅,自然让人们想用它来解决实际问题。其中最简单、最著名的应用就是朴素贝叶斯分类器。 假设我们要根据邮件中的词语来判断它是不是垃圾邮件。设 $C$ 表示邮件类别(垃圾/正常),$F_1, F_2, …, F_n$ 表示邮件中出现的各种特征(词语)。 ...








