贝叶斯定理,不信看完这篇还不懂!
  TtOLD3V2aZVM 2023年11月02日 35 0


贝叶斯定理,不信看完这篇还不懂!_概率论

当一个事件的结果不影响另一个事件的结果时,这两个事件就是独立事件。例如,掷硬币时出现正面并不影响掷骰子是否会掷出6点。计算独立事件的概率要比计算非独立事件的概率容易得多,但独立事件往往并不能反映现实生活。例如,闹钟不响和上班迟到就不是独立事件。如果闹钟没有响,你上班迟到的可能性就要比其他时候大得多。

作者 |[美] 威尔·库尔特(Will Kurt)

译者 | 王凌云

当一个事件的结果不影响另一个事件的结果时,这两个事件就是独立事件。例如,掷硬币时出现正面并不影响掷骰子是否会掷出6点。计算独立事件的概率要比计算非独立事件的概率容易得多,但独立事件往往并不能反映现实生活。例如,闹钟不响和上班迟到就不是独立事件。如果闹钟没有响,你上班迟到的可能性就要比其他时候大得多。

在本文中,你将学习如何分析条件概率,即事件的概率不是独立的,而是取决于特定事件的结果。此外,还将介绍条件概率最重要的应用之一:贝叶斯定理。

1

条件概率

贝叶斯定理,不信看完这篇还不懂!_条件概率_02

因此,如果你在2010年接种过流感疫苗,我们就有足够的信息相信你比一个随机挑选的人患GBS的可能性高50%。幸运的是,在个人层面上,每个人患GBS的概率仍然很低;但如果把人群作为一个整体,那么我们可以预计,接种过流感疫苗的人群患GBS的概率要比普通人群高50%。

还有许多其他因素可能会增加人们患GBS的概率,例如,男性和老年人患GBS的可能性更大。使用条件概率,我们就可以将所有这些信息综合在一起,从而更好地估计每个人患GBS的概率。

2 依赖性与概率法则的修订

贝叶斯定理,不信看完这篇还不懂!_概率论_03

关于条件概率和统计的依赖性,需要注意的一个重要问题是,在现实中要知道两个事件的关系往往是很困难的。例如,我们可能想知道某人拥有一辆皮卡且上下班时间超过一小时的概率。虽然我们可以提出很多理由表明其中一个事件可能依赖另外一个事件(比如,很多拥有皮卡的人住在郊区,很少通勤),但我们可能找不到数据来证明这一点。假设两个事件独立(即使它们很可能不是)是统计学中非常常见的做法。但是,就像前面计算男性色盲概率的例子一样,这种假设有时会产生非常严重的错误。虽然独立性假设通常是出于实际需要,但我们不能忘记依赖性的影响有多大。

2

逆概率和贝叶斯定理

关于条件概率,我们能做的最神奇的一件事情就是,将条件颠倒过来计算其所依赖事件的概率。也就是说,我们可以通过

贝叶斯定理,不信看完这篇还不懂!_数据_04

计算出

贝叶斯定理,不信看完这篇还不懂!_机器学习_05

 。举个例子,假设你正在给一家色盲矫正眼镜公司的客服代表发送电子邮件。这款眼镜有点贵,于是你在邮件中说自己担心眼镜可能不起作用。客服代表回复说:“我也是色盲,我自己也有一副,效果非常好!”

我们想知道这位客服代表是男性的概率,但是除了工号之外,这位客服代表没有提供任何其他信息。那么,怎样才能算出这位客服代表是男性的概率呢?

我们知道 P(色盲 | 男性)=0.08,P(色盲 | 女性)=0.05,但P(男性 | 色盲) 该如何确定呢?直觉上,我们认为客服代表是男性的可能性更大,但这需要量化才能确定。

庆幸的是,我们拥有解决这个问题所需的全部信息,而且知道要解决的问题是,在已知色盲的情况下问此客服代表是男性的概率:

贝叶斯定理,不信看完这篇还不懂!_人工智能_06

贝叶斯统计的核心是数据,除了现有的概率,现在我们只有一条数据:客服代表是色盲。下一步就需要求出总人口中色盲的比例,然后,我们就可以搞清楚色盲人群中有多少是男性了。

为了帮助分析,我们增加一个新的变量N,用它代表总人口的数量。如前所述,首先需要计算出色盲人群的总数。我们知道出现色盲的概率P(色盲),因此可以写出下面这部分等式:

贝叶斯定理,不信看完这篇还不懂!_概率论_07

下一步需要计算出人群中男性色盲的人数。这很简单,因为已经知道和,而且乘法法则已经更新。直接用概率乘以总人口就可得出男性色盲的人数:

贝叶斯定理,不信看完这篇还不懂!_概率论_08

因此,在已知客服代表患有色盲症的情况下,他是男性的概率是:

贝叶斯定理,不信看完这篇还不懂!_概率论_09

等式右边的分子和分母中都有总人口数 ,可以消除,因此有:

贝叶斯定理,不信看完这篇还不懂!_人工智能_10

现在我们可以直接求解这个问题了,因为余下的数据都有:

贝叶斯定理,不信看完这篇还不懂!_数据_11

贝叶斯定理,不信看完这篇还不懂!_条件概率_12

贝叶斯定理,不信看完这篇还不懂!_机器学习_13

贝叶斯定理,不信看完这篇还不懂!_条件概率_14

3

贝叶斯定理

在前面的公式中,实际上并没有任何专门针对色盲示例的内容,所以我们可以将它推广到任何给定事件  和事件  的概率上。这样做,我们就得到了本书最基本的公式——贝叶斯定理:

贝叶斯定理,不信看完这篇还不懂!_概率论_15

为了理解贝叶斯定理如此重要的原因,我们来看看这个问题的一般形式。信念描述了我们所知道的世界,当观察到某件事情时,它的条件概率就代表了在我们相信的前提下自己所见事情的可能性,即:

贝叶斯定理,不信看完这篇还不懂!_机器学习_16

例如,你相信气候正在变化,因此你假设所居住的地区10年内会发生更多的干旱。你的信念是气候变化正在发生,你的观察结果是所在地区的干旱次数。假设过去10年里发生过5次干旱。如果在过去的10年里确实发生了气候变化,要确定你在过去10年中刚好观察到5次干旱的概率有多大,这可能会很困难。一种方法是咨询气候专家,询问他们在气候的确发生变化的假设下出现干旱的概率。

在这一点上,你所要做的只是去问一下:“如果我相信气候变化是真的,那么观察到10年发生5次干旱的概率有多大?”但你想要的是,有某种方法来量化自己有多相信气候真的在发生变化。贝叶斯定理允许你将咨询气候学家的概率P(观察 | 信念)反转,求解出在给定观察的情况下信念的概率,即:

贝叶斯定理,不信看完这篇还不懂!_概率论_17

在这个例子中,贝叶斯定理允许你将10年内观察到的5次干旱转化为一个陈述,表达在观察到这些干旱之后你对气候变化的信念有多强。你还需要的其他信息是,10年内发生5次干旱的一般概率(可以用历史数据估计)和你相信气候变化的初始概率。虽然大多数人相信气候变化的初始概率会有所不同,但贝叶斯定理可以让你准确量化数据对信念的改变程度。

如果气候专家说假设气候变化正在发生,那么10年内发生5次干旱是非常有可能的。大多数人可能会因此改变之前的信念,并且会更支持气候变化这一观点,不管他们以前是否持怀疑态度。

然而,如果气候专家告诉你说,即使气候变化正在发生,10年内发生5次干旱的可能性也非常小,那么你先前对气候变化的信念会因为与数据相左而略有减弱。这里的关键是,贝叶斯定理允许数据改变我们对信念的相信程度。

贝叶斯定理允许我们将对世界的信念与数据结合起来,然后根据我们观察到的情况把这种结合转化为对信念强度的估计。很多时候,信念只是我们对一个想法的初始确定程度,也就是贝叶斯定理中的P(A)。我们经常会争论一些话题,比如增加考试能否提高学生的成绩,或者公共医疗能否降低整体医疗成本。但是我们很少思考数据如何改变了我们以及与我们辩论的人的想法。贝叶斯定理允许我们分析关于这些信念的数据,并精确地量化这些数据到底能够改变我们的信念多少。

贝叶斯定理,不信看完这篇还不懂!_机器学习_18

作者:[美] 威尔·库尔特(Will Kurt)

译者:王凌云

用几块乐高积木,能直观理解贝叶斯定理,十余个趣味十足、脑洞大开的例子将贝叶斯统计的原理和用途讲明,自然习得数学思维,学习统计学和概率学。

本书通过简单的解释和有趣的示例帮助你了解贝叶斯统计。举几个例子:你可以评估UFO出现在自家后院中的可能性、《星球大战》中汉?索罗穿越小行星带幸存下来的可能性、抓鸭子中大奖游戏的公平性,并学会用乐高积木理解贝叶斯定理。

通过阅读本书,你会学习如何衡量自己所持信念的不确定性,理解贝叶斯定理并了解它的作用,计算后验概率、似然和先验概率,计算分布以查看数据范围,比较假设并从中得出可靠的结论。

贝叶斯定理,不信看完这篇还不懂!_机器学习_19

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
TtOLD3V2aZVM