贝叶斯定理学习（一）

声明：我不是计算机专业的，所以我只会考虑我自己的理解，不会出现我自己看不懂的专业名词

起源

所谓的贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章，而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前，人们已经能够计算“正向概率”，如“假设袋子里面有N个白球，M个黑球，你伸手进去摸一把，摸出黑球的概率是多大”。而一个自然而然的问题是反过来：“如果我们事先并不知道袋子里面黑白球的比例，而是闭着眼睛摸出一个（或好几个）球，观察这些取出来的球的颜色之后，那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测”。这个问题，就是所谓的逆概问题。

怎么记：先主观上假设一个概率，然后根据现实中的数据，不断的进行修正，直到比较近似现实事件B发生的情况下，事件A发生的概率，用P(A|B)来表示。

应用

垃圾邮件
推荐用户感兴趣的新闻
推荐用户感兴趣的音乐
搜索引擎

例子一

医生对病人进行诊断，任何一个医生无法直接看到病情，只能观察到表现出来的症状来猜测，医生就是一个分类器，医生诊断的准确率，与他当初受到的教育方式(构造方法)、病人的症状是否突出（我们要分类的数据的特性）以及医生的经验多少（训练样本数量）都有密切关系。

例子二

比如，你感觉你老婆出轨了，怎么办，这个怀疑不是没有道理的，据网上说法，中国已婚女性中的出轨率高达百分之40%，但是当这个我们只是猜测，但是如果你突然发现你家里有一个陌生男人的内裤，那概论就一下子上升到了多少多少了

例子三

新浪微博怎么发现僵尸粉的？

例子四

一座别墅在过去的 20 年里一共发生过 2 次被盗，别墅的主人有一条狗，狗平均每周晚上叫 3 次，在盗贼入侵时狗叫的概率被估计为 0.9，问题是：在狗叫的时候发生入侵的概率是多少？

例子五

现分别有 A，B 两个容器，在容器 A 里分别有 7 个红球和 3 个白球，在容器 B 里有 1 个红球和 9 个白球，现已知从这两个容器里任意抽出了一个球，且是红球，问这个红球是来自容器 A 的概率是多少?

例子六

图像识别

例子七

语音识别

例子八

隐马可夫模型：根据接收到的信息推测说法者想表达的意思

例子九

拼写检查

待续涉及代码(代码部分会详细讲解)

http://www.ruanyifeng.com/blog/2012/10/spelling_corrector.html http://norvig.com/spell-correct.html