贝叶斯定理学习(一)
声明:我不是计算机专业的,所以我只会考虑我自己的理解,不会出现我自己看不懂的专业名词
起源
所谓的贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大”。而一个自然而然的问题是反过来:“如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测”。这个问题,就是所谓的逆概问题。
怎么记:先主观上假设一个概率,然后根据现实中的数据,不断的进行修正,直到比较近似现实 事件B发生的情况下,事件A发生的概率,用P(A|B)来表示。
应用
- 垃圾邮件
- 推荐用户感兴趣的新闻
- 推荐用户感兴趣的音乐
- 搜索引擎
例子一
医生对病人进行诊断,任何一个医生无法直接看到病情,只能观察到表现出来的症状来猜测,医生就是一个分类器,医生诊断的准确率,与他当初受到的教育方式(构造方法)、病人的症状是否突出(我们要分类的数据的特性)以及医生的经验多少(训练样本数量)都有密切关系。
例子二
比如,你感觉你老婆出轨了,怎么办,这个怀疑不是没有道理的,据网上说法,中国已婚女性中的 出轨率高达百分之40%,但是当这个我们只是猜测,但是如果你突然发现你家里有一个陌生男人的内裤,那概论就一下子上升到了多少多少了
例子三
新浪微博怎么发现僵尸粉的?
例子四
一座别墅在过去的 20 年里一共发生过 2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,在盗贼入侵时狗叫的概率被估计为 0.9,问题是:在狗叫的时候发生入侵的概率是多少?
例子五
现分别有 A,B 两个容器,在容器 A 里分别有 7 个红球和 3 个白球,在容器 B 里有 1 个红球和 9 个白球,现已知从这两个容器里任意抽出了一个球,且是红球,问这个红球是来自容器 A 的概率是多少?
例子六
图像识别
例子七
语音识别
例子八
隐马可夫模型:根据接收到的信息推测说法者想表达的意思
例子九
拼写检查
待续涉及代码(代码部分会详细讲解)
http://www.ruanyifeng.com/blog/2012/10/spelling_corrector.html http://norvig.com/spell-correct.html