眾所周知,貝葉斯定理是一種在已知其他概率的情況下求概率的方法:
那我們怎么去理解這個傳說中不黃但很暴力的貝葉斯定理呢,貝葉斯定理是如何暴力狂虐數學界的?
首先,對于貝葉斯定理,還是要先了解各個概率所對應的事件 。
P(A|B) 是在 B 發生的情況下 A 發生的概率;
P(A) 是 A 發生的概率;
P(B|A) 是在 A 發生的情況下 B 發生的概率;
P(B) 是 B 發生的概率 。
1
要理解貝葉斯定理 , 我們先來看一個“對方到底喜不喜歡你?”的例子 。小李經常單獨找曉陳聊天 , 而曉陳想知道小李是不是喜歡自己 。在這里,小李喜歡曉陳是事件A人工智能求最優解算法,而小李經常和曉陳聊天是事件B 。
在這里,我們先認識一些數學符號,P(A)表示A發生的概率 , P(B|A)表示在A發生的條件下,B發生的概率,P(A∩B)則表示A和B兩事件都發生的概率,其他同理 。
根據條件概率的定義,在事件 B 發生的條件下事件 A 發生的概率為:
同樣地,在事件 A 發生的條件下事件 B 發生的概率為:
通過P(A∩B) , 我們可以得到:P(A)×P(B|A)=P(B)×P(A|B) , 進行簡單的變換,就可以得到以上著名的貝葉斯定理了:
以上是我們得到最基本的貝葉斯公式的推導過程 。在貝葉斯定理中,A是你要考察的目標事件(如喜不喜歡曉陳),P(A)是在沒有其他任何信息幫助下,這個目標事件的概率,被稱為初始概率 。公式左邊P(A|B)是指當發生B事件(如單獨聊天)后,我們得到的新的觀察 , 被稱為后驗概率,也就是我們最終尋求的事件概率 。
在現實生活中,我們大腦決策的過程就是應用貝葉斯定理的過程 。我們的手中只有有限的信息,而決策就是要利用有限的信息 , 盡量做出一個最優的預測 。正如法國著名的天文學家和數學家皮埃爾·西蒙·拉普拉斯所說的一樣:“人生最重要的問題,在絕大多數情況下,真的就只是概率問題 。”概率是個主觀值,完全就是我們自己的判斷 , 我們可以先估計一個初始概率,然后每次根據出現的新情況,掌握的新信息,對這個初始概率進行修正,隨著信息的增多,慢慢逼近真實的概率 。這個方法完美的解決了信息少的問題 , 我們不用等樣本累積到一定程度,先猜一個就行動起來了 。
讓我們回到小李和曉陳身上 。曉陳如何推測小李喜歡自己的概率呢?首先,曉陳只能主觀想出一個初始概率,在沒發生B(小李單獨找曉陳聊天)之前,曉陳推測小李喜歡自己的概率很低,只有5%(P(A)) 。
假設如果一個人喜歡另一個人,那么他經常找對方聊天的概率是80%;一個人不喜歡另外一個人 , 他經常找對方聊天的概率只有20% 。即P(B|A)=0.8,P(B|非A)=0.2 。
注意經常找對方單獨聊天的情況存在兩種:喜歡并單獨聊天或不喜歡也單獨聊天,因此P(B)=P(B|A)×P(A)+P(B|非A)×P(非A)=0.8×0.05+0.2×0.95=0.23 。
在小李喜歡找曉陳聊天的情況下人工智能求最優解算法,小李喜歡曉陳的概率漲到了:P(A|B)=P(A)×P(B|A)/0.23=0.05×0.8÷0.23=17.4% 。
如果隨著曉陳后來的觀察,她又發現了別的“蛛絲馬跡”,如小李經常偷看自己 , 那么利用貝葉斯定理,小李喜歡曉陳的概率肯定還會進一步上升 。
2
還沒看懂 。。。那我還舉個例子吧
京西大旅館為了慶祝開業三周年的好日子,老板劉強西準備帶著實習生小李去郊外旅游 , 不過一大早天空多云:
糟了!50%的雨天的早上是多云的!
但多云的早上其實挺多的(大約40%的日子早上是多云的)!
這個月干旱為主(平均30天里一般只有3天會下雨,10%)!
劉強西45°角仰望天空,想著要不要去郊游 。。。
作為聰明的實習生 , 小李立馬拿出他的小本子:
此時,我們用”雨”來代表今天下雨,”云”來代表早上多云 。
當早上多云時,當天會下雨的可能性是 P(雨|云) 。
P(雨|云) = P(雨)·P(云|雨) /P(云)
P(雨) 是今天下雨的概率 = 10%
P(云|雨) 是在下雨天早上有云的概率 = 50%
P(云) 早上多云的概率 = 40%
基本的概率情況已經確定,那就簡單了
P(雨|云) =0.1×0.5/0.4=0.125
小李:劉老板,不用看天氣了,今天下午的概率只有12.5%,可以去郊游的 。
劉強西聽完后:行,那趕緊上車!
然而,“小李”算不如天算 , 你看,天就下雨了 。。。
小李尷尬ing
故事到這里還沒結束 , 當時我們在學習貝葉斯定理的時候,時常會記不住到底是B在前,還是A在前,公式該怎么寫
直到有一次,小李(這個小李是做監控的小李 , 不是上面說的劉強西的小李)看我在寫貝葉斯公式,說出:AB AB AB 。
所以對于貝葉斯公式 , 記住AB AB AB,然后再做分組:”AB = A×BA/B” 。
別急,假如“A”還有兩個可能 , 插入新舉例
各位監控君,你們聽說“假陽性”、“假陰性”這兩個詞嗎?
是的,沒錯 , 就是某些疾病檢測一般喜歡用名詞,醫學院的同學趕緊拿好小板凳 , 接下來就是考試重點了 。
貝葉斯定理雖然只是一個概率計算公式,但其最著名的一個用途便是“假陽性”和“假陰性”檢測 。
3
再丟個例子 。。。
上次沒出成郊游,劉強西卻在路邊撿了一只小流浪貓回京西大旅館,每天就顧著擼貓 。。。
兩天過后,劉強西突然渾身發癢,小李就想起來是不是劉強西對貓過敏,于是劉強西就做了一個簡單的過敏檢測:
對于真的有這種過敏的人,檢測有 80% 的機會給回 “有” 的結果;
對于沒有這種過敏的人 , 檢測有 10% 的機會給回 “有” 的結果(而這種情況,稱之為”假陽性”) 。
從實際情況看,京西大旅館的村子有 1% 的人有這種過敏 , 而劉強西的檢測結果是 “有”,那么劉強西真的有這種過敏的可能性有多大?
P(過敏) 是有這種過敏的概率 = 1%
P(有|過敏) 是對于真的有這種過敏的人 , 檢測的結果是 “有” = 80%
P(有) 是對于任何人,檢測的結果是 “有” = ??%
糟糕!我們并不知道檢測結果是 “有” 的一般可能性是多少……
不過我們可以把有這種過敏和沒有這種過敏的概率相加來求這個一般概率:
1% 的人有這種過敏 , 檢測對 80% 的這些人說 “有”
99% 的人沒有這種過敏,檢測對 10% 的這些人說 “有”
把概率加起來:
P(有) = 1% × 80% + 99% × 10% = 10.7%
就是說大約 10.7% 的人會得到 “有” 的檢測結果 。
那此時我們就可以計算出 , 劉強西真正對貓過敏的概率為
P(過敏|有) = 1% × 80%/10.7%= 7.48%
所以此時也就有了貝葉斯定理特別版:
最后說多兩句:
貝葉斯統計作為常用的基礎算法,不要小看其作用 , 其在機器學習中是占據重要的一席之地 。尤其是在數據處理方面,針對事件發生的概率以及事件可信度分析上具有良好的分類效果 , 在人工智能監控領域,作者也很期待貝斯葉架構帶算法和處理一體的芯片到來!
【如何簡單粗暴理解貝葉斯定理】本文到此結束,希望對大家有所幫助 。
- 人工智能將如何改變生活?院士帶你暢想未來
- 未來的生活會是什么樣?從衣食住行看智能化如何改變生活?
- 王茜程都:人工智能如何影響銀行業轉型
- 四座三伏天最酷熱的城市,如何避暑?
- ?沒吃完的壽司如何保存,壽司吃不完應該怎么保存
- 人工智能如何協助克服人力管理的挑戰
- 0基礎如何入門Python,Python學起來難嗎?
- ?吃毛衣的蟲子如何殺死,家里衣柜里的毛衣不知怎么了,出了很多小洞,象蟲咬的
- ?怎么能喝出白酒好壞呢?如何喝出白酒好壞
- ChatGPT是如何使AI從“人工智障”變成“人工智能”的
