複製鏈接
請複製以下鏈接發送給好友

條件概率

鎖定
條件概率是指事件A在另外一個事件B已經發生條件下的發生概率。條件概率表示為:P(A|B),讀作“在B的條件下A的概率”。條件概率可以用決策樹進行計算。條件概率的謬論是假設 P(A|B) 大致等於 P(B|A)。數學家John Allen Paulos 在他的《數學盲》一書中指出醫生、律師以及其他受過很好教育的非統計學家經常會犯這樣的錯誤。這種錯誤可以通過用實數而不是概率來描述數據的方法來避免。
中文名
條件概率
外文名
Conditional probability
分    類
數學
表    示
P(A|B)
計    算
決策樹
定    理
貝葉斯公式

條件概率基本概念

條件概率
條件概率是指事件A在事件B發生的條件下發生的概率。條件概率表示為:P(A|B),讀作“A在B發生的條件下發生的概率”。若只有兩個事件A,B,那麼,
概率測度
如果事件 B 的概率 P(B) > 0,那麼 Q(A) = P(A | B) 在所有事件 A 上所定義的函數 Q 就是概率測度。 如果 P(B) = 0,P(A | B) 沒有定義。 條件概率可以用決策樹進行計算。 [1] 
聯合概率
表示兩個事件共同發生的概率。AB聯合概率表示為 P(AB) 或者P(A,B),或者P(A∩B)。 [2] 
邊緣概率
是某個事件發生的概率,而與其它事件無關。邊緣概率是這樣得到的:在聯合概率中,把最終結果中不需要的那些事件合併成其事件的全概率而消失(對離散隨機變量用求和得全概率,對連續隨機變量用積分得全概率)。這稱為邊緣化marginalization)。A的邊緣概率表示為P(A),B的邊緣概率表示為P(B)。
條件概率公式 條件概率公式
需要注意的是,在這些定義中AB之間不一定有因果或者時間順序關係。A可能會先於B發生,也可能相反,也可能二者同時發生。A可能會導致B的發生,也可能相反,也可能二者之間根本就沒有因果關係。例如考慮一些可能是新的信息的概率條件性可以通過貝葉斯定理實現。 [3] 

條件概率基本定理

定理1
設A,B 是兩個事件,且A不是不可能事件,則稱
為在事件A發生的條件下,事件B發生的條件概率。一般地,
,且它滿足以下三條件:
(1)非負性;(2)規範性;(3)可列可加性。
定理2
設E 為隨機試驗,Ω 為樣本空間,A,B 為任意兩個事件,設P(A)>0,稱
為在“事件A 發生”的條件下事件B 的條件概率。
上述乘法公式可推廣到任意有窮多個事件時的情況。
,…
為任意n 個事件(n≥2)且
,則
定義:(完備事件組/樣本空間的劃分)
設B1,B2,…Bn是一組事件,若
(1)
(2)B1∪B2∪…∪Bn=Ω
則稱B1,B2,…Bn樣本空間Ω的一個劃分,或稱為樣本空間Ω 的一個完備事件組。
定理(全概率公式):
設事件組
是樣本空間Ω 的一個劃分,且P(Bi)>0(i=1,2,…n)
則對任一事件A,有
設B1,B2,…Bn…是一完備事件組,則對任一事件A,P(A)>0,有

條件概率統計獨立性

當且僅當兩個隨機事件AB滿足
P(A∩B)=P(A)P(B)
的時候,它們才是統計獨立的,這樣聯合概率可以表示為各自概率的簡單乘積。
同樣,對於兩個獨立事件AB
P(A|B)=P(A)
以及
P(B|A)=P(B)
換句話説,如果AB是相互獨立的,那麼AB這個前提下的條件概率就是A自身的概率;同樣,BA的前提下的條件概率就是B自身的概率。

條件概率互斥性

當且僅當AB滿足
P(A∩B)=0
且P(A)≠0,P(B)≠0
的時候,AB互斥的。
因此,
P(A|B)=0
P(B|A)=0
換句話説,如果B已經發生,由於A不能和B在同一場合下發生,那麼A發生的概率為零;同樣,如果A已經發生,那麼B發生的概率為零。

條件概率其它

如果事件B的概率,P(B)>0
那麼Q(A)=P(A|B)在所有事件A上所定義的函數Q就是概率測度
如果P(B)=0,P(A|B)沒有定義。

條件概率著名謬論

條件概率的謬論是假設 P(A|B) 大致等於 P(B|A)。數學家John Allen Paulos 在他的《數學盲》一書中指出醫生、律師以及其他受過很好教育的非統計學家經常會犯這樣的錯誤。這種錯誤可以通過用實數而不是概率來描述數據的方法來避免。
P(A|B) 與 P(B|A)的關係如下所示:
P(B|A)=P(A|B)P(B)/P(A)
下面是一個虛構但現實的例子,P(A|B) 與 P(B|A)的差距可能令人驚訝,同時也相當明顯。
若想分辨某些個體是否有重大疾病,以便早期治療,我們可能會對一大羣人進行檢驗。雖然其益處明顯可見,但同時,檢驗行為有一個地方引起爭議,就是有檢出假陽性的結果的可能:若有個未得疾病的人,卻在初檢時被誤檢為得病,他可能會感到苦惱煩悶,一直持續到更詳細的檢測顯示他並未得病為止。而且就算在告知他其實是健康的人後,也可能因此對他的人生有負面影響。
這個問題的重要性,最適合用條件機率的觀點來解釋。
假設人羣中有1%的人罹患此疾病,而其他人是健康的。我們隨機選出任一個體,並將患病以disease、健康以well表示:
P(disease) = 1% = 0.01 and P(well) = 99% = 0.99. 假設檢驗動作實施在未患病的人身上時,有1%的機率其結果為假陽性(陽性以positive表示)。意即:
P(positive | well) = 1%,而且P(negative | well) = 99%. 最後,假設檢驗動作實施在患病的人身上時,有1%的機率其結果為假陰性(陰性以negative表示)。意即:
P(negative | disease) = 1%且P(positive | disease) = 99%。由計算可知:P(negative | well) = 99%
是整羣人中健康、且測定為陰性者的比率。
P(positive|disease) = 99% 是整羣人中得病、且測定為陽性者的比率。
是整羣人中被測定為假陽性者的比率。
是整羣人中被測定為假陰性者的比率。
進一步得出:
是整羣人中被測出為陽性者的比率。
P(disease|positive) = 50% 是某人被測出為陽性時,實際上真的得了病的機率。
這個例子裏面,我們很輕易可以看出 P(positive|disease)=99% 與 P(disease|positive)=50% 的差距:前者是你得了病,而被檢出為陽性的條件機率;後者是你被檢出為陽性,而你實際上真得了病的條件機率。由我們在本例中所選的數字,最終結果可能令人難以接受:被測定為陽性者,其中的半數實際上是假陽性。 [4] 
參考資料
  • 1.    (美)別林斯里(Billingsley,P.).概率與測度(第3版):世界圖書出版公司,2007-05-01
  • 2.    聯合概率  .中國知網[引用日期2013-07-19]
  • 3.    邊緣概率  .中國知網[引用日期2013-07-18]
  • 4.    約翰·艾倫·保羅斯(John Allen Paulos).數學盲:Hill&WangPub,2001年9月