複製鏈接
請複製以下鏈接發送給好友

伯克松悖論

鎖定
伯克松悖論是醫學統計中的一種偏差。當不同個體被納入研究樣本的機會不同時,研究樣本中的兩個變量 X 和 Y 表現出統計相關,而總體中 X 和 Y 卻不存在這種相關性。這一現象便是伯克松悖論。
中文名
伯克松悖論
外文名
Berkson's paradox
別    名
伯克森悖論
所屬學科
醫學統計

目錄

伯克松悖論內容簡介

伯克森悖論是美國醫生和統計學家約瑟夫·伯克森在 1946 年提出的一個問題。他研究了一個醫院中患有糖尿病的病人和患有膽囊炎的病人,結果發現患有糖尿病的人羣中,同時患膽囊炎人數較少;而沒有糖尿病的人羣中,患膽囊炎的人數比例較高。這似乎説明患有糖尿病可以保護病人不受到膽囊炎的折磨,但是從醫學上講無法證明糖尿病能對膽囊炎起到任何保護作用。他將這個研究寫成了論文《用四格表分析醫院數據的侷限性》 [1]  ,並發表在雜誌《生物學公報》上,這個問題就稱為伯克森悖論
伯克森悖論產生的最主要原因是:文章中統計的患者都是醫院的病人,從而忽略了那些沒有住院的人。

伯克松悖論分析

伯克森悖論 伯克森悖論
為了簡化起見,我們假設這個醫院只治療兩種疾病:糖尿病和膽囊炎。然後畫一個平面直角座標系:橫座標表示他患有糖尿病的嚴重程度,縱軸表示患有膽囊炎的嚴重程度,再把每一個人按照兩種疾病的輕重畫在座標系中。
如果我們對全體人羣進行統計,就會發現糖尿病和膽囊炎並沒有相關性。但是如果只對醫院中的患者進行統計,就會出問題。如果病人的糖尿病或者膽囊炎問題比較輕,病人就不需要住院,所以也不會被統計到。來到醫院的病人要麼是糖尿病,要麼是膽囊炎,要麼二者兼有。所以,我們需要把圖像左下方的點都去掉,他們不在我們統計的範圍內,我們只會統計到這條線右上方的點。這回糖尿病和膽囊炎就表現出負相關了。不患有糖尿病的人,更有可能患有膽囊炎,而患有糖尿病的人,膽囊炎的比例就會下降了。
可見伯克森悖論是一種統計偏差,因為我們忽略了身體健康而沒有入院的人,只在醫院的病人中進行統計,這些病人一定患有這樣或者那樣的疾病。所以,如果患者沒有糖尿病,那麼就一定患有其他疾病,比如膽囊炎,這就形成了糖尿病與膽囊炎負相關的假象。
參考資料
  • 1.    Joseph Berkson.Limitations of the Application of Fourfold Table Analysis to Hospital Data:Biometrics Bulletin,1946:Vol. 2, No. 3, pp. 47-53