-
偽相關
鎖定
- 中文名
- 偽相關
- 外文名
- spurious relationship
- 領 域
- 統計學名詞
- 學 科
- 數理科學
- 別 名
- 偽關係
偽相關簡介
偽相關(Spurious correlation)的定義最早由Karl Spearman提出,用以描述兩組由絕對測量值轉換而來的比例數據之間的相關,如百分比、千分比等。Spearman舉了一個簡單的例子:x, y, z為三組彼此間不相關的數據,但將前兩組數據與z相比後,將得出x/z與y/z中存在顯著相關(如圖1)。在另一張圖(圖2)中,我們以藍色和紅色分佈標示較大或較小的分母z,會發現z較大的情況下,x/z與y/z較小,分佈於左下,而較小的z對應着數值更大的x/z與y/z,可以説作為分母的z本身的影響,造成了x/z與y/z之間的線性分佈,即使這三組數據間不存在任何關係。
偽相關偽相關定義
偽相關(spurious relationship),又稱偽關係、虛假關係,顧名思義是虛假的“關係”,但此處的關係指的是因果,而非相關,即兩因素間本不存在因果關係,卻被誤認為存在。這種錯誤出現的原因包括忽略了第三方潛在因素的影響,如前文介紹偽相關的例子,地球自轉對太陽落山與月亮上山的影響。嚴格意義上説,因為偽關係描述的是因果,如兩事物間的本身不被認為有因果關係,那也不會是偽關係。根據一些學者的説法,偽關係是相關向因果邁進的必經階段,排除了偽關係因素的相關研究才可能進一步探索因果關係。
對於偽關係的剔除目前主要有兩種方法:實驗與純統計檢驗。前者通過儘可能控制其它潛在影響因素,操縱其中某一變量並觀測另一變量的變化來明確兩者間的關係;後者則更多應用於一些無法付諸實驗而採用觀測數據的學科,如經濟學。
偽相關相關係數與偽相關
兩個變量可能會受第三者影響,從而在其間得出誤導性的相關係數。當變量 A 和 B 有相關時,有幾種可能:
- A導致B;
- B導致A;
- C導致A和B。
第三種情況就會發生偽相關。如果在統計上控制住C變數,A和B就不再相關。
偽相關迴歸現象與偽相關
當迴歸分析中B隨A變化時,實際因果關係可能如下:
- C → A → B;
- A → C → B;
- C → A;C → B。
偽相關示例
例一
統計研究發現,冰淇淋銷量最高的時候,就是公共泳池的溺水事故發生得最多的時候。
然而,有可能熱浪造成冰淇淋銷量和公共泳池的溺水事故增多。若視冰淇淋的銷量或遇溺事故為對方的成因,可能就被偽關係誤導了。
例二
荷蘭的統計數字顯示,在一連串的春季中,鸛鳥巢的數目與人類嬰兒出生數目之間呈現正相關。
偽相關實驗
偽相關一詞常用於統計學上,特別是在實驗的測定結果上。實驗一般用以檢測如“X → Y”的因果關係。然而兩者的共同因素(W → X & Y)可造成非因果關係的相關。另外,如“X → W → Y”形的中介變數若沒有察覺出來的話,兩者非直接的關係便會看似是直接的。因此,除非能排除偽關係的可能性,否則實驗得出的相關並不代表因果關係。
實際上,下列三個條件都要成立,才可以得出X導致Y的結論:
- X發生在Y之前;
- 若X不發生則Y也不發生;
- 若X發生則Y一定發生。
如果上面三項中任何一項不符合,就可以確認出偽關係。
- 詞條統計
-
- 瀏覽次數:次
- 編輯次數:12次歷史版本
- 最近更新: 安好八月十月