複製鏈接
請複製以下鏈接發送給好友

有序分類變量

鎖定
有序分類變量,是指其取值的各類別之間存在着程度上的差別,給人以“半定量”的感覺,因此也稱為等級變量 [1]  。是根據取值特徵而分類的一種定性變量
中文名
有序分類變量
外文名
ordinal categorical variable
別    名
等級變量
學    科
統計學

目錄

有序分類變量背景

變量(variable)是觀測單位的某種特徵或屬性,變量的觀測值就是所謂的變量值,有時也稱數據或資料(data)。更準確地講,數據或資料是由具有若干變量值的觀測單位所組成的。例如在調查中常規問及的問題:你年齡多大?是什麼學歷?結婚了嗎?有工作嗎?家裏有多少人?對應的變量就是:年齡,學歷,婚姻狀況,就業情況,家庭人口數。 [2] 
分類變量可分為無序變量和有序變量兩類。
無序分類變量(unordered categorical variable)是指所分類別或屬性之間無程度和順序的差別。,它又可分為①二項分類,如性別(男、女),藥物反應(陰性和陽性)等;②多項分類,如血型(O、A、B、AB),職業(工、農、商、學、兵)等。對於無序分類變量的分析,應先按類別分組,清點各組的觀察單位數,編制分類變量的頻數表,所得資料為無序分類資料,亦稱計數資料。

有序分類變量含義

有序分類變量(ordinal categorical variable)是統計學中,根據取值特徵而分類的一種定性變量。所謂有序分類變量,是指其取值的各類別之間存在着程度上的差別,給人以“半定量”的感覺,因此也稱為等級變量,如學歷(文盲、小學、初中、高中、大學、研究生等)。 [2]  對於有序分類變量,應先按等級順序分組,清點各組的觀察單位個數,編制有序變量(各等級)的頻數表,所得資料稱為等級資料。

有序分類變量示例

有序多分類變量是很常見的變量形式,通常在變量中有多個可能會出現的取值,各取值之間還存在等級關係。比如高血壓分級(0=正常,1=正常高值,2=1級高血壓,3=2級高血壓,4=3級高血壓)、尿蛋白水平(0=-,1=±,2=+,3=++,4=+++)等等。與無序多分類變量不同,有序多分類變量的各個選項直接呈現向一個方向遞增或遞減的關係。
當Logistic迴歸中需要將有序多分類變量代入自變量X時,我們如何處理呢?通常大家會習慣性的將有序多分類變量直接代入。這當然不是不對,但是有個前提條件,就是該有序多分類變量每改變一個單位的時候,結局風險增加倍數相同。每改變一個等級,對結局貢獻相同或相似時,可以簡單的用個例子和圖表示一下。比如我們關心研究對象是否接受治療,也就是研究對象中,有一部分人出現了“接受治療”這個結局。可能影響結局的變量之一是教育程度 [3] 
教育程度與是否接受治療關係圖 教育程度與是否接受治療關係圖
參考資料
  • 1.    李康. 有序分類數據迴歸模型及醫學應用[D]. 第四軍醫大學, 1991.
  • 2.    李曉松,張菊英,郝元濤,王彤.醫學統計學:高等教育出版社,2014:004
  • 3.    高歌, 張明芝. 多分類有序反應變量Logistic迴歸及其應用[J]. 同濟大學學報(自然科學版), 2003, 31(10):1237-1241.