-
遺漏值
鎖定
遺漏值是統計人員和資料獲取人員所不願意見到的,但也是無法避免的。遺漏值的表現形式有三種:完全隨機遺漏、隨機遺漏、非隨機遺漏。在進行敏感問題的調查時,遺漏值問題就比較突出,比如問卷中涉及了家庭收入、婚外性伴侶等問題時,許多受訪者都會遺漏來避免尷尬。
- 中文名
- 遺漏值
- 外文名
- Omission value
- 特 點
- 不願意見到但無法避免
- 表現方式
- 完全隨機、隨機、非隨機遺漏
- 處理方法
- GRI、C5.0和APRIORI等
- 應用領域
- 量化研究與統計分析
遺漏值定義
遺漏值是統計人員和資料獲取人員所不願意見到的,但也是無法避免的。在大型的資料採集任務中,即使有非常嚴格的品質控制,含有缺項、漏項的記錄也可能很容易的達到10%。
[1]
在處理遺漏值方面,有些建模技巧比其他通常的方法要好,比如:GRI、C5.0和APRIORI就能很好地處理在類型節點上被明確地確定為遺漏的值。
[2]
遺漏值相關名詞
遺漏值遺漏次數
遺漏的出現從發生到結束計算遺漏次數為1次,那麼遺漏統計圖表內的遺漏次數就是指統計期內的所有發生的遺漏次數的總和。
遺漏值最大遺漏
最大遺漏是指統計期內的一次連續遺漏出現的最大數值。
遺漏值遺漏N次統計
遺漏N次統計:統計期內所有的出現遺漏1次的次數總和,稱為遺漏1次;統計期內所有的出現遺漏2次的次數總和,稱為遺漏2次,其他以此類推。
遺漏值最佳遺漏範圍
最佳遺漏範圍,簡單地説就是在這個區間之內某個指標遺漏終止並且反轉出現的概率非常高,等於或大於80%。
遺漏值遺漏值判斷法
首先,遺漏值的數量評估法,主要目的在檢驗受測者是否抗拒或難以回答某一個題目,導致遺漏情形的發生,過多的遺漏情形表示該題目不宜採用。至於遺漏人數達到多少就必須將該題刪除,並沒有絕對的標準,研究者必須從各題目的遺漏情況來相對比較檢視,如果某一題遺漏人數顯然比其他題目為多,即有詳加檢視的必要。
遺漏值判斷法適合於設計量表之初使用,因為測驗的題目尚未經過實際的施測,因此容易發現具有大量遺漏的題目。在量表發展的中後期時,題目已經經過修飾與調整,遺漏現象應不至於大量發生,即使發生了,也應屬於隨機性遺漏。
[3]