複製鏈接
請複製以下鏈接發送給好友

分位數

鎖定
分位數(Quantile),亦稱分位點,是指將一個隨機變量概率分佈範圍分為幾個等份的數值點,常用的有中位數(即二分位數)、四分位數百分位數等。
中文名
分位數
外文名
Quantile
分    類
二分位數;四分位數;百分位數
領    域
數理科學

目錄

分位數定義

分位數指的就是連續分佈函數中的一個點,這個點對應概率p。若概率0<p<1,隨機變量X或它的概率分佈的分位數Za,是指滿足條件p(X≤Za)=α的實數 [1] 

分位數常見分類

1.二分位數
對於有限的數集,可以通過把所有觀察值高低排序後找出正中間的一個作為中位數。如果觀察值有偶數個,則中位數不唯一,通常取最中間的兩個數值的平均數作為中位數,即二分位數。
一個數集中最多有一半的數值小於中位數,也最多有一半的數值大於中位數。如果大於和小於中位數的數值個數均少於一半,那麼數集中必有若干值等同於中位數。
計算有限個數的數據的二分位數的方法是:把所有的同類數據按照大小的順序排列。如果數據的個數是奇數,則中間那個數據就是這羣數據的中位數;如果數據的個數是偶數,則中間那2個數據的算術平均值就是這羣數據的中位數。
2.四分位數
四分位數(Quartile)是統計學分位數的一種,即把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值就是四分位數。
1)第一四分位數(Q1),又稱“較小四分位數”,等於該樣本中所有數值由小到大排列後第25%的數字;
2)第二四分位數(Q2),又稱“中位數”,等於該樣本中所有數值由小到大排列後第50%的數字;
3)第三四分位數(Q3),又稱“較大四分位數”,等於該樣本中所有數值由小到大排列後第75%的數字。
第三四分位數與第一四分位數的差距又稱四分位距
3.百分位數
百分位數統計學術語,如果將一組數據從小到大排序,並計算相應的累計百分位,則某一百分位所對應數據的值就稱為這一百分位的百分位數。運用在教育統計學中,例如表現測驗成績時,稱PR值

分位數應用

分位數迴歸思想的提出至今已經有近30多年了,經過這近30多年的發展,分位數迴歸在理論和方法上都越來越成熟,並被廣泛應用於多種學科中。它對於實際問題能提供更加全面的分析,無論是線性模型還是非線性模型,分位數迴歸都是一種很好的工具,它對一般迴歸模型做了有益的補充。
分位數迴歸是對以古典條件均值模型為基礎的最小二乘法的延伸,它用幾個分位函數來估計整體模型。分位數迴歸法的特殊情況就是中位數迴歸(最小一乘迴歸),用對稱權重解決殘差最小化問題,而其他條件分位數迴歸則需要用非對稱權重解決殘差最小化 [2] 
分位數迴歸採用加權殘差絕對值之和的方法估計參數,其優點體現在以下幾方面:首先,它對模型中的隨機擾動項不需做任何分佈的假定,這樣整個迴歸模型就具有很強的穩健性;其次,分位數迴歸本身沒有使用一個連接函數來描述因變量的均值和方差的相互關係,因此分位數迴歸有着比較好的彈性性質;第三,分位數迴歸由於是對所有分位數進行迴歸,因此對於數據中出現的異常點具有耐抗性;第四,不同於普通的最小二乘迴歸,分位數迴歸對於因變量具有單調變換性;最後,分位數迴歸估計出來的參數具有在大樣本理論下的漸進優良性。
參考資料
  • 1.    [1] 裴耀.分位數迴歸及其應用[C]. 華中師範大學,2014
  • 2.    [2] 陳建寶;丁軍軍.分位數迴歸技術綜述[J].統計與信息論壇 ,2008,03