複製鏈接
請複製以下鏈接發送給好友

單變量分析

鎖定
單變量分析主要集中在單變量的描述和統計推斷兩個方面,在於用最簡單的概括形式反映出大量樣本資料所容納的基本信息,描述樣本數據中的集中或離散趨勢,單變量統計推斷則是從樣本資料來推斷總體的情況,主要包括區間估計和統計假設檢驗
中文名
單變量分析
外文名
univariate analysis
包含方式
單變量描述統計和單變量推論統計

單變量分析基本概念

描述單變量的樣本集中趨勢,常用的統計描述方式有均值眾數中位數區間估計是指在一定的置信度範圍下對總體的取值區間的估計。統計假設是先對總體的某個參數做出假設,然後用樣本統計量來驗證假設,從而決定對假設的接受或拒絕。
數據分析首先從單變量分析開始。單變量分析的目的是,通過對數據的整理、加工、組織和展示,並計算反應數據的集中趨勢離散程度的指標,對變量分佈的特徵和規律進行刻畫和描述。不同類型的變量需要使用不同的方法和指標。
單變量分析又稱“單變量統計分析”,就是在一個時間點上對某一變量所進行的描述和統計,因而又可以分為單變量描述統計和單變量推論統計兩種方式。 [1] 

單變量分析兩種方式

單變量分析單變量描述統計

單變量描述統計,就是“用最簡單的概括形式反映出大量數據資料所容納的基本信息” [2]  。在運用單變量描述統計進行資料的分析研究時,可以從以下三個方面進行。
(一)確定頻數分佈頻率分佈
頻數指的是在各個類別中分佈的數據個數,而將各個類別及其相應的頻數一一列出來,就是頻數分佈。通常情況下,頻數分佈是以頻數分佈表的形式出現的。
頻率分佈,就是在一組數據中,不同取值的頻數相對於總數的比率分佈情況,通常用百分比表示。與頻數分佈一樣,頻率分佈也是以頻率分佈表的形式出現的。
頻率分佈表是不同的類別在總體中的相對比重,頻數分佈表則是不同的類別在總體中的絕對比重。
(二)進行集中趨勢分析
所謂集中趨勢分析,就是用一個代表值或典型值對一組數據的一般水平進行反映,或是對這組數據向這個代表值或典型值集中的情況進行反映。由於集中趨勢分析對大量數據的共性進行了科學抽象,能夠對被研究對象在具體條件下的一般水平進行説明,因而在單變量描述統計中的應用非常廣泛。
進行集中趨勢分析時,可以通過計算眾數中位數平均數三種方式來實現。
(三)進行離散趨勢分析
離散趨勢分析是指用一個特別的數值將一組數據相互之間的離散程度反映出來。離散趨勢分析可以通過計算全距異眾比率標準差離散係數等方式來實現。

單變量分析單變量推論統計

在實際的社會調查中,普查的方式使用很少,通常是使用抽樣調查的方式。而單變量推論統計的目的,就是通過樣本調查中所得到的數據資料,對總體的狀況進行推斷。可以從區間估計和假設檢驗兩個方面進行。
(一)進行區間估計
區間估計是指在一定的標準差範圍內設立一個置信區間,然後聯繫這個區間的可信度將樣本統計值推論為總體參數值。它的實質是在一定的置信度下,用樣本統計值的某個範圍來“框”住總體的參數值,即以兩個數值之間的間距來估計參數值。 [3] 
(二)進行假設檢驗
假設檢驗就是先對總體的某一參數作出假設,然後用樣本的統計量去進行驗證,以決定假設是否為總體所接受。 [2] 
參考資料
  • 1.    湯秀麗.社會調查理論與方法:中國水利水電出版社,2014
  • 2.    風笑天.現代社會調查方法:華中科技大學出版社,2009年:196頁
  • 3.    吳增基,吳鵬森,蘇振芳.現代社會調查方法.上海:上海人民出版社,2009年:第223頁