-
單因素方差分析
鎖定
試驗中要考察的指標稱為試驗指標,影響試驗指標的條件稱為因素,因素所處的狀態稱為水平,若試驗中只有一個因素改變則稱為單因素試驗,若有兩個因素改變則稱為雙因素試驗,若有多個因素改變則稱為多因素試驗。方差分析就是對試驗數據進行分析,檢驗方差相等的多個正態總體均值是否相等,進而判斷各因素對試驗指標的影響是否顯著,根據影響試驗指標條件的個數可以區分為單因素方差分析、雙因素方差分析和多因素方差分析。
- 中文名
- 單因素方差分析
- 外文名
- one-way analysis of variance
- 所屬學科
- 數學(統計學)
- 相關概念
- 單因素試驗,方差分析等
- 簡 介
- 單因素試驗中的方差分析
目錄
單因素方差分析基本概念
在方差分析中,我們將要考察的對象的某種特徵稱為試驗指標,影響試驗指標的條件稱為因素,因素可分為兩類,一類是人們可以控制的(如原材料、設備、學歷、專業等因素);另一類人們無法控制的(如員工素質與機遇等因素)。下面所討論的因素都是指可控制因素。每個因素又有若干個狀態可供選擇,因素可供選擇的每個狀態稱為該因素的水平。如果在一項試驗中只有一個因素在改變,則稱為單因素試驗;如果多於一個因素在改變,則稱為多因素試驗。因素常用大寫字母A,B,C,…來表示,因素A的水平用
來表示,下面對單因素試驗進行討論
[1]
。
單因素方差分析假設前提
設單因素A具有r個水平,分別記為
,在每個水平
下,要考察的指標可以看成一個總體,故有r個總體,並假設:
(1)每個總體均服從正態分佈,即
;
(2)每個總體的方差σ2相同;
(3)從每個總體中抽取的樣本
相互獨立,i=1,2,…,r。
水平 | ||||
樣本 | ||||
樣本和 | ||||
樣本均值 | ||||
總體 | ||||
總體均值 |
那麼,要比較各個總體的均值是否一致,就是要檢驗各個總體的均值是否相等,設第i個總體的均值為μi,則
假設檢驗為
;
備擇假設為
不全相等。
在水平
下,進行
次獨立試驗,得到試驗數據
,記數據的總個數為
。
由假設有
(
未知),即有
,故
可視為隨機誤差。記
,從而得到如下數學模型:
方差分析的任務:
(1)檢驗該模型中r個總體
的均值是否相等;
(2)作為未知參數的估計。
為了更仔細地描述數據,常在方差分析中引入總平均和效應的概念,將各均值的加權平均值記為μ,即
其中
再引入
δi表示在水平Ai下總體的均值μi與總平均μ的差異,稱其為因子A的第i個水平Ai的效應。易見,效應間有如下關係式
利用上述記號,前述數學模型可改寫為
而前述檢驗假設則等價於
:不全為零.
這是因為當且僅當時,,即。
單因素方差分析偏差平方和及其分解
為了使造成各隨機變量Xij之間的差異的大小能定量表示出來,引入:
記在水平Ai下樣本和為,其樣本均值為因素A下的所有水平的樣本總均值為
為了通過分析對比產生樣本
之間差異性的原因,從而確定因素A的影響是否顯著,我們引人偏差平方和來度量各個體間的差異程度
因ST能反映全部試驗數據之間的差異,所以又稱為總偏差平方和。
如果H0成立,則r個總體間無顯著差異,也就是説因素A對指標沒有顯著影響,所有的Xij可以認為來自同一個總體,各個Xij間的差異只是由隨機因素引起的,若H0不成立,則在總偏差中,除隨機因素引起的差異外,還包括由因素A的不同水平的作用而產生的差異,如果不同水平作用產生的差異比隨機因素引起的差異大得多,就認為因素A對指標有顯著影響,否則,認為無顯著影響。為此,可將總偏差中的這兩種差異分開,然後進行比較。
記
則有下面的定理:
定理1(平方和分解定理)令,有
SE表示在水平Ai下樣本值與樣本均值之間的差異,它是由隨機誤差引起的,稱為誤差平方和或組內平方和。SA反映在每個水平下的樣本均值與樣本總均值的差異,它是由因素A取不同水平引起的,稱為因素A的效應平方和或組間平方和,ST=SE+SA式就是我們所需要的平方和分解式。
單因素方差分析SE與SA的統計特性
如果H0成立,則所有的Xij都服從正態分佈,且相互獨立,則有:
定理2
(1),且,所以為σ2的無偏估計;
(2),且,因此為σ2的無偏估計;
(3)SE與SA相互獨立;
(4)。