反饋

分半信度

分半信度（split-half reliability）是指在測驗後將測驗項目分成相等的兩組（兩半），通常採用奇偶分組方法，即將測驗題目按照序號的奇數和偶數分成兩半，然後計算兩項項目分之間的相關。分半信度相關越高表示信度高，或內部一致性程度高。它是常用信度檢驗方法之一，反映了測驗項目內部一致性程度，即表示測驗測量相同內容或特質的程度。

中文名: 分半信度
外文名: split-half reliability
所屬類別: 信度

內容: 測驗項目內部一致性程度
用途: 評估信度
常用方法: 奇偶分半法

分半信度含義

分半信度（split-half reliability）是指將一個測驗分成對等的兩半後，所有被試在這兩半上所得分數的相關。^[1]

分半信度是一種接近複本信度並更為廣泛運用的信度評估方法。該方法通常將測驗一分為二，劃分為兩個對等的版本。如果通過隨機的方式將測驗一分為二，就會得到虛擬的複本測驗，儘管該版本不具備在測驗細目表中所要求的平行項目，但是兩個版本中的項目是由隨機分配獲得的，由此避免了系統誤差的出現。^[2]

分半信度計算與校正

假定兩半測驗等值（方差相等）

1）計算：

為減少系統誤差，對分半信度的測量多采用奇偶分半法。即按照題目的奇數項和偶數項將測驗分成兩半，此時，同一組受測者身上所獲得的兩部分分數的相關（r_oe）就是半個測驗的複本信度係數。^[3]

每個被試在奇偶分半法下，都會得到兩個分數，兩個分半測驗各有一個得分，通過皮爾遜積矩相關法得到兩個分半測驗的相關係數。但是得到的相關係數並非測驗的信度，而是測驗一半的信度，因此不能採用該相關係數，需要對其進行校正，從而得出整個測驗的信度值。^[2]

2）校正：

斯皮爾曼—布朗公式（Spearman-Brown），計算公式如下：

式中，r_SB表示經過斯皮爾曼—布朗公式校正之後整個測驗的信度指標，r_hh表示分半信度。^[4]

假定兩半測驗不等值

假定兩半測驗不等值，即方差齊性檢驗呈不齊性時，可以採用以下方法：

1）弗朗那根公式：

在式中，

和

分別表示兩半測驗分數的變異數，

為測驗總分的變異數，r為信度值。^[5]

2）盧倫公式：

其中，

為兩半測驗分數之差的變異數，

為測驗總分的變異數，r為信度值。^[5]

説明

測驗信度值大於兩個分半測驗之間的相關係數這個事實並沒有任何意義，這只是證明了測驗含有的項目越多其信度越大的普遍定律，因為問卷中的項目越多我們就可以得到越多的信息。只要有足夠的時間實施測驗並且能得到被試的配合，我們就想盡可能地增加測驗項目的數量。當然，這隻能在測驗項目擁有一定鑑別力，且能對總體測驗分數產生真正貢獻的情況下運用。^[2]

分半信度優勢與不足

分半信度優勢

1）降低難度，減少成本

在實際操作過程中，需要針對同一個樣本進行兩次測量的難度較大，而成本也會比較高。在這種情況下，分半信度可能就是唯一的選擇了。^[4]

2）彌補重測信度的不足

在某些特殊的情況下使用重測信度並不合適。比如，有些能力測驗可能會產生很大的練習效應，尤其是作為一個標準化的測驗，必須在測驗介紹後給受測者相應的反饋。由於這樣的練習效應的影響很大，且不同個體所受的影響也不同，因此在第二次測量中得到的名次排列情況只存在着中等程度的相關。若針對這樣的情況，重測信度可能會產生誤導，導致重測信度偏低。此外，若需要測量的心理特徵波動很大（如：心境），採用重測信度的方法也可能對測驗的信度進行低估。^[4]

3）信度較高

誤差的主要來源是題目本身，而時間因素並不對分半信度產生影響。因此其信度低是由於測驗兩半之間題目內容取樣的不同造成的。因為時間因素並不影響分半信度，所以這種方法所得到的信度往往較高。^[1]

分半信度劣勢

1）分半困難

在使用分半信度時，最大的挑戰在於將一個測量分成對等的兩半。對於絕大多數測驗而言（尤其是那些按題目順序編排的測驗而言），前面一半的題目會和後面的難度不一樣。因此無法對題目進行合理地分半，即便是採用奇偶分半法也會有不足。^[4]

如遇到有牽連的項目或一組解決同一問題的項目時，這些項目應放在同一半，否則將高估信度的值。^[5]

2）不適用於速度測驗

速度測驗是一種由簡單題目組成的，只要時間允許所有人都能做出所有題目的測驗。在這種純速度測驗中，奇偶數題的相關很高，但這只是一種假象。因為所有做過的題基本上都能夠做對，那麼個體的奇偶數題的得分則會相等。^[1]

3）數值不唯一

由於將一個測驗分成兩半的方法很多（如按題號的奇偶性分半、或按題目的難度分半、或按題目的內容分半等），所以，同一個測驗通常會有很多個分半信度值。^[1]

分半信度批評

儘管分半信度得到了廣泛的應用，但由於這樣的計算方式缺少精確性，還是受到了很大的質疑；

這樣的一種方法所得到的分半信度取決於將測驗分成兩半的方法，不同的分半方法可能得到的分半信度是不同的，而不能給出一個確定的信度指標。只要不同的分半方法將給出的分半信度是不同的，我們就沒有辦法確定到底使用哪個分半信度會比較好。（Cronbach,1951）

為什麼我們僅僅依賴於一種分半方式呢？為什麼我們不把所有可能的分半方法都嘗試一下，求出每一個分半信度，然後求其平均數作為信度的指標呢？^[4]

參考資料

1. 孫大強，鄭日昌．心理測量理論．北京：開明出版社，2012年10月北京第1版：56-58
2. （英）約翰·羅斯特，蘇珊·格倫博（著），李曉，繆晶晶（譯）．現代心理測量學（第3版）．北京：中國人民大學出版社，2011年5月第1版：53
3. （美）Lewis R. Aiken（著），張厚粲，黎堅（譯）．心理測量與評估．北京：北京師範大學出版社，2006年3月第1版：89
4. （美）羅伯特 J. 格雷戈裏（著），施俊琦，等譯．心理測量歷史、原理及應用（原書第5版）．北京：機械工業出版社，2013年1月第1版：91-93
5. 鄭日昌，蔡永紅，周益羣．心理測量學．北京：人民教育出版社，1999年9月第1版：45-46

分半信度的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：13次歷史版本
最近更新：康康萌萌km （2022-01-09）

1 含義
2 計算與校正
3 優勢與不足: 3.1 優勢; 3.2 劣勢
4 批評