反饋

中誤差

鎖定

中誤差是衡量觀測精度的一種數字標準，亦稱“均方根差”。在相同觀測條件下的一組真誤差平方和的平均值的平方根^[5] 。因真誤差不易求得，所以通常用最小二乘法求得的觀測值改正數來代替真誤差。它是觀測值與真值偏差的平方和觀測次數n比值的平方根。

中誤差不等於真誤差，它僅是一組真誤差的代表值。中誤差的大小反映了該組觀測值精度的高低，因此，通常稱中誤差為觀測值的中誤差。

中文名: 中誤差
外文名: root mean square error;RMSE
別名: “均方根差”
定義: 衡量觀測精度的一種數字標準

代替值: 真值只能用最或然值
性質: 描述代數誤差
方法: 最小二乘法
計算: 觀測值與真值偏差平方和

中誤差採用原因

中誤差代替值

在實際測量中，觀測次數n總是有限的，真值只能用最或然值（常用多次觀測的平均值）來代替。

中誤差標準差

標準差（Standard Error）是方差（Variance）的平方根，，是數據偏離均值的平方和平均後的方根，用σ表示。對一組測量中的特大或特小誤差反映非常敏感，能夠很好地反映出測量結果波動大小。這正是標準差在工程測量中廣泛被採用的原因。^[1]

中誤差產生原因

由某種固定的原因造成的，使測定結果偏高或偏低，重複測定時會重複出現，系統誤差的大小几乎是一個恆定值，因而又被稱之為恆定誤差或可測誤差。它產生的原因有以下幾點：

中誤差系統誤差

儀器誤差：儀器本身不夠精度或未經校正所引起的，如天平、砝碼和量器刻度不夠準確。為避免引起儀器誤差，我們應對所使用的量器及天平進行校正。

試劑誤差：由於試劑不純或蒸餾水中含有微量雜質所引起的誤差。消除方法可進行空白實驗，在不加試樣的情況下，按照被測試樣的分析步驟和條件進行分析，得到的結果為空白值，從試樣的分析結果中減去“空白值”就可以得到更接近真實含量的分析結果。

方法誤差：這種誤差是由於分析方法本身所造成的。如重量分析時，由於沉澱的溶解造成損失或因吸附某些雜質而產生誤差；或滴定分析中，因為反應不完全或干擾離子的影響，以及滴定終點和等當點不符合等。

操作誤差：正常操作條件下，由於分析人員掌握操作規程與正確控制條件稍有出入而引起的誤差。如滴定管讀數時偏高或偏低，對某種顏色的變化辨別不夠敏鋭等所造成的誤差。

中誤差偶然誤差

偶然誤差也稱不定誤差，它是由某些偶然因素：測定時環境的温度、濕度氣壓的微小波動，或由於外界條件的影響而使安放在操作枱上的天平受到微小的震動所引起的。其影響有時大、有時小。因而偶然誤差難以察覺，也難以控制。

隨着測定次數的增加偶然誤差的算術平均值將逐漸接近於零。因而有必要時，應多次測定，但並非實驗次數越多越好，這樣只浪費更多的人力、物力。一般測定中，做2~3次平行測定可達到不超過規定誤差的目的。

中誤差粗差

粗差即粗大誤差，是指比在正常觀測條件下所可能出現的最大誤差還要大的誤差，通俗地説，粗差要比偶然誤差大上好幾倍。例如觀測時大數讀錯，計算機輸入數據錯誤，航測像片判讀錯誤，控制網起始數據錯誤等。這種錯誤或誤差，在一定程度上可以避免。但在使用現今的測量技術如全球定位系統（GPS）、地理信息系統（GIS）、遙感（RS）以及其他高精度的自動化數據採集中，經常是粗差混入信息之中，識別粗差源並不是簡單方法可以達到目的的，需要通過數據處理方法進行識別和消除其影響。^[2]

中誤差計算公式

測量誤差按其對測量結果影響的性質，可分為：

一.系統誤差（system error）

1.定義：在相同觀測條件下，對某量進行一系列觀測，如誤差出現符號和大小均相同或按一定的規律變化，這種誤差稱為系統誤差。

2.特點：具有積累性，對測量結果的影響大，但可通過一般的改正或用一定的觀測方法加以消除。

二.偶然誤差（accident error）

1.定義：在相同觀測條件下，對某量進行一系列觀測，如誤差出現符號和大小均不一定，這種誤差稱為偶然誤差。但具有一定的統計規律。

2.特點：

（1）　具有一定的範圍。

（2）　絕對值小的誤差出現概率大。

（3）　絕對值相等的正、負誤差出現的概率相同。

（4）　數學期限望等於零。即：

誤差概率分佈曲線呈正態分佈，偶然誤差要通過的一定的數學方法（測量平差）來處理。此外，在測量工作中還要注意避免粗差（gross error）（即：錯誤）的出現。^[3]

中誤差衡量指標

測量上常見的精度指標有：中誤差、相對誤差、極限誤差。

一.中誤差

方差

——某量的真誤差，∑——求和符號。

規律：標準差估值（中誤差m）絕對值愈小，觀測精度愈高。

在測量中，n為有限值，計算中誤差m的方法，有：

1.用真誤差（true error）來確定中誤差——適用於觀測量真值已知時。

真誤差Δ——觀測值與其真值之差，有：

標準差

中誤差（標準差估值）， n為觀測值個數。

2.用改正數來確定中誤差（白塞爾公式）——適用於觀測量真值未知時。

V——最或是值與觀測值之差。一般為算術平均值與觀測值之差，即有：

二.相對誤差

1.相對中誤差

2.往返測較差率K

中誤差算法研究

中誤差研究背景

整合和更新來自不同來源、不同比例尺、不同時間段的表示同一地圖目標的地理數據越來越引起人們的關注。空間面狀地物和自然要素在很多地圖表示中都佔有很大的比例，可以用來表示房屋、土地利用、面狀水體和植被等，它是地圖表達和地圖使用者關心的主要內容，本文主要討論多尺度空間面實體的匹配。空間面實體數據主要有空間特徵和屬性特徵，空間特徵主要包括幾何特徵和拓撲特徵，幾何特徵主要包括重心位置、中心位置、面積大小和邊界，拓撲特徵主要包括面積重疊度、屬性成分關聯度；屬性特徵主要是使用實體的屬性信息。

空間面匹配，國外學者作過大量的研究。在幾何匹配方面，文獻提出面質心結合多種匹配檢驗規則的幾何匹配方法，通過面實體柵格化後收縮來確定質心，然後將其矢量化，用點在面內的規則進行粗匹配，再結合多邊形的面積A和麪密度C進行匹配檢驗，最終判斷匹配情況。文獻通過匹配面的邊界來計算邊界的距離來檢測不同時間點的空間面的明顯不同，該方法適合於明確的邊界的面數據，不適合於大量變化的地形數據。文獻提出一種基於鄰近關係確定面與面大致的關係，輔助Hausdorff距離來區分面之間的匹配關係，來確定面之間的共軛點，可以用來匹配面數據。語義信息主要取決於空間數據模型和屬性數據模型，語義信息可以用來輔助匹配關係。文獻提出一種基於知識的非空間屬性數據匹配策略，通過計算屬性項的相似度值以確定匹配實體。文獻提出一種基於語義和結構的相似性的屬性數據匹配方法，來匹配正式和非正式的地理數據。

國內學者也作了大量的工作，文獻提出基於模糊拓撲關係分類的匹配方法，該方法計算形態距離比較麻煩，只適合於房屋等人工地物。文獻在擴展文獻的概率論匹配算法的基礎上提出一種多準則融合算法，對於面數據，主要採用重心S和麪的重疊度A指標，指標的權重是由專家經驗來獲取的。文獻提出基於相似性的面實體匹配方法，該方法適合於相似比例尺的地圖數據的匹配。文獻提出了基於成分關聯區域相似度的面實體模糊匹配算法，但模糊分類比較困難，不適合多比例尺數據。文獻也提出一種基於幾何特徵的多尺度的面實體匹配方法，這也是一種基於相似性的匹配方法，需要確定各個指標的權重。面匹配的算法還存在一些問題。首先，如何確定每個指標的閾值或者權重。需要確定的閾值主要有：緩衝區半徑、Hausdorff距離、形態距離、屬性相似性。指標的閾值

都與比例尺密切相關。概率匹配、相似性匹配雖然都不需要閾值，但是每個指標的權重在不同的比例尺下是不相同的，如何確定權重也是一個難點。面數據由點組成，利用點的精度信息來匹配空間數據，文獻等首先使用點距離信息確定匹配，緩衝區大小根據地圖的點位精度而定。文獻也利用地圖中點的誤差來實現點的匹配，但是點位誤差很難確定。其次，如何確定面的M∶N關係。大多都匹配算法都是基於文獻提出的雙向匹配策略，但是其方法只適合於點匹配。文獻提出用面數據的鄰近關係，利用聚集算法可以確定面與面數據之間的多對多的關係的大致關係，再根據Hausdorff距離確定數據之間的精確關係，該距離沒有考慮多尺度情況下的匹配，需要統計數據才能確定範圍。最後，很難確定數據匹配不確定性的範圍，錯誤信息的範圍對人工交互的過程有重要的影響。文獻提出一種基於證據理論來匹配點目標，但是計算每個指標的信任度仍然是一個經驗的過程。根據製圖誤差理論，中誤差作為數據質量和地圖綜合的指標，而且其大小範圍隨着比例尺的變化而變化，可以有效地應用於多尺度空間數據的匹配，並可以確定數據不確定性的範圍。本文在文獻提出的鄰近關係匹配的基礎上，提出一種基於中誤差和鄰近關係的多尺度空間面實體匹配算法，不僅可以確定準確的數據範圍，同時可以確定不確定性的匹配範圍，同時考慮了不同比例尺下製圖綜合的影響，可以有效應用於多尺度面實體匹配。

中誤差算法原理

（1）中誤差

中誤差是衡量觀測精度的一種數字標準，亦稱“標準差”或“均方根差”。它是觀測值與真值偏差的平方和與觀測次數n比值的平方根。點位誤差表示點位的觀測值與真值之差，製圖規範中的點位誤差用地物點和控制點的位置中誤差來衡量。點位誤差概率分佈曲線呈正態分佈或類正態分佈。

點誤差的大小通過中誤差來衡量，其概率分佈滿足正態分佈的點位誤差表示99%以上的點都分佈2倍中誤差以內，中誤差的大小隨着數據源的不同而變化，但是傳統的規範製圖中規定同比例尺中誤差的範圍是固定的，該範圍隨着比例尺的變大而變大，中誤差σ必須滿足-σ_max≤σ≤σ_max。

（2）鄰近關係

對於多對多匹配關係也是一個匹配的難點問題，引入鄰近關係來完成面與面之間最終的匹配。M：N匹配實際上是一個聚類問題，表示分別用M面和N面來表示同一個地物目標。文獻提出利用鄰近關係來合併分散的面片，文獻在此工作的基礎上用面與面之間的疊置關係來確定面之間關係。前面可以通過計算中誤差距離可以初步確定要素的對應關係，可以充分利用上一步匹配過濾之後的匹配成果來完成M：N匹配。對於原始要素S對應的候選集合的每個要素，可以反向搜索每個候選要素的對應的疊置的集合，並將該要素添加到“源要素”集中，構建M要素集合和N要素集合，最終完成M：N匹配。

中誤差研究結論

本文根據製圖誤差理論，利用空間數據的中誤差範圍信息和數據鄰近關係來匹配多尺度空間面實體數據。利用中誤差信息可以有效地提高初始搜索到準確率，首先確定1:0以及1:M關係，通過建立鄰近關係矩陣來確定數據的多對多關係，並通過擴大範圍確定相對低一些的信任度的匹配關係，接着將這些關係進行人工交互處理，最終完成整個匹配的過程。和已有的方法比較，本算法具有良好的準確度和效率，試驗結果表明該方法具有有效性和實用性。

本算法有以下幾個方面的特點：首先，不需要專家經驗或統計學習的方法確定每個指標的閾值。中誤差範圍只是由匹配的目標尺度決定，不受地圖綜合和製圖方法的影響。其次，依據製圖誤差理論，可以適用於各種來源不同比例尺的地理數據。再次，算法從高信任度的匹配數據來推理相對信任度的數據，同時將低信任度交給用户交互，進一步提高了匹配的效率，更符合數據生產的過程。最後，本文的方法適用於嚴格的製圖規範下的多尺度地理數據的匹配，不一定適用於沒有按照製圖規範製作的志願者地理數據。志願者地理信息作為空間數據的一個新的重要的來源，如何有效地整合志願地理數據和傳統的數據，是下一步研究的方向。^[4]

參考資料