複製鏈接
請複製以下鏈接發送給好友

數據元

鎖定
數據元( Data Element),也稱為數據元素,是用一組屬性描述其定義、標識、表示和允許值的數據單元,在一定語境下,通常用於構建一個語義正確、獨立且無歧義的特定概念語義的信息單元。數據元可以理解為數據的基本單元,將若干具有相關性的數據元按一定的次序組成一個整體結構即為數據模型。 [1] 
中文名
數據元
外文名
Data element
又    稱
數據類型
被認為
是不可再分的最小數據單元

數據元基本屬性

(1)標識類屬性:適用於數據元標識的屬性。包括中文名稱、英文名稱、中文全拼、內部標識符、版本、註冊機構、同義名稱、語境。 [2] 
(2)定義類屬性:描述數據元語義方面的屬性。包括定義、對象類詞、特性詞、應用約束。 [2] 
(3)關係類屬性:描述各數據元之間相互關聯和(或)數據元與模式、數據元概念、對象、實體之間關聯的屬性。包括分類方案、分類方案值、關係。 [2] 
(4)表示類屬性:描述數據元表示方面的屬性。包括表示詞、數據類型、數據格式、值域、計量單位。 [2] 
(5)管理類屬性:描述數據元管理與控制方面的屬性。包括狀態、提交機構、批准日期、備註。 [2] 

數據元元素組成

數據元一般由對象類、特性和表示3部分組成: [1] 
(1)對象類(Object Class)。是現實世界或抽象概念中事物的集合,有清楚的邊界和含義,並且特性和其行為遵循同樣的規則而能夠加以標識。 [1] 
(2)特性(Property)。是對象類的所有個體所共有的某種性質,是對象有別於其他成員的依據。 [1] 
(3)表示(Representation)。是值域、數據類型、表示方式的組合,必要時也包括計量單位、字符集等信息。
對象類是我們所要研究、收集和存儲相關數據的實體,例如人員、設施、裝備組織、環境、物資等。特性是人們用來區分、識別事物的一種手段,例如人員的姓名、性別、身高、體重、職務,坦克的型號、口徑、高度、長度、有效射程等。表示是數據元被表達的方式的一種描述。表示的各種組成成分中,任何一個部分發生變化都將產生不同的表示,例如人員的身高用“釐米”或用“米”作為計量單位,就是人員身高特性的兩種不同的表示。數據元的表示可以用一些具有表示含義的術語作標記,例如名稱、代碼、金額、數量、日期、百分比等。 [1] 
數據元基本模型中,對象類對應於數據模型中的實體、特性和表示對應於數據模型中的屬性。 [1] 

數據元元素分類

數據元的類型按不同的分類方式可以作如下分類。 [1] 
1)按數據元的應用範圍
分為通用數據元、應用數據元(或稱“領域數據元”)和專用數據元。通用數據元是與具體的對象類無關的、可以在多種場合應用的數據元。應用數據元是在特定領域內使用的數據元。應用數據元與通用數據元是相對於一定的應用環境而言的,兩者之間並沒有本質的區別,應用數據元是被限定的通用數據元,通用數據元是被泛化的應用數據元,隨環境的變化彼此可以相互轉化。專用數據元是指與對象類完全綁定、只能用來描述該對象類的某個特性的數據元。專用數據元包含了數據元的所有組成部分,是“完整的”數據元。 [1] 
2)按數據元值的數據類型
可分為文字型數據元與數值型數據元。例如人的姓名是用文字表示的,屬於文字型數據元;人的身高是用數值表示的,屬於數值型數據元。 [1] 
3)按數據元中數據項的多少
可分為簡單數據元和複合數據元。簡單數據元由一個單獨的數據項組成;複合數據元是由2個及以上的數據項組成的數據元,即由2個以上的數據元組成。組成複合數據元的數據元稱為成分數據元。雖然數據元一般被認為是不可再分的數據的基本單元,而複合數據元是由兩個以上的數據元組成的,但是在實際應用中複合數據元一般被當作不可分割的整體來使用,所以複合數據元仍然可以看作是數據的基本單元,即數據元。例如數據元“日期時間”是一個複合數據元,表示某一天的某一時刻,它由“日期”和“時間”兩個數據元組成。 [1] 

數據元命名規則

數據元的名稱是為了方便人們的使用和理解而賦予數據元的語義的、自然語言的標記。一個數據元是由對象類、特性、表示3個部分組成的,相應地,一個數據元的名稱是由對象類術語、特性術語、表示術語和一些描述性限定術語組成的,數據元的命名規則主要對各術語成分的含義、約束、組合方式等進行規範。 [1] 
數據元的命名規則主要包括以下內容。 [1] 
1)語義規則:規定數據元名稱的組成成分,使名稱的含義能夠準確的傳達。 [1] 
(1)對象類術語表示作戰仿真領域內的事物或概念,在數據元中佔有支配地位。 [1] 
(2)專用數據元的名稱中必須有且僅有一個對象類術語。 [1] 
(3)特性術語用來描述數據元的特性部分,表示對象類的顯著的、有區別的特徵。 [1] 
(4)數據元名稱中必須有且僅有一個特性術語。 [1] 
(5)表示術語用來概括的描述數據元的表示成分。 [1] 
(6)數據元名稱需要有且僅有一個表示術語。 [1] 
(7)限定術語是為了使一個數據元名稱在特定的相關環境中具有唯一性而添加的限定性描述。限定術語是可選的。對象類術語、特性術語和表示術語都可以用限定術語進行描述。 [1] 
2)句法規則:規定數據元名稱各組成成分的組合方式。 [1] 
(1)對象類術語應處於名稱的第1(最左)位置。 [1] 
(2)特性術語應處於第2位置。 [1] 
(3)表示術語應處於最後位置。當表示術語與特性術語有重複或部分重複時,在不妨礙語義精確理解的前提下,可以省略表示術語。 [1] 
(4)限定術語應位於被限定成分的前面。 [1] 
3)唯一性規則:防止出現同名異義現象。 [1] 
在同一個相關環境中所有數據元名稱應是唯一的。為規範數據元的命名,除了需要遵守上述的命名規則外,還需要對數據元名稱各成分的術語作統一的規範。數據元名稱中的術語應採用仿真領域標準、公認的術語,在數據元註冊系統中可以構建一個仿真領域的術語字典,作為數據元命名時各術語成分的統一來源。 [1] 

數據元元素區別

數據元與元數據是兩個容易混淆的概念。元數據用來描述數據的內容、使用範圍、質量、管理方式、數據所有者、數據來源、分類等信息。它使得數據在不同的時間、不同的地點,都能夠被人們理解和使用。元數據也是一種數據,也可以被存儲、管理和使用。 [1] 
數據元是一種用來表示具有相同特性數據項的抽象“數據類型”。對於一個數據集而言,元數據側重於對數據集總體的內容、質量、來源等外部特徵進行描述,而數據元則側重於對數據集內部的基本元素的“名、型、值”等特性進行定義。元數據只用來定義和描述已有的數據,數據元則可以用來指導數據模型的構建,進而產生新數據。 [1] 
為了使數據元容易被人們理解和交流,需要用一種特定格式的數據對數據元進行描述,這種用來描述數據元的特定格式的數據就是數據元的元數據。數據的提供者為使數據能夠被其他人理解和使用,在提供數據的同時需要同時提供描述該數據的元數據,數據元的元數據是其中的一個重要的組成部分。 [1] 

數據元元素提取

自上而下提取法
對於新建系統的數據元提取,一般適用這種“自上而下”的提取法。基本步驟是,在流程和功能分析的基礎上,通過建模分析,確立關心的“對象”。在概念數據模型和邏輯數據模型的基礎上,分析提取數據元及其屬性。具體標識如下信息: [2] 
(1)確定數據元的來源和上下文; [2] 
(2)標識數據元概念所基於的對象和特性,形成數據元概念; [2] 
(3)定義並標識包含數據值的數據元; [2] 
(4)標識數據值所表示的值域和允許的值; [2] 
(5)對數據元進行分類等。 [2] 
自下而上提取法
自下而上提取法也稱逆向工程,對於已建系統的數據元提取,一般適用這種“自下而上”提取法。在這種情況下,數據元直接來自各個信息系統。數據元創建者依據數據元標準化方法,對信息系統及相關資源的數據,在分析、梳理的基礎上,歸納整理出數據元;根據數據元的實際應用,闡明並寫出相關數據元在採集、存儲和交換過程中各個屬性以及屬性的約束要求;描述和定義各個屬性所需要的屬性描述符及其約束要求;根據給定的命名、定義、標識規則和表示規範,形成數據元。具體的步驟如下: [2] 
(1)理解數據元,自下而上提取法的第1步就是獲取對數據元的理解: [2] 
①與該數據元有關的有哪些數據? [2] 
②是否有數據值得定義或描述? [2] 
③有沒有允許值或者實例? [2] 
④數據值是通過算術公式計算還是統計得出的? [2] 
(2)內容研究,在研究數據元的基本屬性之前,應對下列問題做出研究: [2] 
①該數據元是否在國際、國內或者其他組織標準中進行了定義? [2] 
②該數據元是否已經存在於註冊系統中,有沒有重新應用的潛力? [2] 
(3)根據應用場景或上下文,確定數據元的定義。 [2] 
(4)根據應用場景或上下文,確定數據元的允許值和值域。 [2] 
(5)根據應用場景或上下文,確定數據元的表示詞類。 [2] 
(6)根據應用場景或上下文,確定數據元的名稱和標識符。 [2] 
(7)根據應用場景或上下文,確定數據元的其他屬性。 [2] 
參考資料
  • 1.    張宏軍,郝文寧,陳剛,靳大尉,張睿,劉斌,趙成,宋金玉,淦文燕,程愷編著.作戰仿真數據工程:國防工業出版社,2014.09:第263頁
  • 2.    包磊,黃亮,羅兵等編著.作戰數據管理:國防工業出版社,2015.06:第99頁