本體是一個電子工程術語。在計算機科學與信息科學領域,理論上,本體是指一種“形式化的,對於共享概念體系的明確而又詳細的説明”。本體提供的是一種共享詞表,也就是特定領域之中那些存在着的對象類型或概念及其屬性和相互關係;或者説,本體就是一種特殊類型的術語集,具有結構化的特點,且更加適合於在計算機系統之中使用;或者説,本體實際上就是對特定領域之中某套概念及其相互之間關係的形式化表達(formal representation)。本體是人們以自己興趣領域的知識為素材,運用信息科學的本體論原理而編寫出來的作品。本體一般可以用來針對該領域的屬性進行推理,亦可用於定義該領域(也就是對該領域進行建模)。此外,有時人們也會將“本體”稱為“本體論”。
[4]
- 中文名
- 本體
- 外文名
- Ontology (information science)
- 領 域
- 電子工程
本體基本信息
編輯英文術語“ontology”一詞源於哲學領域,且一直以來存在着許多不同的用法。在計算機科學領域,其核心意思是指一種模型,用於描述由一套對象類型(概念或者説類)、屬性以及關係類型所構成的世界。儘管不同的本體對於這些構成成分的確切稱謂有所不同,但它們卻都是一部本體不可或缺的基本要素。一般來説,人們所普遍期望的一點就是,本體之中模型的那些特徵應當非常類似於相應的現實世界。
就計算機科學與哲學來説,二者所説的本體之間的共同之處就在於,它們都是依據某種類別體系,來表達實體、概念、事件及其屬性和相互關係。在這兩個領域當中,存在針對本體相對性(ontological relativity)的種種問題(比如,哲學領域的奎因和克里普克,計算機科學領域的索瓦和高利諾),人們已經和正在開展相當大量的工作;而且,人們也在討論關於規範化本體是否具有生命活力(比如,哲學領域之中針對基礎主義(foundationalism)的討論,人工智能領域之中針對Cyc項目的討論)。二者之間的那些差別在很大程度上只是側重點的問題。與計算機科學領域的研究人員相比,哲學家們則較少關心創建固定不變的受控詞表。然而,計算機科學家們則較少參與有關首要原則的討論(比如,關於是否存在諸如不變本質(fixed essences)之類事物的討論,或者關於實體在本體論上必定比過程更為基本的討論)。
[1]
本體歷史
編輯從歷史上來看,本體源自哲學之中稱為“形而上學”的分支。形而上學所關注的是現實的本質,也就是存在的本質。作為哲學的一個基本分支,形而上學關注的是分析存在的各種類型或模式,且往往尤其關注共相與殊相之間的關係、本徵性質與非本徵性質之間的關係以及本質與存在之間的關係。本體論探索活動的傳統目標尤其是,為了揭示那些基本的類別或者説種類,而在關鍵之處將現實世界劃分為對象的自然類別。
二十世紀下半葉,哲學家們就如何構建本體的可行方法或途徑展開過廣泛的討論,但實際上他們自己卻並沒有真正“構建”出任何非常精細詳盡的本體。與此相比,計算機科學家們當時則正在構建着一些大型而又穩健的本體(如WordNet和Cyc),但相對來説卻很少針對“如何”構建本體而進行辯論。
自二十世紀70年代中期以來,人工智能(簡稱AI)領域的研究人員認識到,知識的獲取乃是構建強大AI系統的關鍵所在。AI研究人員認為,他們可以把新的本體創建成為計算模型,從而成就特定類型的自動推理。二十世紀80年代,AI領域就開始採用術語ontology來同時指稱關於模型化世界的一種理論以及知識系統的一種組件。藉助於來自哲學本體論的靈感,一些研究人員繼而把計算機本體論視為一種應用哲學。
二十世紀90年代初期,湯姆·格魯伯發表了一篇後來得到廣泛引用的網頁和論文《邁向知識共享型本體的設計原則》。之所以該論文獲得人們如此的青睞,那要歸功於其中格魯伯對於計算機科學術語“ontology”的審慎定義。格魯伯採用這條術語來指一種對於某一概念體系(概念表達或概念化過程)(conceptualization)的詳細説明(specification,明確表述)。也就是説,就像關於特定程序的形式化規格説明(形式化規約)那樣,本體就是對那些可能相對於某一智能體(agent)或智能體羣體而存在的概念和關係的一種描述。這項定義與“ontology”作為“概念定義之集合”的用法是一致的,但相對來説要顯得更為通用。不過,這個單詞在此的含義卻有別於哲學領域對它的用法。
本體往往等同於那些由各種類、類之定義以及歸類關係(subsumption relation)所構成的分類法層次結構,但本體並不一定僅限於此類形式。同時,本體也並不侷限於保守型的定義(也就是傳統邏輯學意義上的那些定義,它們所引入和採用的僅僅是術語,而沒有添加任何有關現實世界的知識)。要明確而又詳細地説明所要表達的某個概念之時,我們需要聲明若干的公理,從而對所定義術語的那些可能解釋加以約束和限制。
在二十一世紀伊始的頭幾年,認知科學的跨學科項目一直在將這兩個領域的學者羣體拉得更近。例如,有人談到“哲學領域當中的計算機化轉變”。在這種轉變當中,包括哲學家們分析計算機科學領域所編制的形式化本體(有時甚至還在工作中直接運用計算機軟件),而與此同時,計算機科學領域的研究人員也在越來越多地引用那些致力於本體論的哲學家們的研究工作(有時甚至還是後者方法的直接結果)。不過,在這兩個領域當中,依然有許多學者並未順從認知科學的這種發展趨勢,並且仍繼續相互獨立地開展着自己的工作,分別從事着各自的所關心的事情。
[1]
本體本體構成要素
編輯就現有的各種本體而言,無論其在表達上採用的究竟是何種語言,在結構上都具有許多的相似性。如前所述,大多數本體描述的都是個體(實例)、類(概念)、屬性以及關係。在這一節當中,我們將分別依次論述本體的這些構成要素。
常見的本體構成要素包括:
- 個體(實例):基礎的或者説“底層的”對象。
- 類:集合(sets)、概念、對象類型或者説事物的種類。
- 屬性:對象(和類)所可能具有的屬性、特徵、特性、特點和參數。
- 關係:類與個體之間的彼此關聯所可能具有的方式。
- 函數術語:在聲明語句當中,可用來代替具體術語的特定關係所構成的複雜結構。
- 約束(限制):採取形式化方式所聲明的,關於接受某項斷言作為輸入而必須成立的情況的描述。。
- 規則:用於描述可以依據特定形式的某項斷言所能夠得出的邏輯推論的,if-then(前因-後果)式語句形式的聲明。
- 公理:採取特定邏輯形式的斷言(包括規則在內)所共同構成的就是其本體在相應應用領域當中所描述的整個理論。這種定義有別於產生式語法和形式邏輯當中所説的“公理”。在這些學科當中,公理之中僅僅包括那些被斷言為先驗知識的聲明。就這裏的用法而言,“公理”之中還包括依據公理型聲明所推導得出的理論。
本體領域本體
編輯領域本體(domain ontology或者説domain-specific ontology,即領域特異性本體)所建模的是某個特定領域,或者現實世界的一部分。領域本體所表達的是那些適合於該領域的那些術語的特殊含義。例如,就拿具有許多種含義的英文單詞“card”來説。關於撲克領域的本體可能會賦予該詞以“打撲克”的意思,而關於計算機硬件領域的本體則可能會賦予其“穿孔卡片”和“視頻卡”的意思。
上層本體(upper ontology或者説foundation ontology,即基礎本體)是指一種由那些在各種各樣的領域本體之中都普遍適用的共同對象所構成的模型。其中所收錄的核心詞表,可以用來描述一套領域當中的對象。存在着幾部現成可用的標準化上層本體,包括都柏林核心、通用形式化本體(General Formal Ontology,GFO)、OpenCyc/ResearchCyc、推薦上層合併本體(Suggested Upper Merged Ontology,SUMO)以及DOLCE。另外,有些人認為WordNet屬於上層本體,但實際上它並不是一部本體:WordNet只是由一部分類法(taxonomy)與一部受控詞表所形成的獨特組合(參見上述關於“屬性”方面的內容)。
Gellish本體則是一個關於上層本體與領域本體彼此組合的例子。
領域本體在表達概念時採用的是非常特殊而又往往具有選擇性的方式,因而它們常常缺乏兼容性。隨着那些依賴於領域本體的系統的擴展,它們往往需要將不同的領域本體合併成一部更為通用的表達形式。對於本體設計者來説,這就提出了一項富有挑戰性的難題。在同一領域內,由於文化背景、受教育程度以及意識形態的不同所造成的,對於該領域感知(perceptions)情況的不同,或者因為所採用的表達語言的不同,還可能出現不同的本體。
當前,對於那些並非依據同一部基礎本體所編制的本體的合併工作,在很大程度上還是一種手工過程,因而既耗費時間又成本高昂。那些利用同一部基礎本體所提供的一套基本元素來規定領域本體元素之含義的領域本體,則可以實現自動化的合併。存在着多項針對本體合併方面的通用技術方法的研究工作,但這個方面的研究在很大程度上依然還處於理論層面。
[1]
本體本體工程
編輯主條目:本體工程
本體工程,又稱為本體構建、本體編制或本體開發,是一個旨在研究有關構建本體的方法和方法學的領域。本體工程研究的內容包括本體開發過程、本體生命週期、本體構建方法及方法學,以及為這些方面提供支持的工具包和語言。
本體工程旨在讓軟件應用程序、企事業單位、組織機構以及特定領域業務操作過程之中所包含的那些知識變得明確清晰。本體工程為解決語義障礙所造成的互操作性問題指出了一個方向。比如,那些與業務術語和軟件類的定義相關的障礙。本體工程實際上就是一套與特定領域之中的本體開發與編制工作相關的任務。
[1]
本體本體語言
編輯主條目:本體語言
- Gellish語言之中包括了關於自身擴展的規則,因而集成了一部本體和一種本體語言。
- 規則交換格式(Rule Interchange Format,RIF)與F-邏輯(F-Logic)可將各種本體和規則結合起來。
本體本體的例子
編輯- 氨基酸本體:關於氨基酸及其性質的小型本體(其中,概念、屬性和關係均備有中英文名稱、同義詞及縮寫)。
- 基本形式化本體(Basic Formal Ontology):一部設計旨在為科學技術研究工作提供支持的形式化上層本體。
- BioPAX:一部旨在促進生物學途徑(細胞過程)數據之交換和互操作性的本體。
- 細胞週期本體(Cell-Cycle Ontology,CCO):一部用於表達細胞週期的應用本體。
- CIDOC概念參考模型(CIDOC Conceptual Reference Model):一部關於文化遺產的本體。
- 疾病本體(Disease Ontology):在設計上旨在促進各種疾病及相關健康狀況向特定醫學代碼的映射。
- DOLCE:即語言學與認知工程描述型本體(Descriptive Ontology for Linguistic and Cognitive Engineering)。
- 基礎性核心語言學本體(Foundational, Core and Linguistic Ontologies)
- 人類解剖學方面的解剖學基礎模型(Foundational Model of Anatomy,FMA)
- 基因組學領域的基因本體(Gene Ontology,GO)
- 通用上層模型(Generalized Upper Model):一部用於在客户系統與自然語言技術之間發揮中介作用的,帶有語言學動機的本體。
- Gellish英語詞典:是一部包括有詞典和分類法的本體;其中,收錄有一部上層本體和一部下層本體(lower ontology),側重於工程、技術以及採購方面的工業及商業應用。參見SourceForge的開源項目。
- GOLD:即語言描述通用本體(General Ontology for Linguistic Description)。
- Linkbase:在基本形式化本體(Basic Formal Ontology)的基礎之上,對於生物醫學領域的一種形式化表達。
- 勞森模式語言(Lawson Pattern Language,LPL)
- 開放生物醫學本體鑄造廠(OBO Foundry):生物醫學領域的一套具有互操作性的參考本體。
- 植物本體(Plant Ontology):關於植物結構以及生長/發育階段等方面的本體。
- 程序抽象分類法(Program abstraction taxonomy)
- 蛋白質組學領域的蛋白質本體(Protein Ontology)
- 推薦上層合併本體:一部形式化上層本體
- SWEET(Semantic Web for Earth and Environmental Terminology,地球與環境術語集語義網)
- 思想財富本體
- 醫學教育標引主題(Topics for Indexing Medical Education)
本體本體庫
編輯如下是一些採用人工方式選擇出來的本體所構成靜態庫:
- CO-ODE項目本體庫:提供的是一些與CO-ODE項目相關的本體示例和本體資源鏈接。
- DAML本體庫(DAML Ontology Library)之中保存的是那些採用DAML格式的歷史遺留本體。
- Protege本體庫(Protege Ontology Library)之中收錄的是一套採用OWL格式、基於框架的格式以及其他格式的本體。
- SchemaWeb則是一個由採用RDFS、OWL以及DAML+OIL格式所表達的RDF模式(RDF schemata)而構成的目錄。
下列這些即是目錄,同時又是搜索引擎。其中,包括用於在互聯網上搜索良構性本體的搜尋器。
- OntoSelect Ontology Library(OntoSelect本體庫)提供的是多種類似的,適用於RDF/S、DAML以及OWL本體的服務。
- Ontaria是“一個可以搜索和瀏覽的語義網數據目錄,且側重於RDF詞表以及OWL本體”。
本體常用本體工具
編輯本體本體服務器
本體本體編輯器
主條目:本體編輯器
- Neon工具箱
本體參見
編輯- 形式化概念分析
- 本體圖表
- 開放生物醫學本體
- 軟本體
- 術語集提取
- 弱本體
- 分體法
- 術語集
- 臨牀術語服務器
- 參考資料
-
- 1. Tom Gruber (2008). "Ontology". To appear in the Encyclopedia of Database Systems, Ling Liu and M. Tamer Özsu (Eds.), Springer-Verlag, 2008.
- 2. (Top-level ontological categories. By: Sowa, John F. In International Journal of Human-Computer Studies, v. 43 (November/December 1995) p. 669-85.),
- 3. Tom Gruber (1993). "A translation approach to portable ontology specifications". In: Knowledge Acquisition. 5: 199-199.
- 4. 什麼是本體? .搜狐[引用日期2021-04-15]