複製鏈接
請複製以下鏈接發送給好友

統一碼聯盟

鎖定
統一碼聯盟是一個致力於開發,維護,發展全球通用軟件標準和數據格式,特別是維護Unicode編碼標準的非牟利機構。統一碼聯盟制定了一種可以對全球幾乎所有語言文字進行編碼的標準。
中文名
統一碼聯盟
外文名
The Unicode Consortium
法文名
le Consortium Unicode
宗    旨
取代現存的字符編碼

統一碼聯盟宗旨

其宗旨為最終以統一碼取代現存的字符編碼。因為現存編碼不能夠在多語言計算機環境中使用,而且字符數有侷限。同時它也制定了數種統一碼轉換格式(UTF,Unicode Transformation Format)。

統一碼聯盟起源

Unicode是為了解決傳統的字符編碼方案的侷限而產生的,例如ISO 8859-1所定義的字符雖然在不同的國家中廣泛地使用,可是在不同國家間卻經常出現不兼容的情況。
很多傳統的編碼方式都有一個共同的問題,即容許計算機處理雙語環境(通常使用拉丁字母以及其本地語言),但卻無法同時支持多語言環境(指可同時處理多種語言混合的情況)。Unicode編碼包含了不同寫法的字,如“ɑ/a”、“強/強”、“户/户/戸”。然而在漢字方面引起了一字多形的認定爭議(詳見中日韓統一表意文字主題)。
在文字處理方面,統一碼為每一個字符而非字形定義的代碼(即一個整數)。換句話説,統一碼以一種抽象的方式(即數字)來處理字符,並將視覺上的演繹工作(例如字體大小、外觀形狀、字體形態、文體等)留給其他軟件來處理,例如網頁瀏覽器或是文字處理器。
幾乎所有計算機系統都支持基本拉丁字母,並各自支持不同的其他編碼方式。Unicode為了和它們相互兼容,其首256字符保留給ISO 8859-1所定義的字符,使既有的西歐語系文字的轉換不需特別考量;
並且把大量相同的字符重複編到不同的字符碼中去,使得舊有紛雜的編碼方式得以和Unicode編碼間互相直接轉換,而不會丟失任何信息。舉例來説,全角格式區段包含了主要的拉丁字母的全角格式,
在中文、日文、以及韓文字形當中,這些字符以全角的方式來呈現,而不以常見的半角形式顯示,這對豎排文字和等寬排列文字有重要作用。
在表示一個Unicode的字符時,通常會用“U+”然後緊接着一組十六進制的數字來表示這一個字符。在基本多文種平面(英文:Basic Multilingual Plane,簡寫BMP。又稱為“零號平面”、plane 0)裏的所有字符,要用四位十六進制數(例如U+4AE0,共支持六萬多個字符);
在零號平面以外的字符則需要使用五位或六位十六進制數了。舊版的Unicode標準使用相近的標記方法,但卻有些微小差異:在Unicode 3.0裏使用“U-”然後緊接着八位數,而“U+”則必須隨後緊接着四位數。 [1] 

統一碼聯盟發展

位於美國加州的Unicode組織允許任何願意支付會費的公司和個人加入,其成員包含了主要的計算機軟硬件廠商,例如奧多比系統、蘋果公司、惠普、IBM、微軟、施樂等。
20世紀80年代末,組成Unicode組織的商業機構,和國際合作的國際標準化組織因為計算機普及和信息國際化的前提下,分別各自成立了Unicode組織和ISO-10646工作小組。
他們不久便發現對方的存在,大家為着相同的目的而工作,於是兩個組織便共同合作開發適用於各國語言的通用碼,而且“相當有默契地”各自發表Unicode和ISO-10646字集。雖然實際上兩者的字集編碼相同,但實質上兩者確實為兩個不同的標準。
統一碼聯盟在1991年首次發佈了The Unicode Standard。Unicode的開發結合了國際標準化組織所制定的ISO/IEC 10646,即通用字符集。Unicode與ISO/IEC 10646在編碼的運作原理相同,
The Unicode Standard包含了更詳盡的實現信息、涵蓋了更細節的主題,諸如比特編碼(bitwise encoding)、校對以及呈現等。The Unicode Standard也枚舉了諸多的字符特性,包含了那些必須支持兩種閲讀方向的文字(由左至右或由右至左的文字閲讀方向,例如阿拉伯文是由右至左)。Unicode與ISO/IEC 10646這兩個標準在術語上的使用有些微的不同。
2005年,Unicode的第十萬個字符被引入成為標準之一,該字符被用於馬來亞拉姆語。
2020年,Unicode發佈了13.0,共收錄143,859個字符。 [2] 

統一碼聯盟成員合作

統一碼聯盟由世界各地主要的電腦製造商、軟件開發商、數據庫開發商、政府部門、研究機構、國際機構、各用户組織及個人組成。統一碼聯盟的領導者及管理人員來自各個組織及行業,代表着最廣泛的編碼應用。
統一碼聯盟包含三個技術委員會和一個編輯委員會:Unicode Technical Committee,Unicode CLDR Technical Committee,Unicode Localization Interoperability Technical CommitteeEditorial Committee.
統一碼聯盟積極與各標準制訂機構合作,包括國際標準化組織(ISO)、國際電工委員會(IEC)、萬維網聯盟(W3C)、互聯網工程工作小組(IETF)和歐洲計算機制造協會(ECMA)等。

統一碼聯盟出版刊物

  • The Unicode® Standard,Version 13.0 – Core Specification, The Unicode Consortium, Addison-Wesley Professional,ISBN 978-1-936213-26-9 [2] 
  • The Unicode Standard, Version 5.0, Fifth Edition, The Unicode Consortium, Addison-Wesley Professional, Oct. 27, 2006.ISBN 978-0-321-48091-0
  • The Unicode Standard, Version 4.0, The Unicode Consortium, Addison-Wesley Professional, Aug. 27, 2003.ISBN 978-0-321-18578-5
  • 《Unicode標準》(The Unicode Standard)
  • 《字符數字庫》(Character Database)
  • 《Unicode技術準備和報告》(Unicode Technical Standards and Reports)
  • 《Unicode技術説明書》(Unicode Technical Notes)等等。

統一碼聯盟成就

統一碼的成功讓計算機使用進入了一個新紀元,並應用於很多新技術,如XML、Java編程語言和現今的操作系統
參考資料