反饋

通用多八位編碼字符集

通用多八位編碼字符集（Universal Multiple-Octet Coded Character Set）也叫通用字符集（Universal Character Set, UCS），是由ISO制定的ISO 10646（或稱ISO/IEC 10646）標準所定義的標準字符集。

中文名: 通用多八位編碼字符集

外文名: Universal Multiple-Octet Coded Character Set

通用多八位編碼字符集簡介

通用多八位編碼字符集包括了其他所有字符集。它保證了與其他字符集的雙向兼容，即，如果你將任何文本字符串翻譯到UCS格式，然後再翻譯回原編碼，你不會丟失任何信息。UCS包含了已知語言的所有字符。除了拉丁語、希臘語、斯拉夫語、希伯來語、阿拉伯語、亞美尼亞語、格魯吉亞語，還包括中文、日文、韓文這樣的方塊文字，UCS還包括大量的圖形、印刷、數學、科學符號。ISO/IEC 10646定義了一個31位的字符集。UCS不僅給每個字符分配一個代碼，而且賦予了一個正式的名字。表示一個UCS或Unicode值的十六進制數通常在前面加上“U+”，例如“U+0041”代表字符“A”^[1] 。

通用多八位編碼字符集版本

ISO/IEC 10646-1:1993 = Unicode 1.1 = GB 13000.1-93《信息技術　通用多八位編碼字符集（UCS）第一部分：體系結構與基本多文種平面》。
ISO/IEC 10646-1:1993 plus Amendments 5 to 7 = Unicode 2.0
ISO/IEC 10646-1:1993 plus Amendments 5, 6 and 7, as well as two characters from Amendment 18 = Unicode 2.1^[2]
ISO/IEC 10646-1:2000 = Unicode 3.0
ISO/IEC 10646-1:2000 and ISO/IEC 10646-2:2001 = Unicode 3.1
ISO/IEC 10646-1:2000 plus Amendment 1 and ISO/IEC 10646-2:2001 = Unicode 3.2
ISO/IEC 10646:2003 = Unicode 4.0 = GB 13000-2010
ISO/IEC 10646:2003 plus Amendment 1 = Unicode 4.1
ISO/IEC 10646:2003 plus Amendments 1 to 2 = Unicode 5.0 excluding Devanagari Letters GGA, JJA, DDDA and BBA, which are included in Amendment 3
ISO/IEC 10646:2003 plus Amendments 1 to 4 = Unicode 5.1
ISO/IEC 10646:2003 plus Amendments 1 to 6 = Unicode 5.2
ISO/IEC 10646:2003 plus Amendments 1 to 8 = ISO/IEC 10646:2011 = Unicode 6.0 excluding Indian Rupee Sign
ISO/IEC 10646:2012 = Unicode 6.1
ISO/IEC 10646:2012 = Unicode 6.2 excluding Turkish Lira Sign, which is included in Amendment 1
ISO/IEC 10646:2012 = Unicode 6.3 excluding Turkish Lira Sign, which is included in Amendment 1, and five bidirectional control characters (Arabic Letter Mark, Left-To-Right Isolate, Right-To-Left Isolate, First Strong Isolate, Pop Directional Isolate), which are included in Amendment 2
ISO/IEC 10646:2012 plus Amendments 1 and 2 = Unicode 7.0 excluding the Ruble sign
ISO/IEC 10646:2014 plus Amendment 1 = Unicode 8.0
ISO/IEC 10646:2014 plus Amendments 1 and 2 = Unicode 9.0 excluding Adlam, Newa, Japanese TV symbols, and 74 emoji and symbols
ISO/IEC 10646:2017 = Unicode 10.0 excluding 285 Hentaigana characters, 3 Zanabazar Square characters, and 56 emoji symbols
ISO/IEC 10646:2017 plus Amendment 1 = Unicode 11.0 excluding 46 Mtavruli Georgian capital letters, 5 CJK unified ideographs, and 66 emoji characters
ISO/IEC 10646:2017 plus Amendments 1 and 2 = Unicode 12.0 excluding 62 additional characters
ISO/IEC 10646:2020 = Unicode 13.0

通用多八位編碼字符集Unicode和ISO 10646的關係

歷史上存在兩個獨立的嘗試創立單一字符集的組織，即

國際標準化組織（ISO）於1984年創建的ISO/IECJTC1/SC2/WG2，其含義是International Organization for Standardization / International Electrotechnical Commission, Joint Technical Committee #1 [Information Technology], Subcommittee #2 [Coded Character Sets], Working Group #2 [Multi-octet codes]). ISO 10646表示這是ISO 646的擴展。
由Xerox、Apple等軟件製造商於1988年組成的統一碼聯盟。前者開發的ISO/IEC 10646項目，後者開發的統一碼項目。因此最初制定了不同的標準。

1991年前後，兩個項目的參與者都認識到，世界不需要兩個不兼容的字符集。於是，它們開始合併雙方的工作成果，併為創立一個單一編碼表而協同工作。1991年，不包含CJK統一漢字集的Unicode 1.0發佈。隨後，CJK統一漢字集的制定於1993年完成，發佈了ISO 10646-1:1993，即Unicode 1.1。

從Unicode 2.0開始，Unicode採用了與ISO 10646-1相同的字庫和字碼；ISO也承諾，ISO 10646將不會替超出U+10FFFF的UCS-4編碼賦值，以使得兩者保持一致。兩個項目仍都獨立存在，並獨立地公佈各自的標準。但統一碼聯盟和ISO/IEC JTC1/SC2都同意保持兩者標準的碼錶兼容，並緊密地共同調整任何未來的擴展。在發佈的時候，Unicode一般都會採用有關字碼最常見的字體，但ISO 10646一般都儘可能採用Century字體。

通用多八位編碼字符集Unicode和ISO 10646的異同

統一碼聯盟公佈的Unicode標準包含了ISO/IEC 10646-1實現級別3的基本多文種平面。在兩個標準裏，所有的字符都在相同的位置並且有相同的名字。ISO/IEC 10646標準，就像ISO/IEC 8859標準一樣，只不過是一個簡單的字符集表。它定義了一些編碼的別名，指定了一些與標準有關的術語，幷包括了規範説明，指定了怎樣使用UCS連接其他ISO標準的實現，比如ISO/IEC 6429和ISO/IEC 2022。還有一些與ISO緊密相關的，比如ISO/IEC 14651是關於UCS字符串排序的。

Unicode標準，額外定義了許多與字符有關的語義符號學。Unicode詳細説明了繪製某些語言（如阿拉伯語）表達形式的算法，處理雙向文字（比如拉丁文和希伯來文的混合文字）的算法，排序與字符串比較所需的算法，等等。由於Unicode這一名字比較好記，因而它使用更為廣泛。不過一般認為，用於打印ISO/IEC 10646-1標準的字體在某些方面的質量，要高於Unicode 2.0。兩者部分樣例字形有顯著的區別。ISO/IEC 10646-1標準同樣使用四種不同的風格變體來顯示錶意文字如中文、日文、韓文（即CJK），但Unicode 2.0的表裏只有中文的變體。甚至存在“Unicode對日本用户來説不可接受”的不實傳説。

參考資料

1. ISO/IEC 標準．ISO/IEC[引用日期2017-04-17]
2. Unicode 2.1.0 ．unicode[引用日期2023-03-09]

通用多八位編碼字符集的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：5次歷史版本
最近更新：菲尔普斯批发部（2023-03-09）

1 簡介
2 版本
3 Unicode和ISO 10646的關係
4 Unicode和ISO 10646的異同

通用多八位編碼字符集

目錄

通用多八位編碼字符集簡介

通用多八位編碼字符集版本

通用多八位編碼字符集Unicode和ISO 10646的關係

通用多八位編碼字符集Unicode和ISO 10646的異同