-
gb18030
鎖定
- 發佈日期
- 2000-3-17;2005-11-8
- 發佈機構
- 國家質量技術監督局
- 範 圍
- 共收錄漢字70,244個
gb18030GB 18030的特點
- 採用變長多字節編碼,每個字可以由1個、2個或4個字節組成。
- 編碼空間龐大,最多可定義161萬個字符。
GB 18030在微軟視窗系統中的代碼頁為54936。
gb18030概念簡介
國家標準GB18030-2000《信息交換用漢字編碼字符集基本集的補充》是我國繼GB2312-1980和GB13000-1993之後最重要的漢字編碼標準,是我國計算機系統必須遵循的基礎性標準之一。
GB18030-2000編碼標準是由信息產業部和國家質量技術監督局在2000年3月17日聯合發佈的,並且將作為一項國家標準在2001年的1月正式強制執行。
GB18030-2005《信息技術中文編碼字符集》是我國制訂的以漢字為主幷包含多種我國少數民族文字(如藏、蒙古、傣、彝、朝鮮、維吾爾文等)的超大型中文編碼字符集強制性標準,其中收入漢字70000餘個。
[2]
gb18030標準要求
GB 18030 的當前版本為 GB 18030-2005。現行版本為國家質量監督檢驗總局和中國國家標準化管理委員會於2005年11月8日發佈,2006年5月1日實施;是在GB18030-2000基礎上增加了CJK統一漢字擴充B的漢字。 本規格的初版“GB 18030-2000《信息技術 信息交換用漢字編碼字符集 基本集的擴充》”是由中華人民共和國信息產業部電子工業標準化研究所起草,由國家質量技術監督局於2000年3月17日發佈。在GBK基礎上增加了CJK統一漢字擴充A的漢字。
此標準內的單字節編碼部分、雙字節編碼部分,和四字節編碼部分收錄的少數中日韓統一表意文字擴展A區漢字,為強制性標準。其他部分則屬於規模性標準。在中華人民共和國境內所有軟件產品,都需要支持這個同時包含單字節、雙字節和四字節編碼的規格。
gb18030Unicode支持
GB 18030在其標準中以碼錶形式定義了除去代理對外的全部Unicode碼位的定義,因此算得上是一種Unicode的變換格式(UTF)。由於GB 18030基本上是繞開已分配的碼點去指定需要對應的Unicode,其變換和UTF-8相比要複雜得多。在日常實現上,常常會直接使用一個偏移量表
[3]
。
GB 18030—2005與GB18030—2000、GBK相比,去除了很多原來映射在PUA中的編碼。後來剩餘的24個PUA碼位也在Unicode 4.1中加上,如下所示。
GB 字節串 | Unicode 碼位 | Unicode 碼位 | Unicode 碼位 |
---|---|---|---|
GBK 1.0 | Unicode 1.0 | Unicode 3.1 | Unicode 4.1 |
A6D9 | 無 | E78D () | FE10 (︐) |
A6DA | 無 | E78E () | FE12 (︒) |
A6DB | 無 | E78F () | FE11 (︑) |
A6DC | 無 | E790 () | FE13 (︓) |
A6DD | 無 | E791 () | FE14 (︔) |
A6DE | 無 | E792 () | FE15 (︕) |
A6DF | 無 | E793 () | FE16 (︖) |
A6EC | 無 | E794 () | FE17 (︗) |
A6ED | 無 | E795 () | FE18 (︘) |
A6F3 | 無 | E796 () | FE19 (︙) |
A8BC | E7C7 () | 1E3F (ḿ) | 1E3F (ḿ) |
A8BF | E7C8 () | 01F9 (ǹ) | 01F9 (ǹ) |
A989 | E7E7 () | 303E (〾) | 303E (〾) |
A98A | E7E8 () | 2FF0 (⿰) | 2FF0 (⿰) |
A98B | E7E9 () | 2FF1 (⿱) | 2FF1 (⿱) |
A98C | E7EA () | 2FF2 (⿲) | 2FF2 (⿲) |
A98D | E7EB () | 2FF3 (⿳) | 2FF3 (⿳) |
A98E | E7EC () | 2FF4 (⿴) | 2FF4 (⿴) |
A98F | E7ED () | 2FF5 (⿵) | 2FF5 (⿵) |
A990 | E7EE () | 2FF6 (⿶) | 2FF6 (⿶) |
A991 | E7EF () | 2FF7 (⿷) | 2FF7 (⿷) |
A992 | E7F0 () | 2FF8 (⿸) | 2FF8 (⿸) |
A993 | E7F1 () | 2FF9 (⿹) | 2FF9 (⿹) |
A994 | E7F2 () | 2FFA (⿺) | 2FFA (⿺) |
A995 | E7F3 () | 2FFB (⿻) | 2FFB (⿻) |
FE50 | E815 () | 2E81 (⺁) | 2E81 (⺁) |
FE51 | E816 () | E816 () | 20087 (𠂇) |
FE52 | E817 () | E817 () | 20089 (𠂉) |
FE53 | E818 () | E818 () | 200CC (𠃌) |
FE54 | E819 () | 2E84 (⺄) | 2E84 (⺄) |
FE55 | E81A () | 3473 (㑳) | 3473 (㑳) |
FE56 | E81B () | 3447 (㑳) | 3447 (㑳) |
FE57 | E81C () | 2E88 (⺈) | 2E88 (⺈) |
FE58 | E81D () | 2E8B (⺋) | 2E8B (⺋) |
FE59 | E81E () | E81E () | 9FB4 (龴) |
FE5A | E81F () | 359E (喎) | 359E (喎) |
FE5B | E820 () | 361A (㘚) | 361A (㘚) |
FE5C | E821 () | 360E (㘚) | 360E (㘚) |
FE5D | E822 () | 2E8C (⺌) | 2E8C (⺌) |
FE5E | E823 () | 2E97 (⺗) | 2E97 (⺗) |
FE5F | E824 () | 396E (㥮) | 396E (㥮) |
FE60 | E825 () | 3918 (㥮) | 3918 (㥮) |
FE61 | E826 () | E826 () | 9FB5 (龵) |
FE62 | E827 () | 39CF (掆) | 39CF (掆) |
FE63 | E828 () | 39DF (擓) | 39DF (擓) |
FE64 | E829 () | 3A73 (㩳) | 3A73 (㩳) |
FE65 | E82A () | 39D0 (㩳) | 39D0 (㩳) |
FE66 | E82B () | E82B () | 9FB6 (龶) |
FE67 | E82C () | E82C () | 9FB7 (龷) |
FE68 | E82D () | 3B4E (棡) | 3B4E (棡) |
FE69 | E82E () | 3C6E (殨) | 3C6E (殨) |
FE6A | E82F () | 3CE0 (澾) | 3CE0 (澾) |
FE6B | E830 () | 2EA7 (⺧) | 2EA7 (⺧) |
FE6C | E831 () | E831 () | 215D7 (𡗗) |
FE6D | E832 () | E832 () | 9FB8 (龸) |
FE6E | E833 () | 2EAA (⺪) | 2EAA (⺪) |
FE6F | E834 () | 4056 (瞜) | 4056 (瞜) |
FE70 | E835 () | 415F (穇) | 415F (穇) |
FE71 | E836 () | 2EAE (⺮) | 2EAE (⺮) |
FE72 | E837 () | 4337 (紬) | 4337 (紬) |
FE73 | E838 () | 2EB3 (⺳) | 2EB3 (⺳) |
FE74 | E839 () | 2EB6 (⺶) | 2EB6 (⺶) |
FE75 | E83A () | 2EB7 (⺷) | 2EB7 (⺷) |
FE76 | E83B () | E83B () | 2298F (𢦏) |
FE77 | E83C () | 43B1 (䎱) | 43B1 (䎱) |
FE78 | E83D () | 43AC (䎱) | 43AC (䎱) |
FE79 | E83E () | 2EBB (⺻) | 2EBB (⺻) |
FE7A | E83F () | 43DD (膞) | 43DD (膞) |
FE7B | E840 () | 44D6 (藭) | 44D6 (藭) |
FE7C | E841 () | 4661 (䙡) | 4661 (䙡) |
FE7D | E842 () | 464C (䙡) | 464C (䙡) |
FE7E | E843 () | E843 () | 9FB9 (龹) |
FE80 | E844 () | 4723 (訢) | 4723 (訢) |
FE81 | E845 () | 4729 (讌) | 4729 (讌) |
FE82 | E846 () | 477C (䝼) | 477C (䝼) |
FE83 | E847 () | 478D (䝼) | 478D (䝼) |
FE84 | E848 () | 2ECA (⻊) | 2ECA (⻊) |
FE85 | E849 () | 4947 (䥇) | 4947 (䥇) |
FE86 | E84A () | 497A (釾) | 497A (釾) |
FE87 | E84B () | 497D (鏺) | 497D (鏺) |
FE88 | E84C () | 4982 (䥇) | 4982 (䥇) |
FE89 | E84D () | 4983 (鐯) | 4983 (鐯) |
FE8A | E84E () | 4985 (鐥) | 4985 (鐥) |
FE8B | E84F () | 4986 (钁) | 4986 (钁) |
FE8C | E850 () | 499F (䦟) | 499F (䦟) |
FE8D | E851 () | 499B (䦛) | 499B (䦛) |
FE8E | E852 () | 49B7 (䦟) | 49B7 (䦟) |
FE8F | E853 () | 49B6 (䦛) | 49B6 (䦛) |
FE90 | E854 () | E854 () | 9FBA (龺) |
FE91 | E855 () | E855 () | 241FE (𤇾) |
FE92 | E856 () | 4CA3 (䱷) | 4CA3 (䱷) |
FE93 | E857 () | 4C9F (鮣) | 4C9F (鮣) |
FE94 | E858 () | 4CA0 (鰆) | 4CA0 (鰆) |
FE95 | E859 () | 4CA1 (鰌) | 4CA1 (鰌) |
FE96 | E85A () | 4C77 (䱷) | 4C77 (䱷) |
FE97 | E85B () | 4CA2 (鰧) | 4CA2 (鰧) |
FE98 | E85C () | 4D13 (鳾) | 4D13 (鳾) |
FE99 | E85D () | 4D14 (鵁) | 4D14 (鵁) |
FE9A | E85E () | 4D15 (鴷) | 4D15 (鴷) |
FE9B | E85F () | 4D16 (鶄) | 4D16 (鶄) |
FE9C | E860 () | 4D17 (鶪) | 4D17 (鶪) |
FE9D | E861 () | 4D18 (鷉) | 4D18 (鷉) |
FE9E | E862 () | 4D19 (鸊) | 4D19 (鸊) |
FE9F | E863 () | 4DAE (龑) | 4DAE (龑) |
FEA0 | E864 () | E864 () | 9FBB (龻) |
gb18030字節結構
GB 18030包含三種長度的編碼:單字節的ASCII、雙字節的GBK(略帶擴展)、以及用於填補所有Unicode碼位的四字節UTF區塊。GBK雙字節部分通過查表定義,而四字節部分則根據之前兩個部分沒有提到的通用字符集碼位順序填補。由於和GBK兼容,GB 18030在搜索ASCII字符時也需要使用特別代碼進行判斷。
GB 18030 | 碼位數 | Unicode | |||
---|---|---|---|---|---|
字節1(最高位) | 字節2 | 字節3 | 字節4 | ||
00–7F | — | — | — | 128 | 0000–007F |
80 | — | — | — | — | — |
81–FE | 40–FE除去7F | — | — | 23,940 39,420 | 0080–FFFF除去D800–DFFF |
81–84 | 30–39 | 81–FE | 30–39 | ||
85 | (12,600) | (未來字符拓展) | |||
86–8F | (126,000) | (未來漢字拓展) | |||
無 | — | D800–DFFF | |||
90–E3 | 30–39 | 81–FE | 30–39 | 1,048,576 | 1 0000–10 FFFF |
E4–FC | — (315,000) | (未來標準拓展) | |||
FD–FE | — (25,200) | (用户造字區域) | |||
FF | — | — | — | — | |
總計 | — | — | — | 1,112,064 |
一、二字節區塊基本就是GBK編碼,另外加上了專門的歐元字符、豎排版本的標點符號,以及造字區對Unicode造字區的對應。四字節區塊可以視作兩段形似GBK二字節區塊結構的部分,每段的第一字節可以為0x81到0xFE,第二字節為0x30到0x39。由於結構類似,能夠安全於GBK的字符串搜索程序對於GB 18030來説也基本安全(正如基於字節的搜索程序對於EUC、UTF-8也基本安全一般。)
四字節區塊總共可以表達1,587,600(126×10×126×10)種字符,足以覆蓋Unicode的1,112,064(17×65536 − 2048個代理對)個有效碼位。
由於四字節區塊通過填空定義,要寫出處理這段轉換的程序需要同時知道GBK的覆蓋範圍,並不簡單:
U+00DE (Þ) → 81 30 89 37U+00DF (ß) → 81 30 89 38U+00E0 (à) → A8 A4U+00E1 (á) → A8 A2U+00E2 (â) → 81 30 89 39U+00E3 (ã) → 81 30 8A 30
WHATWG和W3C的GB 18030實現通過一張“位置偏移表”記錄GB 18030四字節區中連續的幾塊碎片,以便高效處理轉換。ICU和glibc也都對大塊連續的區域使用了類似的策略。
gb18030版本
- GB 18030-2000,兼容Unicode 3.0中日韓統一表意文字(即擴展A區),共收27,533個漢字;2000年3月17日發佈、2000年7月1日實施。
gb18030版本區別
GB18030最新版本是GB18030-2005。GB18030-2005與GB18030-2000的編碼體系結構是完全相同的。那麼,GB18030的2000版和2005版有什麼區別和聯繫呢?
2000年發佈的GB18030-2000,全名是《信息技術 漢字編碼字符集 基本集的擴充》。GB18030-2000僅規定了常用非漢字符號和27533個漢字(包括部首、部件等)的編碼。
GB18030-2000是全文強制性標準,市場上銷售的產品必須符合。2005年發佈的GB18030-2005在GB18030-2000的基礎上增加了42711個漢字和多種我國少數民族文字的編碼,增加的這些內容是推薦性的。原GB18030-2000中的內容是強制性的,市場上銷售的產品必須符合。故GB18030-2005為部分強制性標準,自發布之日起代替GB18030-2000。
[4]
GB18030-2005的單字節編碼部分、雙字節編碼部分和四字節編碼部分的CJK統一漢字擴充A(即0x8139EE39—0x82358738)部分為強制性。
gb18030適用範圍
GB 18030標準第1條規定:“本標準適用於圖形字符信息的處理、交換、存儲、傳輸、顯現、輸入和輸出。”簡單地説,GB18030可用於一切處理中文(包括漢字和少數民族文)信息,特別是漢字信息的信息處理產品。GB18030-2005標準可應用於中文處理的軟件類產品,如操作系統、數據庫、中間件、辦公軟件、財務軟件、CAD軟件、表處理軟件、教育軟件、字型字庫等。GB18030-2005標準還可應用於具有處理漢字功能的硬件產品,如打印機、移動電話、PDA產品等。
[5]
gb18030達到要求
問:產品達到哪些要求才算符合GB 18030?
答:同時達到以下兩個要求的產品,為符合GB 18030-2005強制部分的產品:
(1)產品可以正確輸入、輸出、處理GB 18030-2005強制部分規定的全部漢字字符;
(2)產品可以正確識別GB 18030-2005強制性部分規定的全部漢字字符對應的編碼。
gb18030總體結構
標準採用單字節、雙字節和四字節三種方式對字符編碼。單字節部分採用GB/T 11383的編碼結構與規則,使用0×00至0×7F碼位(對應於ASCII碼的相應碼位)。雙字節部分,首字節碼位從0×81至0×FE,尾字節碼位分別是0×40至0×7E和0×80至0×FE。四字節部分採用GB/T 11383未採用的0×30到0×39作為對雙字節編碼擴充的後綴,這樣擴充的四字節編碼,其範圍為0×81308130到0×FE39FE39。其中第一、三個字節編碼碼位均為0×81至0×FE,第二、四個字節編碼碼位均為0×30至0×39。碼位總體結構見右圖《碼位總體結構》所示。
[5]
gb18030字彙
GB18030-2000字彙
GB18030-2000的字彙部分是這樣寫的:
1、單字節部分
本標準中,單字節的部分收錄了GB 11383的0x00到0x7F全部128個字符及單字節編碼的歐元符號。
2、雙字節部分
本標準中,雙字節的部分收錄內容如下:
GB 13000.1的全部CJK統一漢字字符。
GB 13000.1的CJK兼容區挑選出來的21個漢字。
GB 13000.1中收錄而GB 2312未收錄的我國台灣地區使用的圖形字符139個。
GB 13000.1收錄的其它字符31個。
GB 2312中的非漢字符號。
GB 12345 的豎排標點符號19個。
GB 2312未收錄的10個小寫羅馬數字。
GB 2312未收錄的帶音調的漢語拼音字母5個以及ɑ 和ɡ 。
漢字數字“〇”。
表意文字描述符13個。
增補漢字和部首/構件80個。
雙字節編碼的歐元符號。
3 、四字節部分
本標準的四字節的部分,收錄了上述雙字節字符之外的,包括CJK統一漢字擴充A在內的GB 13000.1 中的全部字符。
[6]
GB18030-2005字彙
GB18030-2005的字彙部分是這樣寫的:
本標準收錄的字符分別以單字節、雙字節或四字節編碼。
1、單字節部分
本標準中,單字節的部分收錄了GB/T 11383-1989的0x00到0x7F全部128個字符。
2、雙字節部分
本標準中,雙字節的部分收錄內容如下:
GB 13000.1-1993的全部CJK統一漢字字符。
GB 13000.1-1993的CJK兼容區挑選出來的21個漢字。
GB 13000.1-1993中收錄而GB 2312未收錄的我國台灣地區使用的圖形字符139個。
GB 13000.1-1993收錄的其它字符31個。
GB 2312中的非漢字符號。
GB 12345 的豎排標點符號19個。
GB 2312未收錄的10個小寫羅馬數字。
GB 2312未收錄的帶音調的漢語拼音字母5個以及ɑ 和ɡ 。
漢字數字“〇”。
表意文字描述符13個。
對GB 13000.1-1993增補的漢字和部首/構件80個。
雙字節編碼的歐元符號。
3、四字節部分
本標準的四字節的部分,收錄了上述雙字節字符之外的,GB 13000的CJK統一漢字擴充A、CJK統一漢字擴充B和已經在GB13000中編碼的我國少數民族文字的字符。
GB18030-2005最主要的變化是增加了CJK統一漢字擴充B。它還去掉了單字節編碼的歐元符號0x80。
GB18030有1611668個碼位,在GB18030-2005中定義了76556個字符。隨着我國漢字整理和編碼研究工作的不斷深入,以及國際標準ISO/IEC 10646的不斷髮展,GB18030所收錄的字符將在新版本中增加。
[7]
gb18030漢字
GB18030-2000漢字
如下表所示,GB18030-2000收錄了27533個漢字:
類別 | 碼位範圍 | 碼位數 | 字符數 | 字符類型 |
雙字節部分 | 第一字節0xB0-0xF7 | 6768 | 6763 | 漢字 |
第二字節0xA1-0xFE | ||||
第一字節0x81-0xA0 | 6080 | 6080 | 漢字 | |
第二字節0x40-0xFE | ||||
第一字節0xAA-0xFE | 8160 | 8160 | 漢字 | |
第二字節0x40-0xA0 | ||||
四字節部分 | 第一字節0x81-0x82 | 25200 | 6530 | CJK統一漢字擴充A |
第二字節0x30-0x39 | ||||
第三字節0x81-0xFE | ||||
第四字節0x30-0x39 |
27533就是6763+6080+8160+6530。雙字節部分的6763+6080+8160=21003個漢字就是GBK的21003個漢字。
在Unicode中,CJK統一漢字擴充A有6582個漢字,為什麼這裏只有6530個漢字?
GB18030-2005漢字
如下表所示,GB18030-2005收錄了70244個漢字:
類別 | 碼位範圍 | 碼位數 | 字符數 | 字符類型 |
雙字節部分 | 第一字節0xB0-0xF7 | 6768 | 6763 | 漢字 |
第二字節0xA1-0xFE | ||||
第一字節0x81-0xA0 | 6080 | 6080 | 漢字 | |
第二字節0x40-0xFE | ||||
第一字節0xAA-0xFE | 8160 | 8160 | 漢字 | |
第二字節0x40-0xA0 | ||||
四字節部分 | 第一字節0x81-0x82 | 25200 | 6530 | CJK統一漢字擴充A |
第二字節0x30-0x39 | ||||
第三字節0x81-0xFE | ||||
第四字節0x30-0x39 | ||||
第一字節0x95-0x98 | 50400 | 42711 | CJK統一漢字擴充B | |
第二字節0x30-0x39 | ||||
第三字節0x81-0xFE | ||||
第四字節0x30-0x39 |
gb18030版本變化
GB18030-2005相對於GB18030-2000主要有以下變化:
1、在四字節字符表中增加CJK統一漢字擴充B和已經在GB13000中編碼的我國少數民族文字字符的字形。其實GB18030-2000已經映射了這些碼位,但GB18030-2000沒有給出這些字符的字形。
2、調整字符?的編碼。
3、去掉了單字節編碼的歐元符號(0x80)。
gb18030制定標準
按國際慣例,GB 18030制定採用的標準如下:
GB 18030-2000收錄了27533個漢字,GB 18030-2005收錄了70244個漢字。GB18030的總編碼空間超過150萬個碼位,為解決人名、地名用字問題提供了方案,為漢字研究、古籍整理等領域提供了統一的信息平台基礎。
我國大部分計算機系統仍然採用GB 2312編碼。GB 18030與GB 2312一脈相承,較好地解決了舊系統向新系統的轉換問題,並且改造成本較小。從我國信息技術和信息產業發展的角度出發,考慮到解決我國用户的需要及解決現有系統的兼容性和對多種操作系統的支持,採用GB 18030是我國較好的選擇,而GB 13000.1更適用於未來國際間的信息交換。考慮到GB 18030和GB 13000的兼容問題,標準起草組編制了GB 18030與GB 13000.1的代碼映射表,使得兩個編碼體系可以自由轉換。同時,還開發了GB 18030基本點陣字型庫。
世界許多國家和地區從方便本國和民族應用的角度出發,制定了相應的編碼標準和內碼體系,如日本的JIS X 0208和JIS X 0212,韓國的KS C 5601和KS C 5657等,這是國際上採用的通行慣例。制定GB 18030同樣符合國際慣例,它全面兼容GB 2312,在字彙上兼容GB 13000.1,可以充分利用已有資源,保證不同系統間的兼容性,最大限度地共享資源,為我國軟件產業留有巨大的發展空間。可以相信,GB 18030的實施將有利於國產軟件的發展並形成規模,使我國的中文信息技術再上一個台階。
[5]
gb18030標準歷程
1980年我國頒佈了第一個漢字編碼字符集標準,即GB 2312-80《信息交換用漢字編碼字符集基本集》。該標準共收了6763個漢字及常用符號,奠定了中文信息處理的基礎。
隨着國際間的交流與合作的擴大,信息處理應用對字符集提出了多文種、大字量、多用途的要求。1993年國際標準化組織發佈了ISO/IEC 10646-1《信息技術通用多八位編碼字符集第一部分體系結構與基本多文種平面》。我國等同採用此標準制定了GB 13000.1-1993。該標準採用了全新的多文種編碼體系,收錄了中、日、韓20902個漢字,是編碼體系未來發展方向。由於其新的編碼體系與現有多數操作系統和外部設備不兼容,所以它的實現仍需要有一個過程,還不能完全解決我國當前應用的迫切需要。
考慮到GB 13000的完全實現有待時日,以及GB 2312編碼體系的延續性和現有資源和系統的有效利用與過渡,我們選擇了在GB 2312(GB 2311)的基礎上進行擴充,並且在字彙上與GB 13000.1兼容的方案,研製一個新的標準——漢字編碼基本集的擴充,進而完善GB 2312,以滿足我國郵政、户政、金融、地理信息系統等應用的迫切需要。
此項目業已列入1998年國家標準制定計劃。1998年10月,由信息產業部電子四所、北京大學計算機技術研究所、北大方正集團、新天地公司、四通新世紀公司、中科院軟件所、長城軟件公司、中軟總公司、金山軟件公司和聯想公司的技術人員組成標準起草組。在標準研製過程中,全國信息技術標準化技術委員會多次召集標準起草組和知名公司對標準草案進行充分地研究論證,並且特邀了微軟公司、惠普公司、Sun公司和IBM公司等參加,廣泛徵求意見。標準起草組經過反覆斟酌和驗證,提出了標準制定原則——與GB 2312信息處理交換碼所對應的事實上的內碼標準兼容,在字彙上支持GB 13000.1的全部中、日、韓(CJK)統一漢字字符和全部CJK擴充A的字符,並且確定了編碼體系和27484個漢字,形成兼容性、擴展性、前瞻性兼備的方案。
信息產業部和原國家質量技術監督局於2000年3月17日聯合發佈了該標準,即GB 18030-2000《信息技術信息交換用漢字編碼字符集基本集的擴充》。該標準作為國家強制性標準自發布之日起實施,過渡期到2001年8月31日止。
1995年全國信標委曾制定和發佈《漢字擴展規範GBK 1.0》,並在MS Windows 9x/Me/NT/2000、IBM OS/2的系統中廣泛應用。GB18030是國家標準,在技術上是GBK的超集,並與其兼容,因此,GBK將結束其歷史使命。
[5]
- 參考資料
-
- 1. 孟慶餘. 漢字編碼字符集的新標準--GB18030-2000[J]. 微型機與應用, 2000, 19(12):4-6.
- 2. 字符集及Java中的字符常識整理 .我的異常網.2014-04-12[引用日期2014-08-07]
- 3. 程小剛, 郭韌. GB 18030與Unicode編碼轉換算法[J]. 華僑大學學報(自然科學版), 2009, 30(1):38-41.
- 4. GB18030編碼研究以及GBK、GB18030與Unicode的映射 .伐木丁丁鳥鳴嚶嚶[引用日期2014-08-07]
- 5. 信息交換用漢字編碼字符集基本集的擴充 .道客巴巴[引用日期2014-08-07]
- 6. GB18030-2000編碼標準簡介 .ITPUB論壇[引用日期2014-08-07]
- 7. Unicode、GB2312、GBK和GB18030中的漢字 .伐木丁丁鳥鳴嚶嚶[引用日期2014-08-07]
- 8. Unicode、GB2312、GBK和GB18030中的漢字 .語言文字網.2008-04-23[引用日期2014-08-07]
- 9. 國家標準|GB 18030-2005 .國家標準化管理委員會官網.2005-11-08[引用日期2022-04-11]
- 10. 標準信息查詢-國家標準化管理委員會 .國家標準化管理委員會[引用日期2022-07-28]
- 11. 國家標準 .全國標準信息公共服務平台[引用日期2022-08-08]
- 收起