複製鏈接
請複製以下鏈接發送給好友

gb18030

鎖定
GB 18030,全稱《信息技術 中文編碼字符集》,是中華人民共和國國家標準所規定的變長多字節字符集。其對GB 2312-1980完全向後兼容,與GBK基本向後兼容,並支持Unicode(GB 13000)的所有碼位。GB 18030-2005共收錄漢字70,244個。
2022年7月19日,國家市場監督管理總局(國家標準化管理委員會)批准《信息技術 中文編碼字符集》強制性國家標準GB 18030-2022,2023年8月1日實施。 [10-11] 
中文名
信息技術 中文編碼字符集
外文名
Information technology -- Chinese coded character set [9] 
學科類別
計算機
發佈日期
2000-3-17;2005-11-8
發佈機構
國家質量技術監督局
範    圍
共收錄漢字70,244個

gb18030GB 18030的特點

GB 18030主要有以下特點 [1] 
  • 採用變長多字節編碼,每個字可以由1個、2個或4個字節組成。
  • 編碼空間龐大,最多可定義161萬個字符。
  • 完全支持Unicode,無需動用造字區即可支持中國國內少數民族文字、中日韓和繁體漢字以及emoji等字符。
GB 18030在微軟視窗系統中的代碼頁為54936。

gb18030概念簡介

國家標準GB18030-2000《信息交換用漢字編碼字符集基本集的補充》是我國繼GB2312-1980和GB13000-1993之後最重要的漢字編碼標準,是我國計算機系統必須遵循的基礎性標準之一。
GB18030-2000編碼標準是由信息產業部和國家質量技術監督局在2000年3月17日聯合發佈的,並且將作為一項國家標準在2001年的1月正式強制執行。
GB18030-2005《信息技術中文編碼字符集》是我國制訂的以漢字為主幷包含多種我國少數民族文字(如藏、蒙古、傣、彝、朝鮮、維吾爾文等)的超大型中文編碼字符集強制性標準,其中收入漢字70000餘個。 [2] 

gb18030標準要求

GB 18030 的當前版本為 GB 18030-2005。現行版本為國家質量監督檢驗總局和中國國家標準化管理委員會於2005年11月8日發佈,2006年5月1日實施;是在GB18030-2000基礎上增加了CJK統一漢字擴充B的漢字。 本規格的初版“GB 18030-2000《信息技術 信息交換用漢字編碼字符集 基本集的擴充》”是由中華人民共和國信息產業部電子工業標準化研究所起草,由國家質量技術監督局於2000年3月17日發佈。在GBK基礎上增加了CJK統一漢字擴充A的漢字。
此標準內的單字節編碼部分、雙字節編碼部分,和四字節編碼部分收錄的少數中日韓統一表意文字擴展A區漢字,為強制性標準。其他部分則屬於規模性標準。在中華人民共和國境內所有軟件產品,都需要支持這個同時包含單字節、雙字節和四字節編碼的規格。

gb18030Unicode支持

GB 18030在其標準中以碼錶形式定義了除去代理對外的全部Unicode碼位的定義,因此算得上是一種Unicode的變換格式(UTF)。由於GB 18030基本上是繞開已分配的碼點去指定需要對應的Unicode,其變換和UTF-8相比要複雜得多。在日常實現上,常常會直接使用一個偏移量表 [3] 
GB 18030—2005與GB18030—2000、GBK相比,去除了很多原來映射在PUA中的編碼。後來剩餘的24個PUA碼位也在Unicode 4.1中加上,如下所示。
國標碼碼錶中私有區碼位的演變
GB 字節串
Unicode 碼位
Unicode 碼位
Unicode 碼位
GBK 1.0
Unicode 1.0
Unicode 3.1
Unicode 4.1
A6D9
E78D ()
FE10 (︐)
A6DA
E78E ()
FE12 (︒)
A6DB
E78F ()
FE11 (︑)
A6DC
E790 ()
FE13 (︓)
A6DD
E791 ()
FE14 (︔)
A6DE
E792 ()
FE15 (︕)
A6DF
E793 ()
FE16 (︖)
A6EC
E794 ()
FE17 (︗)
A6ED
E795 ()
FE18 (︘)
A6F3
E796 ()
FE19 (︙)
A8BC
E7C7 ()
1E3F (ḿ)
1E3F (ḿ)
A8BF
E7C8 ()
01F9 (ǹ)
01F9 (ǹ)
A989
E7E7 ()
303E (〾)
303E (〾)
A98A
E7E8 ()
2FF0 (⿰)
2FF0 (⿰)
A98B
E7E9 ()
2FF1 (⿱)
2FF1 (⿱)
A98C
E7EA ()
2FF2 (⿲)
2FF2 (⿲)
A98D
E7EB ()
2FF3 (⿳)
2FF3 (⿳)
A98E
E7EC ()
2FF4 (⿴)
2FF4 (⿴)
A98F
E7ED ()
2FF5 (⿵)
2FF5 (⿵)
A990
E7EE ()
2FF6 (⿶)
2FF6 (⿶)
A991
E7EF ()
2FF7 (⿷)
2FF7 (⿷)
A992
E7F0 ()
2FF8 (⿸)
2FF8 (⿸)
A993
E7F1 ()
2FF9 (⿹)
2FF9 (⿹)
A994
E7F2 ()
2FFA (⿺)
2FFA (⿺)
A995
E7F3 ()
2FFB (⿻)
2FFB (⿻)
FE50
E815 ()
2E81 (⺁)
2E81 (⺁)
FE51
E816 ()
E816 ()
20087 (𠂇)
FE52
E817 ()
E817 ()
20089 (𠂉)
FE53
E818 ()
E818 ()
200CC (𠃌)
FE54
E819 ()
2E84 (⺄)
2E84 (⺄)
FE55
E81A ()
3473 (㑳)
3473 (㑳)
FE56
E81B ()
3447 (㑳)
3447 (㑳)
FE57
E81C ()
2E88 (⺈)
2E88 (⺈)
FE58
E81D ()
2E8B (⺋)
2E8B (⺋)
FE59
E81E ()
E81E ()
9FB4 (龴)
FE5A
E81F ()
359E (喎)
359E (喎)
FE5B
E820 ()
361A (㘚)
361A (㘚)
FE5C
E821 ()
360E (㘚)
360E (㘚)
FE5D
E822 ()
2E8C (⺌)
2E8C (⺌)
FE5E
E823 ()
2E97 (⺗)
2E97 (⺗)
FE5F
E824 ()
396E (㥮)
396E (㥮)
FE60
E825 ()
3918 (㥮)
3918 (㥮)
FE61
E826 ()
E826 ()
9FB5 (龵)
FE62
E827 ()
39CF (掆)
39CF (掆)
FE63
E828 ()
39DF (擓)
39DF (擓)
FE64
E829 ()
3A73 (㩳)
3A73 (㩳)
FE65
E82A ()
39D0 (㩳)
39D0 (㩳)
FE66
E82B ()
E82B ()
9FB6 (龶)
FE67
E82C ()
E82C ()
9FB7 (龷)
FE68
E82D ()
3B4E (棡)
3B4E (棡)
FE69
E82E ()
3C6E (殨)
3C6E (殨)
FE6A
E82F ()
3CE0 (澾)
3CE0 (澾)
FE6B
E830 ()
2EA7 (⺧)
2EA7 (⺧)
FE6C
E831 ()
E831 ()
215D7 (𡗗)
FE6D
E832 ()
E832 ()
9FB8 (龸)
FE6E
E833 ()
2EAA (⺪)
2EAA (⺪)
FE6F
E834 ()
4056 (瞜)
4056 (瞜)
FE70
E835 ()
415F (穇)
415F (穇)
FE71
E836 ()
2EAE (⺮)
2EAE (⺮)
FE72
E837 ()
4337 (紬)
4337 (紬)
FE73
E838 ()
2EB3 (⺳)
2EB3 (⺳)
FE74
E839 ()
2EB6 (⺶)
2EB6 (⺶)
FE75
E83A ()
2EB7 (⺷)
2EB7 (⺷)
FE76
E83B ()
E83B ()
2298F (𢦏)
FE77
E83C ()
43B1 (䎱)
43B1 (䎱)
FE78
E83D ()
43AC (䎱)
43AC (䎱)
FE79
E83E ()
2EBB (⺻)
2EBB (⺻)
FE7A
E83F ()
43DD (膞)
43DD (膞)
FE7B
E840 ()
44D6 (藭)
44D6 (藭)
FE7C
E841 ()
4661 (䙡)
4661 (䙡)
FE7D
E842 ()
464C (䙡)
464C (䙡)
FE7E
E843 ()
E843 ()
9FB9 (龹)
FE80
E844 ()
4723 (訢)
4723 (訢)
FE81
E845 ()
4729 (讌)
4729 (讌)
FE82
E846 ()
477C (䝼)
477C (䝼)
FE83
E847 ()
478D (䝼)
478D (䝼)
FE84
E848 ()
2ECA (⻊)
2ECA (⻊)
FE85
E849 ()
4947 (䥇)
4947 (䥇)
FE86
E84A ()
497A (釾)
497A (釾)
FE87
E84B ()
497D (鏺)
497D (鏺)
FE88
E84C ()
4982 (䥇)
4982 (䥇)
FE89
E84D ()
4983 (鐯)
4983 (鐯)
FE8A
E84E ()
4985 (鐥)
4985 (鐥)
FE8B
E84F ()
4986 (钁)
4986 (钁)
FE8C
E850 ()
499F (䦟)
499F (䦟)
FE8D
E851 ()
499B (䦛)
499B (䦛)
FE8E
E852 ()
49B7 (䦟)
49B7 (䦟)
FE8F
E853 ()
49B6 (䦛)
49B6 (䦛)
FE90
E854 ()
E854 ()
9FBA (龺)
FE91
E855 ()
E855 ()
241FE (𤇾)
FE92
E856 ()
4CA3 (䱷)
4CA3 (䱷)
FE93
E857 ()
4C9F (鮣)
4C9F (鮣)
FE94
E858 ()
4CA0 (鰆)
4CA0 (鰆)
FE95
E859 ()
4CA1 (鰌)
4CA1 (鰌)
FE96
E85A ()
4C77 (䱷)
4C77 (䱷)
FE97
E85B ()
4CA2 (鰧)
4CA2 (鰧)
FE98
E85C ()
4D13 (鳾)
4D13 (鳾)
FE99
E85D ()
4D14 (鵁)
4D14 (鵁)
FE9A
E85E ()
4D15 (鴷)
4D15 (鴷)
FE9B
E85F ()
4D16 (鶄)
4D16 (鶄)
FE9C
E860 ()
4D17 (鶪)
4D17 (鶪)
FE9D
E861 ()
4D18 (鷉)
4D18 (鷉)
FE9E
E862 ()
4D19 (鸊)
4D19 (鸊)
FE9F
E863 ()
4DAE (龑)
4DAE (龑)
FEA0
E864 ()
E864 ()
9FBB (龻)

gb18030字節結構

GB 18030包含三種長度的編碼:單字節的ASCII、雙字節的GBK(略帶擴展)、以及用於填補所有Unicode碼位的四字節UTF區塊。GBK雙字節部分通過查表定義,而四字節部分則根據之前兩個部分沒有提到的通用字符集碼位順序填補。由於和GBK兼容,GB 18030在搜索ASCII字符時也需要使用特別代碼進行判斷。
GB 18030編碼
GB 18030
碼位數
Unicode
字節1(最高位)
字節2
字節3
字節4
00–7F
128
0000–007F
80
81–FE
40–FE除去7F
23,940
39,420
0080–FFFF除去D800–DFFF
81–84
30–39
81–FE
30–39
85
(12,600)
(未來字符拓展)
86–8F
(126,000)
(未來漢字拓展)
D800–DFFF
90–E3
30–39
81–FE
30–39
1,048,576
1 0000–10 FFFF
E4–FC
— (315,000)
(未來標準拓展)
FD–FE
— (25,200)
(用户造字區域)
FF
總計
1,112,064
一、二字節區塊基本就是GBK編碼,另外加上了專門的歐元字符、豎排版本的標點符號,以及造字區對Unicode造字區的對應。四字節區塊可以視作兩段形似GBK二字節區塊結構的部分,每段的第一字節可以為0x81到0xFE,第二字節為0x30到0x39。由於結構類似,能夠安全於GBK的字符串搜索程序對於GB 18030來説也基本安全(正如基於字節的搜索程序對於EUCUTF-8也基本安全一般。)
四字節區塊總共可以表達1,587,600(126×10×126×10)種字符,足以覆蓋Unicode的1,112,064(17×65536 − 2048個代理對)個有效碼位。
由於四字節區塊通過填空定義,要寫出處理這段轉換的程序需要同時知道GBK的覆蓋範圍,並不簡單:
U+00DE (Þ) → 81 30 89 37U+00DF (ß) → 81 30 89 38U+00E0 (à) → A8 A4U+00E1 (á) → A8 A2U+00E2 (â) → 81 30 89 39U+00E3 (ã) → 81 30 8A 30
WHATWG和W3C的GB 18030實現通過一張“位置偏移表”記錄GB 18030四字節區中連續的幾塊碎片,以便高效處理轉換。ICU和glibc也都對大塊連續的區域使用了類似的策略。

gb18030版本

  • GB 18030-2000,兼容Unicode 3.0中日韓統一表意文字(即擴展A區),共收27,533個漢字;2000年3月17日發佈、2000年7月1日實施。
  • GB 18030-2005,更新至Unicode 3.1中日韓統一表意文字(即擴展B區),並刊載少數民族包括朝鮮文蒙古文(包括滿文託忒文錫伯文、阿禮嘎禮文)、德宏傣文藏文維吾爾文/哈薩克文/柯爾克茲文和彝文的文字。共有70,244個漢字;2005年11月8日發佈、2006年5月1日實施。

gb18030版本區別

GB18030最新版本是GB18030-2005。GB18030-2005與GB18030-2000的編碼體系結構是完全相同的。那麼,GB18030的2000版和2005版有什麼區別和聯繫呢?
2000年發佈的GB18030-2000,全名是《信息技術 漢字編碼字符集 基本集的擴充》。GB18030-2000僅規定了常用非漢字符號和27533個漢字(包括部首、部件等)的編碼。
GB18030-2000是全文強制性標準,市場上銷售的產品必須符合。2005年發佈的GB18030-2005在GB18030-2000的基礎上增加了42711個漢字和多種我國少數民族文字的編碼,增加的這些內容是推薦性的。原GB18030-2000中的內容是強制性的,市場上銷售的產品必須符合。故GB18030-2005為部分強制性標準,自發布之日起代替GB18030-2000。 [4]  GB18030-2005的單字節編碼部分、雙字節編碼部分和四字節編碼部分的CJK統一漢字擴充A(即0x8139EE39—0x82358738)部分為強制性。

gb18030適用範圍

GB 18030標準第1條規定:“本標準適用於圖形字符信息的處理、交換、存儲、傳輸、顯現、輸入和輸出。”簡單地説,GB18030可用於一切處理中文(包括漢字和少數民族文)信息,特別是漢字信息的信息處理產品。GB18030-2005標準可應用於中文處理的軟件類產品,如操作系統、數據庫、中間件辦公軟件財務軟件、CAD軟件、表處理軟件、教育軟件、字型字庫等。GB18030-2005標準還可應用於具有處理漢字功能的硬件產品,如打印機、移動電話、PDA產品等。 [5] 

gb18030達到要求

問:產品達到哪些要求才算符合GB 18030?
答:同時達到以下兩個要求的產品,為符合GB 18030-2005強制部分的產品:
(1)產品可以正確輸入、輸出、處理GB 18030-2005強制部分規定的全部漢字字符
(2)產品可以正確識別GB 18030-2005強制性部分規定的全部漢字字符對應的編碼。

gb18030總體結構

碼位總體結構 碼位總體結構
標準採用單字節、雙字節和四字節三種方式對字符編碼。單字節部分採用GB/T 11383的編碼結構與規則,使用0×00至0×7F碼位(對應於ASCII碼的相應碼位)。雙字節部分,首字節碼位從0×81至0×FE,尾字節碼位分別是0×40至0×7E和0×80至0×FE。四字節部分採用GB/T 11383未採用的0×30到0×39作為對雙字節編碼擴充的後綴,這樣擴充的四字節編碼,其範圍為0×81308130到0×FE39FE39。其中第一、三個字節編碼碼位均為0×81至0×FE,第二、四個字節編碼碼位均為0×30至0×39。碼位總體結構見右圖《碼位總體結構》所示。 [5] 

gb18030字彙

GB18030-2000字彙
GB18030-2000的字彙部分是這樣寫的:
本標準收錄的字符分別以單字節、雙字節和四字節編碼。
1、單字節部分
本標準中,單字節的部分收錄了GB 11383的0x00到0x7F全部128個字符及單字節編碼的歐元符號
2、雙字節部分
本標準中,雙字節的部分收錄內容如下:
GB 13000.1的全部CJK統一漢字字符。
GB 13000.1的CJK兼容區挑選出來的21個漢字。
GB 13000.1中收錄而GB 2312未收錄的我國台灣地區使用的圖形字符139個。
GB 13000.1收錄的其它字符31個。
GB 2312中的非漢字符號。
GB 12345 的豎排標點符號19個。
GB 2312未收錄的10個小寫羅馬數字。
GB 2312未收錄的帶音調的漢語拼音字母5個以及ɑ 和ɡ 。
漢字數字“〇”。
表意文字描述符13個。
增補漢字和部首/構件80個。
字節編碼的歐元符號。
3 、四字節部分
本標準的四字節的部分,收錄了上述雙字節字符之外的,包括CJK統一漢字擴充A在內的GB 13000.1 中的全部字符。 [6] 
GB18030-2005字彙
GB18030-2005的字彙部分是這樣寫的:
本標準收錄的字符分別以單字節、雙字節或四字節編碼。
1、單字節部分
本標準中,單字節的部分收錄了GB/T 11383-1989的0x00到0x7F全部128個字符。
2、雙字節部分
本標準中,雙字節的部分收錄內容如下:
GB 13000.1-1993的全部CJK統一漢字字符。
GB 13000.1-1993的CJK兼容區挑選出來的21個漢字。
GB 13000.1-1993中收錄而GB 2312未收錄的我國台灣地區使用的圖形字符139個。
GB 13000.1-1993收錄的其它字符31個。
GB 2312中的非漢字符號。
GB 12345 的豎排標點符號19個。
GB 2312未收錄的10個小寫羅馬數字。
GB 2312未收錄的帶音調的漢語拼音字母5個以及ɑ 和ɡ 。
漢字數字“〇”。
表意文字描述符13個。
對GB 13000.1-1993增補的漢字和部首/構件80個。
雙字節編碼的歐元符號。
3、四字節部分
本標準的四字節的部分,收錄了上述雙字節字符之外的,GB 13000的CJK統一漢字擴充A、CJK統一漢字擴充B和已經在GB13000中編碼的我國少數民族文字的字符。
GB18030-2005最主要的變化是增加了CJK統一漢字擴充B。它還去掉了單字節編碼的歐元符號0x80。
GB18030有1611668個碼位,在GB18030-2005中定義了76556個字符。隨着我國漢字整理和編碼研究工作的不斷深入,以及國際標準ISO/IEC 10646的不斷髮展,GB18030所收錄的字符將在新版本中增加。 [7] 

gb18030漢字

GB18030-2000漢字
如下表所示,GB18030-2000收錄了27533個漢字:
類別
碼位範圍
碼位數
字符數
字符類型
雙字節部分
第一字節0xB0-0xF7
6768
6763
漢字
第二字節0xA1-0xFE
第一字節0x81-0xA0
6080
6080
漢字
第二字節0x40-0xFE
第一字節0xAA-0xFE
8160
8160
漢字
第二字節0x40-0xA0
四字節部分
第一字節0x81-0x82
25200
6530
CJK統一漢字擴充A
第二字節0x30-0x39
第三字節0x81-0xFE
第四字節0x30-0x39
27533就是6763+6080+8160+6530。雙字節部分的6763+6080+8160=21003個漢字就是GBK的21003個漢字。
在Unicode中,CJK統一漢字擴充A有6582個漢字,為什麼這裏只有6530個漢字?
這是因為在GBK時代,雙字節部分已經收錄過CJK統一漢字擴充A的52個漢字(見【Unicode支持】表),所以還餘6530個漢字。 [8] 
GB18030-2005漢字
如下表所示,GB18030-2005收錄了70244個漢字:
類別
碼位範圍
碼位數
字符數
字符類型
雙字節部分
第一字節0xB0-0xF7
6768
6763
漢字
第二字節0xA1-0xFE
第一字節0x81-0xA0
6080
6080
漢字
第二字節0x40-0xFE
第一字節0xAA-0xFE
8160
8160
漢字
第二字節0x40-0xA0
四字節部分
第一字節0x81-0x82
25200
6530
CJK統一漢字擴充A
第二字節0x30-0x39
第三字節0x81-0xFE
第四字節0x30-0x39
第一字節0x95-0x98
50400
42711
CJK統一漢字擴充B
第二字節0x30-0x39
第三字節0x81-0xFE
第四字節0x30-0x39
70244就是6763+6080+8160+6530+42711。 [8] 

gb18030版本變化

GB18030-2005相對於GB18030-2000主要有以下變化:
1、在四字節字符表中增加CJK統一漢字擴充B和已經在GB13000中編碼的我國少數民族文字字符的字形。其實GB18030-2000已經映射了這些碼位,但GB18030-2000沒有給出這些字符的字形。
2、調整字符?的編碼。
3、去掉了單字節編碼的歐元符號(0x80)。
(糾正:其實GBK和GB18030-2000都沒有單字節編碼的歐元符號,微軟的CP936才有這個符號並定義在0x80) [5] 

gb18030制定標準

按國際慣例,GB 18030制定採用的標準如下:
GB 18030-2000收錄了27533個漢字,GB 18030-2005收錄了70244個漢字。GB18030的總編碼空間超過150萬個碼位,為解決人名、地名用字問題提供了方案,為漢字研究、古籍整理等領域提供了統一的信息平台基礎。
我國大部分計算機系統仍然採用GB 2312編碼。GB 18030與GB 2312一脈相承,較好地解決了舊系統向新系統的轉換問題,並且改造成本較小。從我國信息技術和信息產業發展的角度出發,考慮到解決我國用户的需要及解決現有系統的兼容性和對多種操作系統的支持,採用GB 18030是我國較好的選擇,而GB 13000.1更適用於未來國際間的信息交換。考慮到GB 18030和GB 13000的兼容問題,標準起草組編制了GB 18030與GB 13000.1的代碼映射表,使得兩個編碼體系可以自由轉換。同時,還開發了GB 18030基本點陣字型庫。
世界許多國家和地區從方便本國和民族應用的角度出發,制定了相應的編碼標準和內碼體系,如日本的JIS X 0208和JIS X 0212,韓國的KS C 5601和KS C 5657等,這是國際上採用的通行慣例。制定GB 18030同樣符合國際慣例,它全面兼容GB 2312,在字彙上兼容GB 13000.1,可以充分利用已有資源,保證不同系統間的兼容性,最大限度地共享資源,為我國軟件產業留有巨大的發展空間。可以相信,GB 18030的實施將有利於國產軟件的發展並形成規模,使我國的中文信息技術再上一個台階。 [5] 

gb18030標準歷程

1980年我國頒佈了第一個漢字編碼字符集標準,即GB 2312-80《信息交換用漢字編碼字符集基本集》。該標準共收了6763個漢字及常用符號,奠定了中文信息處理的基礎。
隨着國際間的交流與合作的擴大,信息處理應用對字符集提出了多文種、大字量、多用途的要求。1993年國際標準化組織發佈了ISO/IEC 10646-1《信息技術通用多八位編碼字符集第一部分體系結構與基本多文種平面》。我國等同採用此標準制定了GB 13000.1-1993。該標準採用了全新的多文種編碼體系,收錄了中、日、韓20902個漢字,是編碼體系未來發展方向。由於其新的編碼體系與現有多數操作系統和外部設備不兼容,所以它的實現仍需要有一個過程,還不能完全解決我國當前應用的迫切需要。
考慮到GB 13000的完全實現有待時日,以及GB 2312編碼體系的延續性和現有資源和系統的有效利用與過渡,我們選擇了在GB 2312(GB 2311)的基礎上進行擴充,並且在字彙上與GB 13000.1兼容的方案,研製一個新的標準——漢字編碼基本集的擴充,進而完善GB 2312,以滿足我國郵政、户政、金融、地理信息系統等應用的迫切需要。
此項目業已列入1998年國家標準制定計劃。1998年10月,由信息產業部電子四所、北京大學計算機技術研究所、北大方正集團、新天地公司、四通新世紀公司、中科院軟件所、長城軟件公司、中軟總公司、金山軟件公司和聯想公司的技術人員組成標準起草組。在標準研製過程中,全國信息技術標準化技術委員會多次召集標準起草組和知名公司對標準草案進行充分地研究論證,並且特邀了微軟公司、惠普公司、Sun公司和IBM公司等參加,廣泛徵求意見。標準起草組經過反覆斟酌和驗證,提出了標準制定原則——與GB 2312信息處理交換碼所對應的事實上的內碼標準兼容,在字彙上支持GB 13000.1的全部中、日、韓(CJK)統一漢字字符和全部CJK擴充A的字符,並且確定了編碼體系和27484個漢字,形成兼容性、擴展性、前瞻性兼備的方案。
信息產業部和原國家質量技術監督局於2000年3月17日聯合發佈了該標準,即GB 18030-2000《信息技術信息交換用漢字編碼字符集基本集的擴充》。該標準作為國家強制性標準自發布之日起實施,過渡期到2001年8月31日止。
1995年全國信標委曾制定和發佈《漢字擴展規範GBK 1.0》,並在MS Windows 9x/Me/NT/2000、IBM OS/2的系統中廣泛應用。GB18030是國家標準,在技術上是GBK的超集,並與其兼容,因此,GBK將結束其歷史使命。 [5] 
參考資料
展開全部 收起