字符指類字形單位或符號,包括字母、數字、運算符號、標點符號和其他符號,以及一些功能性符號。字符是電子計算機或無線電通信中字母、數字、符號的統稱,其是數據結構中最小的數據存取單位,通常由8個二進制位(一個字節)來表示一個字符。
[1]
字符是計算機中經常用到的二進制編碼形式,也是計算機中最常用到的信息形式。
[2]
- 中文名
- 字符
- 外文名
- Character
- 應 用
- 計算機和電信技術
- 定 義
- 類字形單位或符號的基本信息
- 英文字母
- 1個字節
字符含義
編輯字符包括字母、數字、運算符號、標點符號和其他符號,以及一些功能性符號。字符在計算機內存放,應規定相應的代表字符的二進制代碼。代碼的選用要與有關外圍設備的規格取得一致。這些外圍設備包括鍵盤控制枱的輸入輸出、打印機的輸出等等。字符作輸入時,要自動轉換為二進制代碼存於機內;輸出時,計算機內二進制代碼自動轉化為字符,兩者的轉換全是靠外圍設備實現的。字符是數據結構中最小的數據存取單位。通常由8個二進制位(一個字節)來表示一個字符,但也有少數計算機系統採用6個二進制的字符表示形式。一個系統中字符集的大小,完全由該系統自己規定。
[1]
計算機可用字符一般為128~256個(不包括漢字時),每個字符進入計算機後,都將轉換為8位二進制數。不同的計算機系統和不同的語言,所能使用的字符範圍是不同的。
在 ASCII 編碼中,一個英文字母字符存儲需要1個字節。在 GB 2312 編碼或 GBK 編碼中,一個漢字字符存儲需要2個字節。在UTF-8編碼中,一個英文字母字符存儲需要1個字節,一個漢字字符儲存需要3到4個字節。在UTF-16編碼中,一個英文字母字符或一個漢字字符存儲都需要2個字節(Unicode擴展區的一些漢字存儲需要4個字節)。在UTF-32編碼中,世界上任何字符的存儲都需要4個字節。
[3]
字符表達
編輯字符是可使用多種不同字符方案或代碼頁來表示的抽象實體。例如,Unicode UTF-16 編碼將字符表示為 16 位整數序列,而 Unicode UTF-8 編碼則將相同的字符表示為 8 位字節序列。
[3]
微軟的公共語言運行庫使用 Unicode UTF-16(Unicode 轉換格式,16 位編碼形式)表示字符。