複製鏈接
請複製以下鏈接發送給好友

字符

(類字形單位或符號)

鎖定
字符指類字形單位或符號,包括字母、數字、運算符號、標點符號和其他符號,以及一些功能性符號。字符是電子計算機或無線電通信中字母、數字、符號的統稱,其是數據結構中最小的數據存取單位,通常由8個二進制位(一個字節)來表示一個字符。 [1]  字符是計算機中經常用到的二進制編碼形式,也是計算機中最常用到的信息形式。 [2] 
中文名
字符
外文名
Character
應    用
計算機和電信技術
定    義
類字形單位或符號的基本信息
英文字母
1個字節

目錄

字符含義

字符包括字母、數字、運算符號、標點符號和其他符號,以及一些功能性符號。字符在計算機內存放,應規定相應的代表字符的二進制代碼。代碼的選用要與有關外圍設備的規格取得一致。這些外圍設備包括鍵盤控制枱的輸入輸出、打印機的輸出等等。字符作輸入時,要自動轉換為二進制代碼存於機內;輸出時,計算機內二進制代碼自動轉化為字符,兩者的轉換全是靠外圍設備實現的。字符是數據結構中最小的數據存取單位。通常由8個二進制位(一個字節)來表示一個字符,但也有少數計算機系統採用6個二進制的字符表示形式。一個系統中字符集的大小,完全由該系統自己規定。 [1]  計算機可用字符一般為128~256個(不包括漢字時),每個字符進入計算機後,都將轉換為8位二進制數。不同的計算機系統和不同的語言,所能使用的字符範圍是不同的。
在 ASCII 編碼中,一個英文字母字符存儲需要1個字節。在 GB 2312 編碼或 GBK 編碼中,一個漢字字符存儲需要2個字節。在UTF-8編碼中,一個英文字母字符存儲需要1個字節,一個漢字字符儲存需要3到4個字節。在UTF-16編碼中,一個英文字母字符或一個漢字字符存儲都需要2個字節(Unicode擴展區的一些漢字存儲需要4個字節)。在UTF-32編碼中,世界上任何字符的存儲都需要4個字節。 [3] 

字符表達

字符是可使用多種不同字符方案或代碼頁來表示的抽象實體。例如,Unicode UTF-16 編碼將字符表示為 16 位整數序列,而 Unicode UTF-8 編碼則將相同的字符表示為 8 位字節序列。 [3]  微軟的公共語言運行庫使用 Unicode UTF-16(Unicode 轉換格式,16 位編碼形式)表示字符。

字符作用

針對微軟公共語言運行庫應用程序使用編碼將字符表示形式從本機字符方案映射至其他方案。應用程序使用解碼將字符從非本機方案映射至本機方案。
電腦和通訊設備會使用字符編碼的方式來表達字符。意思是會將一個字符指定給某個東西。傳統上,是代表整數量的位元序列,如此,則可透過網絡來傳輸,同時亦便於儲存。兩個常用的例子是ASCII和用於統一碼的UTF-8。根據谷歌的統計,UTF-8是最常用於網頁的編碼方式。相較於大部分的字符編碼把字符對應到數字或位元串,摩斯密碼則是使用不定長度的電子脈衝的序列來表現字符。
參考資料
  • 1.    武廣華,臧益秀,劉運祥.中國衞生管理辭典:中國科學技術出版社,2001.5
  • 2.    劉娜. 淺談計算機中的字符編碼[J]. 科技創新與應用, 2017(1):107-107.
  • 3.    陳紅彥.IDS與集外字處理方法研究:上海遠東出版社 ,2017.3:63