複製鏈接
請複製以下鏈接發送給好友

unsigned char

鎖定
char是C/C++整型數據中比較古怪的一個,其它的如int/long/short等不指定signed/unsigned時都默認是signed,但char在標準中是unsigned,編譯器可以實現為帶符號的,也可以實現為不帶符號的,有些編譯器如pSOS的編譯器,還可以通過編譯開關來指定它是有符號數還是無符號數。
中文名
unsigned char
類    別
c++關鍵字
來    源
c++
用    法
變量時會發生字節截斷
屬    性
整型數據
關聯數據
int、long、short

目錄

unsigned char介紹

unsigned char是無符號字節型,char類型變量的大小通常為1個字節(1字節=8個位),且屬於整型。整型的每一種都有無符號(unsigned)和有符號(signed)兩種類型(float和double總是帶符號的),在默認情況下聲明的整型變量都是有符號的類型(char有點特別),如果需聲明無符號類型的話就需要在類型前加上unsigned。無符號版本和有符號版本的區別就是無符號類型能保存2倍於有符號類型的數據,比如16位系統中一個int能存儲的數據的範圍為-32768~32767,而unsigned能存儲的數據範圍則是0~65535。
同樣,在32位系統中一個char類型一般為8個bit,所以能存儲的數據範圍為-128~127,而unsigned char則是0~255,字符型所存儲的數據是用來表示字符的,例如ASCⅡ或Unicode [1] 

unsigned char存儲

unsigned char在計算機中使用補碼存儲,例如
unsigned char a = 0xF7;
a在計算機中存儲的方式為:11110111

unsigned char類型轉換

int/unsigned int變量賦值給 unsigned char變量是會發生字節截斷(9位和高於9位的將被程序自動丟棄)
unsigned int a = 0xFFFFFFF7;
unsigned char b = (unsigned char)a;
此時b的值為 0xF7.

unsigned char區別

在C中,默認的基礎數據類型均為signed,現在我們以char為例,説明(signed) char與unsigned char之間的區別。
首先在內存中,char與unsigned char沒有什麼不同,都是一個字節,唯一的區別是,char的最高位為符號位,因此char能表示-128~127,unsigned char沒有符號位,因此能表示0~255,這個好理解,8個bit,最多256種情況,因此無論如何都能表示256個數字。
在實際使用過程種有什麼區別呢?主要是符號位,但是在普通的賦值,讀寫文件和網絡字節流都沒什麼區別,反正就是一個字節,不管最高位是什麼,最終的讀取結果都一樣,只是你怎麼理解最高位而已,在屏幕上面的顯示可能不一樣。
二者的最大區別是:但是我們卻發現在表示byte時,都用unsigned char,這是為什麼呢?首先我們通常意義上理解,byte沒有什麼符號位之説,更重要的是如果將byte的值賦給int,long等數據類型時,系統會做一些額外的工作。如果是char,那麼系統認為最高位是符號位,而int可能是16或者32位,那麼會對最高位進行擴展(注意,賦給unsigned int也會擴展)而如果是unsigned char,那麼不會擴展。最高位若為0時,二者沒有區別,若為1時,則有區別了。同理可以推導到其它的類型,比如short, unsigned short,等等。
具體可以通過下面的小例子看看其區別。
include <stdio.h>
 void f(unsigned char v) {
 char c = v; 
        unsigned char uc = v;
        unsigned int a = c, b = uc; 
        int i = c, j = uc; 
        printf("----------------\n"); 
        printf("%%c: %c, %c\n", c, uc); 
        printf("%%X: %X, %X\n", c, uc); 
        printf("%%u: %u, %u\n", a, b); 
        printf("%%d: %d, %d\n", i, j); 
}
int main(int argc, char *argv[])
 {
 f(0x80);
 f(0x7F);
 return 0;
 }
結果輸出如圖1所示:
圖1 圖1
結果分析:
對於(signed)char來説,0x80用二進制表示為1000 0000,當它作為char賦值給unsigned int或 int 時,系統認為最高位是符號位,會對最高位進行擴展。而0x7F用二進制表示為0111 1111,最高位為0,不會擴展。
對於unsigned char來説,不管最高位是0,還是1,都不會做擴展。
參考資料
  • 1.    王善發, 吳道榮, WangShanfa, et al. 探討C/C++語言中的數據類型[J]. 保山學院學報, 2008, 27(5):74-78.