複製鏈接
請複製以下鏈接發送給好友

codepage

鎖定
codepage,是一個經過挑選的以特定順序排列的字符內碼列表(內碼錶)
Windows代碼頁是1980年代和1990年代在Microsoft Windows中使用的字符集或代碼頁集(在其他操作系統中稱為字符編碼)。 在Windows中實施Unicode時,Windows代碼頁已逐漸被取代,儘管引用仍在Windows和其他平台中得到支持,並且在使用Alt代碼快捷方式時仍然適用。
Windows系統中有兩類代碼頁:OEM和Windows本地(“ ANSI”)代碼頁。 這兩個組中的代碼頁都是擴展的ASCII代碼頁。
,
中文名
字符內碼列表
外文名
codepage
Windows code page
別    名
Windows代碼頁
定義了
字符的映射代碼
追    述
MS-DOS3.3向IBMPC用户引進內碼錶

codepage內碼錶codepage

簡介:
codepage指的是一個經過挑選的以特定順序排列的字符內碼列表(內碼錶),對於早期的單字節內碼的語種,codepage中的內碼順序使得系統可以按照此列表來根據鍵盤的輸入值給出一個對應的內碼.對於雙字節內碼,則給出的是MultiByte到Unicode的對應表,這樣就可以把以Unicode形式存放的字符轉化為相應的字符內碼.
注意ASP和SAP中的codepage的區別。

codepage歷史發展

此技術的使用最早追溯到MS-DOS3.3(1987年4月發行)向IBMPC用户引進了內碼錶的概念,Windows也使用此概念。
最初的IBM字元集被稱作內碼錶437,或者(MS-DOSLatinUS)。內碼錶850就是「MS-DOSLatin1」,它用附加的帶重音字母(但不是Latin1ISO/ANSI標準)代替了一些線形字符。其他內碼錶被其他語言定義。最低的128個代碼總是相同的;較高的128個代碼取決於定義內碼錶的語言。
在MS-DOS中,如果用户為PC的鍵盤、顯示卡和打印機指定了一個內碼錶,然後在PC上創建、編輯和打印文件,一切都很正常,每件事都會保持一致。然而,如果用户試圖與使用不同內碼錶的用户交換文件,或者在機器上改變內碼錶,就會產生問題。字符碼與錯誤的字符相關聯。應用程序能夠將內碼錶信息與文件一起保存來試圖減少問題的產生,但該策略包括了某些在內碼錶間轉換的工作。
雖然內碼錶最初僅提供了不包括帶重音符號字母的附加拉丁字符集,但最終內碼錶的較高的128個字符還是包括了完整的非拉丁字母,例如希伯來語、希臘語和斯拉夫語。自然,如此多樣會導致內碼錶變得混亂;如果少數帶重音的字母未正確顯示,那麼整個文字便會混亂不堪而不可閲讀。
內碼錶的擴展正是基於所有這些原因,但是還不夠。斯拉夫語的MS-DOS內碼錶855與斯拉夫語的Windows內碼錶1251以及斯拉夫語的Macintosh內碼錶10007不同。每個環境下的內碼錶都是對該環境所作的標準字符集修正。IBMOS/2也支持多種EBCDIC內碼錶。

codepageASP中

CodePage的作用,是決定頁面以何種編碼方式顯示動態內容。當頁面被服務器處理之後,頁面將以CodePage設定的編碼輸出到客户端。當然,CodePage的參數需正確,否則,將產生錯誤信息“CodePage 值無效。指定的 CodePage 值無效。”(事件ID: 0204)。如果CodePage沒有設置,則服務器使用默認的CodePage加載到你的Session裏面,使用程序代碼:Response.Write(Session.CodePage)可以查看你當前使用的CodePage。
LANGUAGE="VBSCRIPT"和LANGUAGE="javascript",申明ASP當前使用的編程腳本分別為 VBSCRIPT和javascript。一般在程序第一行進行申明。當使用該腳本申明後,以下所有程序運用全得符合該腳本語言的所有語法,兩者不能混淆 使用,否則出錯。我們在寫ASP時,一般不做限定,因為經常會在一ASP頁面寫不同的腳本,當然這也是以犧牲執行效率為代價的。
CodePage:可讀/可寫。整型。定義用於在瀏覽器中顯示頁內容的代碼頁。代碼頁是字符集的數字值,不同的語言使用不同的代碼頁。例 如,ANSI代碼頁為1252,日文代碼頁為932,簡體中文代碼頁為936。一般情況下,當你上傳到國外網頁空間,或者提取數據庫記錄等出現亂碼時,就 採用這種方法解決。

codepageSAP中

最經常我們使用的讀取數據的方法就是使用GUI_UPLOAD這個FM.在這個FM中有個CODEPAGE,是用來指定代碼頁的.
Siebel Value
SAP 代碼頁
描述
CP1252
1100
SAP 拉丁語-1 - ISO8859-1 - 代碼頁
ISO-8859-2
1402
SAP 拉丁語-2 - ISO8859-2
ISO-8859-5
1500
SAP 西里爾文 - ISO8859-5
CP1254
1610
SAP 土耳其語 - ISO8859-9
CP1253
1700
SAP 希臘語 - ISO8859-7 - 不完全匹配
CP1255
1800
SAP 希伯來語- ISO8859-8 - 不完全匹配
CP932
8000
SAP Shift-JIS
CP950
8300
SAP 繁體中文
CP936
8400
SAP 簡體中文
CP949
8500
SAP 韓文
CP874
8600
SAP 泰文
OEM(IBM PC)代碼頁
  • 437 —最初的IBM PC代碼頁,實現了擴展ASCII字符集
  • 737 — 希臘語
  • 850 —“多語言(Latin-1)” (西歐語言)
  • 852 —“斯拉夫(Latin-2)” (中歐及東歐語言)
  • 855 — 西里爾(Cyril)字母
  • 857 — 土耳其語
  • 858 —帶歐元符號的“多語言”
  • 860 — 葡萄牙語
  • 861 — 冰島語
  • 863 — 法語加拿大英語
  • 865 — 北歐
  • 866 — 西里爾(Cyril)字母
  • 869 — 希臘語
代碼頁819實現了拉丁語(Latin-1)(ISO/IEC 8859-1),用於IBM AS/400小型機。
中日韓語言代碼頁
既是OEM代碼頁,也是Windows代碼頁。
  • 932 —日 文(shift_jis)
  • 936 —簡體中文(GBK)
  • 949 —韓文
  • 950 —繁體中文(大五碼)

codepage其他代碼頁

  • 10000 —Macintosh Roman encoding (followed by several other Mac character sets)
  • 10007 —Macintosh Cyrillic encoding
  • 10029 —Macintosh Central European encoding
  • 1200 —UCS-2LE Unicode 小端序 (BMP的ISO 10646, UTF-16LE )
  • 1201 —UCS-2BE Unicode 大端序 (unicodeFFFE)
  • 65000 — UTF-7 Unicode
  • 65001 — UTF-8 Unicode

codepageWindows(ANSI)代碼頁

  • 874 —泰文字母
  • 1250 —東歐拉丁字母
  • 1251 — 古斯拉夫語
  • 1252 —西歐拉丁字母ISO-8859-1.
  • 1253 — 希臘語
  • 1254 — 土耳其語
  • 1255 — 希伯來語
  • 1256 — 阿拉伯語
  • 1257 — 巴爾
  • 1258 — 越南
  • 1254 — 土耳其語
Windows-1252與ISO-8859-1並不完全一致。ISO-8859-1在0x80-0x9F範圍的控制字符,在Windows-1252中被可打印字符取代。由於在web網頁中,ASCII控制字符不起作用,所以網頁一般用Windows-1252代碼頁標記替代ISO-8859-1標記。
https://en.wikipedia.org/wiki/Windows_code_page
https://docs.microsoft.com/en-us/windows/win32/intl/code-page-identifiers?redirectedfrom=MSDN [1] 
參考資料