支持編碼的摘要

支持編碼的摘要
IANA 字符集注冊(cè)表內(nèi)的名稱 相關(guān)字符集 描述 額外的說明
ISO-10646-UCS-4 ISO 10646 31位編碼空間的通用字符集,以 ISO/IEC 10646 標(biāo)準(zhǔn)化為 UCS-4。 它和最新的 Unicode 代碼映射表保持同步。 如果在編碼轉(zhuǎn)化程序中使用了這個(gè)名字,轉(zhuǎn)換器將嘗試識(shí)別前綴的 BOM頭(字節(jié)順序標(biāo)記),即表示后續(xù)字節(jié)的字節(jié)序。
ISO-10646-UCS-4 UCS-4 參見以上。 UCS-4 相比較,字符串總是設(shè)為大端序(big endian)的形式。
ISO-10646-UCS-4 UCS-4 參見以上。 UCS-4 相比較,字符串總是設(shè)為小端序(little endian)的形式。
ISO-10646-UCS-2 UCS-2 16位編碼空間的通用字符集,以 ISO/IEC 10646 標(biāo)準(zhǔn)化為 UCS-2。它和最新的 Unicode 代碼映射表保持同步。 如果在編碼轉(zhuǎn)化程序中使用了這個(gè)名字,轉(zhuǎn)換器將嘗試識(shí)別前綴的 BOM頭(字節(jié)順序標(biāo)記),即表示后續(xù)字節(jié)的字節(jié)序。
ISO-10646-UCS-2 UCS-2 參見以上。 UCS-2 相比較,字符串總是設(shè)為大端序(big endian)的形式。
ISO-10646-UCS-2 UCS-2 參見以上。 UCS-2 相比較,字符串總是設(shè)為小端序(little endian)的形式。
UTF-32 Unicode 32 位單位寬度的 Unicode 轉(zhuǎn)換格式,涉及到了 Unicode 字符集標(biāo)準(zhǔn)。該編碼方案和 UCS-4 沒有完全相同,因?yàn)?Unicode 編碼空間限制為 21 位的值。 如果在編碼轉(zhuǎn)化程序中使用了這個(gè)名字,轉(zhuǎn)換器將嘗試識(shí)別前綴的 BOM頭(字節(jié)順序標(biāo)記),即表示后續(xù)字節(jié)的字節(jié)序。
UTF-32BE Unicode 參見以上 UTF-32 相比較,字符串總是設(shè)為大端序(big endian)的形式。
UTF-32LE Unicode 參見以上 UTF-32 相比較,字符串總是設(shè)為小端序(little endian)的形式。
UTF-16 Unicode 16 位單位寬度的 Unicode 轉(zhuǎn)換格式。值得一記的是,UTF-16 的規(guī)格不再和 UCS-2 一樣, 因?yàn)?Unicode 2.0 引入了代理機(jī)制(surrogate mechanism),UTF-16 現(xiàn)在指向了 21 位的編碼空間。 如果在編碼轉(zhuǎn)化程序中使用了這個(gè)名字,轉(zhuǎn)換器將嘗試識(shí)別前綴的 BOM頭(字節(jié)順序標(biāo)記),即表示后續(xù)字節(jié)的字節(jié)序。
UTF-16BE Unicode 參見以上。 UTF-16 相比較,字符串總是設(shè)為大端序(big endian)的形式。
UTF-16LE Unicode 參見以上。 UTF-16 相比較,字符串總是設(shè)為小端序(little endian)的形式。
UTF-8 Unicode / UCS 8 位單位寬度的 Unicode 轉(zhuǎn)換格式。 none
UTF-7 Unicode 一種郵件安全的 Unicode 轉(zhuǎn)換格式,規(guī)格是 ? RFC2152。 none
(none) Unicode UTF-7 的一種變體,其規(guī)格在 ? IMAP 協(xié)議 中用到了。 none
US-ASCII (首選 MIME 名稱) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII ASCII / ISO 646 美國(guó)標(biāo)準(zhǔn)代碼(American Standard Code)是一種常用的 7-bit 信息交換編碼。同樣,標(biāo)準(zhǔn)化為 ISO 646 國(guó)際標(biāo)準(zhǔn)。 (none)
EUC-JP (首選 MIME 名稱) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese US-ASCII / JIS X0201:1997 (半角假名部分) / JIS X0208:1990 / JIS X0212:1990 的復(fù)合 就像你所看到的,名字來源于擴(kuò)展 Extended UNIX Code Packed Format for Japanese 的縮寫,該編碼常用于 UNIX 或類似平臺(tái)。原始編碼方案 Extended UNIX Code 基于 ISO 2022 而設(shè)計(jì)。 EUC-JP 涉及的字符集和 IBM932 / CP932 是不一樣的,后者使用于 OS/2? 和 Microsoft? Windows?。 這些平臺(tái)上的信息交換,使用 EUCJP-WIN 來代替。
Shift_JIS (首選 MIME 名稱) / MS_Kanji / csShift_JIS JIS X0201:1997 / JIS X0208:1997 的復(fù)合 80 年代初,個(gè)人日文文字處理軟件進(jìn)入了市場(chǎng)之時(shí),為了兼容傳統(tǒng)編碼方案 JIS X 0201:1976,開發(fā)了 Shift_JIS。 根據(jù) IANA 對(duì) Shift_JIS 編碼集的定義,和 IBM932 / CP932 稍有不同。但 "SJIS"、"Shift_JIS" 的名稱常被錯(cuò)誤得指向這些編碼集。 要使用 CP932,使用 SJIS-WIN 作為替代。
(none) JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 的復(fù)合 雖然此 "encoding" 使用了 EUC-JP 同樣的方案,一些字符集有所不同。 也就是說,一些編碼映射到了和 EUC-JP 不同的字符。 none
Windows-31J / csWindows31J JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions 的符合 雖然此 "encoding" 使用了 Shift_JIS 同樣的方案,一些字符集有所不同。 也就是說,一些編碼映射到了和 Shift_JIS 不同的字符。 (none)
ISO-2022-JP (首選 MIME 名稱) / csISO2022JP US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 ? RFC1468 (none)
JIS
ISO-8859-1
ISO-8859-2
ISO-8859-3
ISO-8859-4
ISO-8859-5
ISO-8859-6
ISO-8859-7
ISO-8859-8
ISO-8859-9
ISO-8859-10
ISO-8859-13
ISO-8859-14
ISO-8859-15
ISO-8859-16
byte2be
byte2le
byte4be
byte4le
BASE64
HTML-ENTITIES
7bit
8bit
EUC-CN
CP936
HZ
EUC-TW
CP950
BIG-5
EUC-KR
UHC (CP949)
ISO-2022-KR
Windows-1251 (CP1251)
Windows-1252 (CP1252)
CP866 (IBM866)
KOI8-R
KOI8-U