字符編碼查看 編碼查看字符

最近查詢記錄

UTF-8转簡體中文(GB2312)編碼 UTF-8转繁體中文(Big5)編碼 繁體中文(Big5)編碼转字符串 簡體中文(GB2312)編碼转字符串 UTF-8转ISO-6937編碼 UTF-8转Unicode (UTF-8)編碼 UTF-8转Unicode (Big-Endian)編碼 UTF-8转日語(Shift-JIS)編碼 UTF-8转Unicode (UTF-32)編碼 UTF-8转日語(EUC)編碼 UTF-8转簡體中文(ISO-2022)編碼 UTF-8转簡體中文(EUC)編碼 日語(Shift-JIS)編碼转字符串 簡體中文(GB2312-80)編碼转字符串 Unicode (UTF-32)編碼转字符串 Unicode (UTF-8)編碼转字符串 越南字符(Windows)編碼转字符串 日語(EUC)編碼转字符串 日語(JIS)編碼转字符串 日语(JIS-允许 1 字节假名)編碼转字符串 日語(Mac)編碼转字符串 UTF-8转US-ASCII編碼 UTF-8转繁體中文(CNS)編碼 Unicode (Big-Endian)編碼转字符串 UTF-8转OEM 美国編碼 Unicode (UTF-7)編碼转字符串 韓語(EUC)編碼转字符串 UTF-8转韓語(EUC)編碼 UTF-8转簡體中文(GB18030)編碼 UTF-8转簡體中文(HZ)編碼 UTF-8转Unicode編碼 簡體中文(GB18030)編碼转字符串 UTF-8转簡體中文(GB2312-80)編碼 Unicode (UTF-32 Big-Endian)編碼转字符串 UTF-8转TCA 中国台湾編碼 UTF-8转簡體中文(Mac)編碼 UTF-8转西歐字符(IA5)編碼 UTF-8转日语(JIS-允许 1 字节假名)編碼 UTF-8转OEM 多语言拉丁语 I編碼 UTF-8转西歐字符(ISO)編碼 Unicode編碼转字符串 UTF-8转Unicode (UTF-32 Big-Endian... UTF-8转Wang 中国台湾編碼 簡體中文(ISO-2022)編碼转字符串 UTF-8转德語(IA5)編碼 UTF-8转韓語編碼 簡體中文(EUC)編碼转字符串 UTF-8转希伯來字符(ISO-Visual)編碼 ISCII 孟加拉语編碼转字符串 UTF-8转拉丁语 9 (ISO)編碼 UTF-8转中歐字符(ISO)編碼 簡體中文(HZ)編碼转字符串 UTF-8转Unicode (UTF-7)編碼 UTF-8转IBM EBCDIC (韓語扩展)編碼 UTF-8转土耳其字符(ISO)編碼 阿拉伯字符(ISO)編碼转字符串 希伯來字符(Mac)編碼转字符串 ISCII 旁遮普语編碼转字符串 UTF-8转日語(JIS)編碼 繁體中文(Mac)編碼转字符串 中歐字符(Windows)編碼转字符串 UTF-8转中歐字符(Windows)編碼 中歐字符(ISO)編碼转字符串 UTF-8转IBM EBCDIC (阿拉伯语)編碼 IBM EBCDIC (阿拉伯语)編碼转字符串 UTF-8转韓語(ISO)編碼 UTF-8转日語(Mac)編碼 韓語(ISO)編碼转字符串 西歐字符(ISO)編碼转字符串 OEM 美国編碼转字符串 IBM EBCDIC (西里尔俄语)編碼转字符串 簡體中文(Mac)編碼转字符串 UTF-8转TeleText 中国台湾編碼 UTF-8转ISCII 旁遮普语編碼 UTF-8转ISCII 阿萨姆语編碼 UTF-8转西裏爾字符(ISO)編碼 繁體中文(CNS)編碼转字符串 UTF-8转T.61編碼 UTF-8转ISCII 泰卢固语編碼 UTF-8转IBM EBCDIC (英国-欧洲)編碼 UTF-8转希臘字符(DOS)編碼 ISCII 古吉拉特语編碼转字符串 UTF-8转ISCII 古吉拉特语編碼 US-ASCII編碼转字符串 UTF-8转葡萄牙語(DOS)編碼 葡萄牙語(DOS)編碼转字符串 韓語編碼转字符串 UTF-8转IBM EBCDIC (美国-加拿大)編碼 韓語(Mac)編碼转字符串 UTF-8转韓語(Mac)編碼 UTF-8转韓語 Wansung編碼 拉丁语 9 (ISO)編碼转字符串 UTF-8转繁體中文(Mac)編碼 UTF-8转越南字符(Windows)編碼 韓語 Wansung編碼转字符串 ISCII 梵文編碼转字符串 ISCII 泰米尔语編碼转字符串 ISCII 泰卢固语編碼转字符串 ISCII 阿萨姆语編碼转字符串 ISCII 奥里雅语編碼转字符串

Unicode 是容纳世界所有文字符号的国际标准編碼,使用四个字节为每个字符編碼。

UTF 是英文 Unicode Transformation Format 的缩写,意为把 Unicode 字符轉換为某种格式。UTF 系列編碼方案(UTF-8、UTF-16、UTF-32)均是由 Unicode 編碼方案衍变而来,以适应不同的数据存储或传递,它们都可以完全表示 Unicode 标准中的所有字符。目前,这些衍变方案中 UTF-8 被广泛使用,而 UTF-16 和 UTF-32 则很少被使用。

UTF-8 使用一至四个字节为每个字符編碼,其中大部分汉字采用三个字节編碼,少量不常用汉字采用四个字节編碼。因为 UTF-8 是可变长度的編碼方式,相对于 Unicode 編碼可以减少存储占用的空间,所以被广泛使用。

UTF-16 使用二或四个字节为每个字符編碼,其中大部分汉字采用两个字节編碼,少量不常用汉字采用四个字节編碼。UTF-16 編碼有大尾序和小尾序之别,即 UTF-16BE 和 UTF-16LE,在編碼前会放置一个 U+FEFF 或 U+FFFE(UTF-16BE 以 FEFF 代表,UTF-16LE 以 FFFE 代表),其中 U+FEFF 字符在 Unicode 中代表的意义是 ZERO WIDTH NO-BREAK SPACE,顾名思义,它是个没有宽度也没有断字的空白。

UTF-32 使用四个字节为每个字符編碼,使得 UTF-32 占用空间通常会是其它編碼的二到四倍。UTF-32 与 UTF-16 一样有大尾序和小尾序之别,編碼前会放置 U+0000FEFF 或 U+0000FFFE 以区分。

xxfseo.com