Web 浏览器必须知道要使用哪个字符集,才能正确显示 HTML 页面。
文章目录
- Web 浏览器必须知道要使用哪个字符集,才能正确显示 HTML 页面。
- 前言
- 一、HTML charset 属性
- 二、字符集之间的差异
- ASCII 字符集
- ANSI 字符集 (Windows-1252)
- ISO-8859-1 字符集
- UTF-8 字符集
- @charset CSS 规则
前言
ASCII 是第一个字符编码标准。ASCII 定义了 128 种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符,比如:! $ + - ( ) @ < >。
ISO-8859-1 是 HTML 4 的默认字符集。此字符集支持 256 个不同的字符代码。HTML 4 同时支持 UTF-8。
ANSI(Windows-1252) 是原始的 Windows 字符集。 ANSI 与 ISO-8859-1 相同,不同之处在于 ANSI 具有 32 个额外的字符。
HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,该字符集涵盖了世界上几乎所有的字符和符号!
一、HTML charset 属性
需要这在 meta 标签中指定:
<meta charset="UTF-8">
二、字符集之间的差异
下表展示了上述字符集之间的区别::
ASCII 字符集
- ASCII 使用 0 到 31(以及 127)之间的值作为控制字符。
- ASCII 使用 32 到 126 的值表示字母、数字和符号。
- ASCII 不使用 128 到 255 之间的值。
ANSI 字符集 (Windows-1252)
- 对于 0 到 127 的值,ANSI 与 ASCII 相同。
- ANSI 有一组专有的字符,其值从 128 到 159。
- 对于 160 到 255 的值,ANSI 与 UTF-8 相同。
ISO-8859-1 字符集
- 对于 0 到 127 的值,8859-1 与 ASCII 相同。
- 8859-1 不使用 128 到 159 之间的值
- 对于从 160 到 255 的值,8859-1 与 UTF-8 相同。
UTF-8 字符集
- 对于 0 到 127 的值,UTF-8 与 ASCII 相同。
- UTF-8 不使用 12 8到 159 之间的值。
- 对于 160 到 255 之间的值,UTF-8 与 ANSI 和 8859-1 相同。
- UTF-8 从值 256 继续,包含超过 10000 个不同字符。
@charset CSS 规则
可以使用 CSS @charset 规则来指定样式表中使用的字符编码:
将样式表的编码设置为 Unicode UTF-8:
@charset "UTF-8";