HTML 字符集

2024 年 8 月 28 日 | 阅读 2 分钟

HTML 字符集也称为 HTML 字符集或 HTML 编码。它用于正确、准确地显示 HTML 页面,因为要正确显示任何内容,Web 浏览器必须知道使用哪个字符集(字符编码)。

HTML 字符编码

有各种类型的字符编码,如下所示

ASCII 字符集

ASCII 是 American Standard Code for Information Interchange 的缩写。在 HTML 中,第一个字符编码标准是 ASCII 标准。ASCII 提供了 128 种不同的字母数字字符,可以在互联网上使用:数字(0-9)、英文字母(A-Z)以及一些特殊字符,如 ! $ + - ( ) @ <> .

ASCII 编码的主要问题是它包含的字符范围有限。它主要包含 128 个字符。

ANSI 字符集

ANSI 是 **American National Standard Institute** 的缩写。它是一个字符集标准,是标准 ASCII 字符集的扩展版本。它支持 256 个字符集。ANSI 也称为 Windows-1252,它是 Windows 直到 Windows 95 的默认字符集。

ISO-8859-1 字符集

ISO-8859-1 是 HTML 2.0 中的默认字符编码。它也是 ASCII 标准的国际字符扩展。它还使用完整的字节(8 位)来显示字符。

UTF-8 字符集

UTF-8 是一种可变宽度字符编码,几乎涵盖了世界上所有的字符和符号。ANSI(Windows-1252)是原始的 Windows 字符集,支持 256 种不同的字符代码。

ISO-8859-1 是 HTML 4 的默认字符集。该字符集也支持 256 种不同的字符代码。

为什么 HTML4 也支持 UTF-8?

因为 ANSI 和 ISO-8859-1 的局限性很大,HTML 4 也支持 UTF-8。HTML5 的默认字符编码是 UTF-8。

HTML4 的 UTF-8 语法

HTML5 的 UTF-8 语法


下一个主题HTML URL 编码