UTF-8 是一种可变长度的字符编码方式,用于在计算机中表示 Unicode 字符集中的所有字符。它是目前互联网上最广泛使用的字符编码标准,能够兼容 ASCII 编码,同时支持世界上几乎所有语言的文字。
/ˌjuː tiː ɛf ˈeɪt/
Most modern websites use UTF-8 encoding to display text in multiple languages.
大多数现代网站使用 UTF-8 编码来显示多种语言的文本。
When your web page shows garbled characters, it's often because the file was not saved in UTF-8 encoding, which causes the browser to misinterpret the byte sequences.
当你的网页显示乱码时,通常是因为文件没有以 UTF-8 编码保存,导致浏览器错误地解读了字节序列。
UTF-8 是 Unicode Transformation Format – 8-bit 的缩写。它由 Ken Thompson 和 Rob Pike 于1992年设计。Unicode 是一个旨在为世界上所有文字系统提供统一编码的标准,而 UTF-8 是其最常用的实现方式之一。其中的 8 指的是它以8位(即一个字节)为基本编码单元,使用1到4个字节来表示不同的字符——ASCII 字符只需1个字节,而中文汉字通常需要3个字节。