V2EX  ›  英汉词典
Enqueued related words: Character set

UTF-8

定义 Definition

UTF-8 是一种可变长度的字符编码方式,用于在计算机中表示 Unicode 字符集中的所有字符。它是目前互联网上最广泛使用的字符编码标准,能够兼容 ASCII 编码,同时支持世界上几乎所有语言的文字。

发音 Pronunciation

/ˌjuː tiː ɛf ˈeɪt/

例句 Examples

Most modern websites use UTF-8 encoding to display text in multiple languages.
大多数现代网站使用 UTF-8 编码来显示多种语言的文本。

When your web page shows garbled characters, it's often because the file was not saved in UTF-8 encoding, which causes the browser to misinterpret the byte sequences.
当你的网页显示乱码时,通常是因为文件没有以 UTF-8 编码保存,导致浏览器错误地解读了字节序列。

词源 Etymology

UTF-8 是 Unicode Transformation Format – 8-bit 的缩写。它由 Ken Thompson 和 Rob Pike 于1992年设计。Unicode 是一个旨在为世界上所有文字系统提供统一编码的标准,而 UTF-8 是其最常用的实现方式之一。其中的 8 指的是它以8位(即一个字节)为基本编码单元,使用1到4个字节来表示不同的字符——ASCII 字符只需1个字节,而中文汉字通常需要3个字节。

相关词汇 Related Words

文学与技术文献引用 Notable References

  • 《The Unicode Standard》——Unicode 联盟出版的权威参考书,详细描述了 UTF-8 等编码方式的技术规范。
  • RFC 3629(UTF-8, a transformation format of ISO 10646)——由 François Yergeau 撰写的互联网标准文档,正式定义了 UTF-8 的规范。
  • Joel Spolsky 的著名文章《The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)》——一篇广为流传的技术科普文章,深入浅出地介绍了 UTF-8 与字符编码的基本知识。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3631 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 04:45 · PVG 12:45 · LAX 21:45 · JFK 00:45
♥ Do have faith in what you're doing.