Code point(码点/码位)是指在字符编码标准(如 Unicode)中,分配给每个字符的唯一数值标识。每一个字母、符号或表情都对应一个码点,例如字母 "A" 的 Unicode 码点是 U+0041。
/ˈkoʊd pɔɪnt/
Every character in Unicode is assigned a unique code point.
Unicode 中的每个字符都被分配了一个唯一的码点。
When processing multilingual text, developers must be careful to handle surrogate pairs, because some code points beyond the Basic Multilingual Plane require two 16-bit code units in UTF-16 encoding.
在处理多语言文本时,开发者必须小心处理代理对,因为基本多文种平面之外的某些码点在 UTF-16 编码中需要两个 16 位的编码单元。
Code 源自拉丁语 codex(意为"书册、法典"),后演变为"编码、代码"之意。Point 源自拉丁语 punctum(意为"点、刺")。Code point 作为计算机术语,最早随字符编码标准的发展而出现,特别是在 Unicode 标准(1991 年发布)中被广泛使用,指代编码空间中的一个位置,即一个抽象字符在编码表中所对应的数值。