字符编码中的相关概念
字符编码
将字符集中的字符用另一集合中的对象来表示,以便存储或传输。
从数学角度上说,就是一种映射,更准确地说,是一种单射函数,具有唯一确定性,但不存在多个字符映射为同一个码元!
常见的编码方式有,ASCII,摩尔斯电码等。
参考:
字符
一个基本信息单位,如字母,数字,标点符号,控制字符等。
参考:
字符集
字符的集合
代码页
字符编码的别名
参考:
码位
字符在编码表中的值,一般为非负整数。
注:
- 并不直接对应在计算机中的表达,如一个字符在unicode字符集中的码位,具体怎么表示,取决于编码方式(UTF-8,UTF-16…)
码元
已编码的字符集中占用最小的比特数,如UTF-8为8,UTF-16为16。
字形
一个可以辨认的抽象的图形符号,它不依赖于任何特定的设计,即字符的构成形式