Unicode 是由 Unicode 联盟(一群对国际文本编码和计算应用感兴趣的公司和机构)开发的全球字符编码标准。Unicode 标准的开发旨在为多语言计算机程序中遇到的最常见和最严重的问题提供解决方案,包括“编码字符时字体机制的超载,以及由于国家字符标准冲突而导致的多个不一致字符代码的使用”。[ 1 ] Unicode 标准以以下方式区分字符和字形:“字符仅驻留在机器中,作为内存或磁盘上的字符串,在后备存储器中。Unicode 标准仅处理字符代码。与字符相反,字形在屏幕或纸张上显示为一个或多个后备存储器字符的特定表示。字形库构成字体。'[ 1 ] 因此,在 Unicode 术语中,字形和字符之间的关系不是一对一映射。例如,拉丁大写字母 A 被编码为 Unicode 字符 0041(十六进制),但在屏幕或纸张上的特定实例中表示该字符的视觉字形可能是 Times Roman A 或 Helvetica A 或 Courier A ,或任意数量的其他 A 形式,具体取决于为文本选择的字体样式。相反,拉丁字母 A (0041)、西里尔字母 A (0410) 和希腊字母 Alpha (0391) 是不同的 Unicode 字符,都可以用一个字形表示。即使在单个字母表中,多个字形也可能表示一个字符。例如,在阿拉伯字母表中,字母的书写形式取决于上下文,并且呈现给定字符的字形形状根据字符出现在文本字符串的首部、中间、结尾还是独立位置而不同。Unicode 1.0 不对这些异体变体进行编码(但请参阅下面的修订和更新)。
主要关键词