将文本与 Unicode 码点双向转换,支持查看字符的 Unicode 编号、UTF-8/UTF-16 编码,适合国际化开发调试、查找特殊字符码点以及处理多语言文本编码问题。
Unicode 是通用字符编码标准,为每种语言的每个字符分配唯一码点,涵盖 150 多种文字的 14 万多个字符。
Unicode 是分配码点的标准(如 U+0041 代表字母 A),UTF-8 是将这些码点在内存或文件中表示为 1–4 字节的编码方式。
不同的字体、操作系统和渲染引擎对相同 Unicode 字符的视觉呈现可能不同,特别是表情符号(Emoji)——同一 Unicode 码点在苹果、谷歌和微软平台上有完全不同的设计风格。字符集问题(如 GB2312 vs UTF-8)可能导致中文字符显示为乱码,统一使用 UTF-8 可解决大多数跨平台编码问题。
Unicode 是字符集标准,定义了 100 多万个字符的码点(U+0000 到 U+10FFFF);UTF-8 和 UTF-16 是 Unicode 的不同编码实现。UTF-8:变长编码,英文 1 字节,中文 3 字节,向下兼容 ASCII,是 Web 标准;UTF-16:变长编码,基本平面 2 字节,JavaScript 和 Java 内部使用;UTF-32:定长 4 字节,处理简单但浪费空间。