JavaScript 计算字符串长度时,返回的是 UTF-16 代码单元的个数,而非字符个数。要精确计算字符个数,需考虑代理对和规范化,可以使用 [...str].length 来实现。
你可能觉得计算 JavaScript 字符串长度很简单,string.length 一行代码搞定。但事情真的如此吗? 这篇文章会带你深入了解 JS 字符串长度的计算机制,以及一些你可能遇到的坑,并分享一些我多年编程经验中总结出的技巧。读完之后,你对 JS 字符串长度的理解将会有质的飞跃。
基础知识:字符编码与字符串
JavaScript 使用 Unicode 编码来表示字符。 Unicode 旨在涵盖世界上所有字符,每个字符都有一个唯一的代码点。 但 Unicode 的实现方式有很多种,例如 UTF-8、UTF-16 等。 string.length 属性返回的是字符串的 UTF-16 代码单元的个数,而不是字符个数。 这就意味着,对于某些字符,特别是那些在基本多语言平面 (BMP) 之外的字符(例如一些emoji),string.length 的结果可能与你直观感受到的字符个数不一致。
核心概念:代码单元与字符
UTF-16 使用 16 位代码单元来表示字符。 大多数常用字符都可以用一个代码单元表示,但某些字符需要两个代码单元(代理对)来表示。 string.length 统计的是代码单元的个数。 如果你想精确计算字符个数,就需要考虑这些代理对。
代码示例:揭示真相
让我们来看一些例子:
let str1 = "Hello, world!"; console.log(str1.length); // 输出 13 (13个代码单元) let str2 = "你好,世界!"; console.log(str2.length); // 输出 10 (10个代码单元) 每个汉字占用两个代码单元 let str3 = "
以上就是js字符串长度怎么计算的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号