ECMAScript 6 中的 String 新特性

这篇博客介绍了ECMAScript 6(ES6)中字符串的新特性。

Unicode 代码点转义

Unicode 字符(代码点/code point)21位长 [2]。JavaScript 字符串(大约)16位字符序列,编码为utf-16。因此,超出第一个16位代码点范围(基本的多语种窗格,BMP)的代码点是由两个JavaScript字符表示。直到现在,如果你想通过数字指定这样的代码点,你需要两个所谓的Unicode转义。作为一个例子,下面的语句在大部分控制台输出一个rocket(代码点0x1f680):

在ECMAScript 6中,有一种新的Unicode转义,允许您指定任何代码点:

字符串插值,多行字符串和原始字符串字面值

模板字符串 [3]有三个有趣的特性。

首先,模板字符串支持字符串插值:

第二,模板字符串可以包含多行:

第三,如果你用 String.raw 标记字符串前缀,则模板字符串是“原始“的,反斜杠将不是特殊字符,转义符比如 n并不被解释:

遍历字符串

字符串可以迭代[4],这意味着您可以使用for-of来迭代他们:

您可以使用 spread 操作符 (…) 将字符串转化为数组:

处理Unicode代码点

字符串迭代器从代码点的边界分割字符串,这意味着它返回的字符串包含一个或两个字符:

下面是一个快速计算一个字符串的 Unicode 代码点长度的方法:

它还帮助反转包含 non-BMP 代码点的字符串:

新方法 codePointAt() 返回 [字符串给定索引的代码点的数值]:代码点的数值

该方法在迭代字符串时工作得很好:

codePointAt() 的反方法是 String.fromCodePoint():

检查包含和重复字符串

检查一个字符串是否在另一个字符串中存在,有 3 种方法:

每一个方法都有一个可选的第二个参数,它指定搜索字符串的开始或者结束位置:

repeat()方法重复字符串:

所有的新方法

模板字符串:

  • 模板字符串标记为“raw”的内容(反斜杠不转义)。

Unicode 和代码点:

  • 将表示Unicode代码点的数值转化为一个字符串。
  • 返回开始位置为pos的代码点的数值(包括一个或两个JavaScript“字符”)。
  • 代码点的不同的组合可能看起来是一样的。 Unicode normalization 把它们都转换成相同的值,即所谓的标准表示(canonical representation)。帮助比较与搜索字符串。‘NFC’格式被推荐用于普通文本。

查找字符串:

  • 字符串以searchString开始吗 position参数允许您指定的字符串检查的开始位置。
  • 字符串以searchString结束吗 endPosition参数允许您指定的字符串检查的结束位置。
  • 字符串包含searchString吗 position允许您指定字符串搜索的开始位置。

重复字符串:

  • 返回重复count次后的字符串。

进一步阅读

  1. Using ECMAScript 6 today [an early draft of my book on ECMAScript 6]
  2. Chapter 24, “Unicode and JavaScript” of “Speaking JavaScript”; includes an introduction to Unicode.
  3. Template strings: embedded DSLs in ECMAScript 6
  4. Iterators and generators in ECMAScript 6
1 1 收藏 评论

关于作者:cucr

新浪微博:@hop_ping 个人主页 · 我的文章 · 17

相关文章

可能感兴趣的话题



直接登录
跳到底部
返回顶部