可见字符28

最接近用户看到的“一个字符”,包括组合 Emoji 和重音字符。

Unicode 码点32

统计 Unicode 标量值,Emoji 修饰符和组合符可能会单独计数。

UTF-16 单元34

JavaScript 字符串长度,部分 Emoji 和罕见字符会算作两个单元。

按语言分词7

支持时使用按语言的分词方式,而不是只按空格拆分。

UTF-8 字节82

统计文本用 UTF-8 编码时占用的字节数。

行数2

统计由换行符分隔的文本行数。

按当前语言统计

支持时会使用当前语言(zh-CN)进行分词,这对不总是用空格分词的语言很重要。