Gần nhất với một ký tự mà người dùng nhìn thấy, gồm emoji ghép và dấu kết hợp.
Đếm giá trị Unicode scalar. Emoji modifier và dấu kết hợp có thể được tính riêng.
Độ dài chuỗi trong JavaScript. Một số emoji và ký tự hiếm tính thành hai đơn vị.
Khi hỗ trợ, dùng tách từ theo ngôn ngữ thay vì chỉ tách bằng khoảng trắng.
Đếm số byte cần khi mã hóa văn bản bằng UTF-8.
Đếm số dòng văn bản được phân tách bằng xuống dòng.
Đếm theo ngôn ngữ
Khi được hỗ trợ, công cụ dùng ngôn ngữ hiện tại (vi) để tách từ bằng Intl.Segmenter, quan trọng với các ngôn ngữ không luôn tách từ bằng dấu cách.