Интересует такой вопрос: при смене регистра букв в UTF-строке сохраняется ли такая же длина?
Например:
"аБв" - длина строки в байтах равна 6
"абв" - длина строки в байтах равна 6
"АБВ" - длина строки в байтах равна 6
С русским диапазоном понятно, всё гуд - на каждую букву по два байта. А как с другими диапазонами (японский, арабский и т.д.)?
Похожие темы
- Форум принцип кодировки UTF-8 (2005)
- Форум Кодировочки или utf-8 и все все все... (2015)
- Форум Русская альтернатива UTF-8 (2005)
- Форум Как работают регексы на utf-8? (2020)
- Форум Как сделать less нечувствительным к регистру (UTF)? (2007)
- Форум enconv - как сделать чтобы UTF-8 файлы стали с BOM? (2012)
- Форум Java. Русская заглавная буква 'И' и UTF-8 (2007)
- Форум Максимальная длина имени файла (2020)
- Форум c++ и utf-8 (2018)
- Форум Работа со строками в ASCII и UTF-8 (2009)