осществляю поиск регулярным выражением по строке в utf-8. на выходе получаю int-массив, в котором находятся положения найденных подстрок. но, как известно, символы в юникоде могут состоять больше, чем из одного байта, а в массиве именно номера байтов. как можно из них получить номера символов?
Ответ на:
комментарий
от anonymous
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Форум Небольшой интересный ньюанс про UTF-8 (2007)
- Форум отрицание символа в регулярном выражении (2011)
- Форум чтение любого файла так, как будто он utf-8 (2021)
- Форум Java. Русская заглавная буква 'И' и UTF-8 (2007)
- Форум [регулярные выражения] извлечение подстроки из найденной строки ? (2010)
- Форум помогите составить запрос в mongodb (2016)
- Форум Почему UTF-8 именно такой? (2014)
- Форум Поиск и удаления начальных символов (2016)
- Новости Релиз библиотеки libfatchars 0.4 и использующей её программы raskormiknigu 0.1 (2017)
- Форум преобразование переменной time_t (2004)