LINUX.ORG.RU

pcre & utf-8


0

0

осществляю поиск регулярным выражением по строке в utf-8. на выходе получаю int-массив, в котором находятся положения найденных подстрок. но, как известно, символы в юникоде могут состоять больше, чем из одного байта, а в массиве именно номера байтов. как можно из них получить номера символов?

★★★
Ответ на: комментарий от anonymous

> что есть другие варианты?

не знаю. потому и спрашиваю.

friday ★★★
() автор топика

берешь байт на который показывает индекс, смортишь на него и определяешь сколько байт еще нужно считать.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.