LINUX.ORG.RU

История изменений

Исправление dzidzitop, (текущая версия) :

Перевод строки ('\n') в процесс разбора текста проблем никаких не приносит. А вот различные формы репрезентации в одном и том же Unicode разных там źćčšŭł - это уже интереснее. Если работать в подпространстве ASCII - то жить легко и просто в любом UTF. А если работать с Unicode текстом на любом более-менее семантическом уровне разбора «символов» - появляются нюансы.

чему равен sizeof(u32"Ščytok")?

чему равен sizeof(u"ой-ё-ёй")?

ответ - зависит от того, в какой форме сохранён этот текст.

Исправление dzidzitop, :

Перевод строки ('\n') в процесс разбора текста проблем никаких не приносит. А вот различные формы репрезентации в одном и том же Unicode разных там źćčšŭł - это уже интереснее. Если работать в подпространстве ASCII - то жить легко и просто в любом UTF. А если работать с Unicode текстом на любом более-менее семантическом уровне разбора «символов» - появляются нюансы.

чему равен sizeof(u32"Ščytok")? чему равен sizeof(u"ой-ё-ёй")?

ответ - зависит от того, в какой форме сохранён этот текст.

Исходная версия dzidzitop, :

Перевод строки ('\n') в процесс разбора текста проблем никаких не приносит. А вот различные формы репрезентации в одном и том же Unicode разных там źćčšŭł - это уже интереснее. Если работать в подпространстве ASCII - то жить легко и просто в любом UTF. А если работать с Unicode текстом на любом более-менее семантическом уровне разбора «символов» - появляются нюансы.