LINUX.ORG.RU

История изменений

Исправление yyk, (текущая версия) :

Изначальная претензия была о том, что UTF-8 не позволяет хранить все символы 2-байтного юникода…

И ты можешиь привести код юникодного символа (codepoint), который можно выразить в utf-16 (пох le или be), но нельзя в utf-8?

Это проблемы нет на никсах, где все системные кодировки представимы в виде последовательности байт, но двухбайтовый юникод сам по себе не является последовательностью байт, поскольку есть как минимум два способа превращения (LE и BE).

Каждое слово в отдельности понимаю, даже некоторые словосочетания, всю фразу распарсить не могу…

Исходная версия yyk, :

Изначальная претензия была о том, что UTF-8 не позволяет хранить все символы 2-байтного юникода…

И ты можешиь привести код юникодного символа, который можно выразить в utf-16 (пох le или be), но нельзя в utf-8?

Это проблемы нет на никсах, где все системные кодировки представимы в виде последовательности байт, но двухбайтовый юникод сам по себе не является последовательностью байт, поскольку есть как минимум два способа превращения (LE и BE).

Каждое слово в отдельности понимаю, даже некоторые словосочетания, всю фразу распарсить не могу…