LINUX.ORG.RU

История изменений

Исправление anonymous_incognito, (текущая версия) :

А теперь запутываешь ты. Вот цитата из The Unicode Standard Version 9.0 – Core Specification:

Как бы тебе сказать, ну формально да. CodePoints - это не символ, потому что могут быть ещё и модификаторы, которые конструируют букву, например, символы ударения в тексте сами по себе не выводятся (выводятся там где юникод некачественно поддержан), а изображается буква с символом ударения сверху. Тем не менее, для начала проще думать об Юникоде, как о таблице символов, аналогично ASCII, в которой каждый элемент называется CodePoint. И кодируется по-разному в разных представлениях Юникода.

И при чём тут UTF-16? Это же просто ещё один из видов кодировок.

Тут без поллитра не разобраться :-) Потому что UTF-16 - не просто вид кодировки, а усечённое подмножество полного юникода, кстати, utf-8 в этом смысле полнее.

Исходная версия anonymous_incognito, :

А теперь запутываешь ты. Вот цитата из The Unicode Standard Version 9.0 – Core Specification:

Как бы тебе сказать, ну формально да. CodePoints - это не символ, потому что могут быть ещё и модификаторы, которые конструируют букву, например, символы ударения в тексте сами по себе не выводятся (выводятся там где юникод некачественно поддержан), а изображается буква с символом ударения сверху. Тем не менее, для начала проще думать об Юникоде, как о таблице символов, аналогично ASCII.

И при чём тут UTF-16? Это же просто ещё один из видов кодировок.

Тут без поллитра не разобраться :-) Потому что UTF-16 - не просто вид кодировки, а усечённое подмножество полного юникода, кстати, utf-8 в этом смысле полнее.