История изменений
Исправление x3al, (текущая версия) :
Мне казалось, что utf32 имеет 4 байта и это пока предел. я не прав?
Так тебе же всё равно обрабатывать комбинирующие символы, среди которых есть весьма милые вещи. И RTL/LTR отделять от слова достаточно весело.
а есть там подмножество где непротяженные знаки запрещены?
ASCII где-то в восьмидесятых годах прошлого века.
Кодировки юникода, в которой одна графема == один codepoint с заранее известным размером, нет и не будет, он развивается в противоположную сторону (разбиваются все прекомбинированные символы, поскольку соединять их — работа софта).
Исходная версия x3al, :
Мне казалось, что utf32 имеет 4 байта и это пока предел. я не прав?
Так тебе же всё равно обрабатывать комбинирующие символы, среди которых есть весьма милые вещи. И RTL/LTR отделять от слова достаточно весело.
а есть там подмножество где непротяженные знаки запрещены?
ASCII где-то в восьмидесятых годах прошлого века. Кодировки юникода, в которой одна графема == один codepoint с заранее известным размером, нет и не будет, он развивается в противоположную сторону (разбиваются все прекомбинированные символы, поскольку соединять их — работа софта).