Внезапно подумалось, что было бы очень хорошо если бы кто-нибудь взялся разработать отечественный аналог UTF-32 под названием КОИ32. Тогда бы можно было убрать модификаторы, и получить абсолютно правильную кодировку, в которой каждый символ всегда ровно 4 байта.
Полезная бы получилась кодировка.