Здравия!
Есть идея изменить маленько UTF-8 чтобы русские буквы помещались в байт. Мне это надо самому для написания форума, ну и вот думаю,может еще кому пригодится...
Идея простая. То же что и UTF-8, но флаг помещается не в 8-й бит байта, а с 7 байт в отдельном, восьмом байте, составляя 64-битный блок.
Кроме того, 64-й бит по умолчанию выставляется в 1, таким образом значение 0x00 остается прежним - конец строки, и вся кодировка полностью совместима с библиотекой stdio.h, которую я очень люблю...
Далее, если 64-й бит все же 0, то это трактуется так: вся строка написана в кодировке ASCII.
Самое интересное что в первый байт можно поместить Русские буквы. Мне для моих целей нужна Кириллица, строчные буквы Глаголицы. Еще место останется для Греческого (используется в физике и математике), и возможно даже Футарк - для любителей RPG игр.
Если кому идея нравится, я сделаю сайт для дискуссии/публикации стан- дарта и имплементаций...
Успехов!