Лорчик,
после контакта с внеземными цивилизациями остро встанет вопрос кодировок. Добавить новые код поинты в сам стандарт юникода не проблема. А как быть с UTF8?
По стандарту изначально предел UTF8 был равен шести байтам на код поинт, из которых только тридцать один бит нёс информацию – остальные служебные. На сегодня её длина дополнительно ограничена четырьмя байтами, то есть двадцатью одним информационным битом. А ведь это всего два миллиона девяносто семь тысяч сто пятьдесят два возможных код поинта. Многие из которых уже аллоцированы.
Готовы ли мы принять это или нужно уже сейчас задумываться над созданием более гибкой кодировки? Сколько байт будут занимать код поинты кириллицы, символ рубля?