LINUX.ORG.RU

что думаете о кодировках


0

0

Как вы считаете, какое будущее у кодировок? Проект Unicode по-моему скоро 10-летие справит ;) Хотя, он не справляется со своей функцией - все кодовые страницы ему в 65534 (?) не вместить. Я слышал еще о подобном проекте по стандартизации ;))) - таблицы разбиваются как в Unicode - по 128/256 байт на таблицу, но в целом имеет больший объем и позволит вместить в себя все кодовые страницы. Американский комитет по стандартизации этот проект заморозил. Чего я не пойму - почему изначально, когда ввели вместо 7, 8-битную ascii, не добавили код, который бы отвечал за идентификацию кодовой страницы.

По сему есть вопрос - как работают Autodetect-ы кодовых страниц? Судя по очень_частой кривизне работы таких детектов - у меня сложилось впечатление, что суть autodetect-а - найти такую кодовую страницу, где коды символом максиматольно влезали в диапазон печатаемых ;) Вообщем бред - кто-нибудь обмазговывал енто?

anonymous

имхо, автодетект работает по правило что некоторые буквы в тексте встречаются наиболее часто (например о или а) и по их кодам выбирается кодировка. имхо так.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.