LINUX.ORG.RU

Автоматическое распознавание кодировок (анонс)


0

0

Я вот наконец обновил свою старую программку для распознавания русских кодировок. Старая версия (1997 года, называлась auto2unix) давала на выходе koi8-r, а теперь стало разумнее всё конвертировать в utf-8. Соответственно пришлось добавить распознавание utf-8. Программа теперь называется auto2utf.

Распознаются koi8-r, cp866, cp855, cp1251, iso-5, MacCyrillic, utf-8, utf-16, ucs-4. Вордовые файлы (MSWord) тоже приводятся к читабельному виду.

Использовать программу очень просто:

auto2utf входной_файл >выходной_файл
или
auto2utf <входной_файл >выходной_файл



Исходный код лежит здесь:
ftp://univ.uniyar.ac.ru/home/land/auto2utf.cc.gz

(вся программа состоит из одного файла)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.