Автоматическое распознавание кодировок (анонс)
Я вот наконец обновил свою старую программку для распознавания русских кодировок. Старая версия (1997 года, называлась auto2unix) давала на выходе koi8-r, а теперь стало разумнее всё конвертировать в utf-8. Соответственно пришлось добавить распознавание utf-8. Программа теперь называется auto2utf.
Распознаются koi8-r, cp866, cp855, cp1251, iso-5, MacCyrillic, utf-8, utf-16, ucs-4. Вордовые файлы (MSWord) тоже приводятся к читабельному виду.
Использовать программу очень просто:
auto2utf входной_файл >выходной_файл
или
auto2utf <входной_файл >выходной_файл
Исходный код лежит здесь:
ftp://univ.uniyar.ac.ru/home/land/auto2utf.cc.gz
(вся программа состоит из одного файла)