Я вот наконец обновил свою старую программку для распознавания русских кодировок. Старая версия (1997 года, называлась auto2unix) давала на выходе koi8-r, а теперь стало разумнее всё конвертировать в utf-8. Соответственно пришлось добавить распознавание utf-8. Программа теперь называется auto2utf.
Распознаются koi8-r, cp866, cp855, cp1251, iso-5, MacCyrillic, utf-8, utf-16, ucs-4. Вордовые файлы (MSWord) тоже приводятся к читабельному виду.
Использовать программу очень просто:
auto2utf входной_файл >выходной_файл
или
auto2utf <входной_файл >выходной_файл
Исходный код лежит здесь:
ftp://univ.uniyar.ac.ru/home/land/auto2utf.cc.gz
(вся программа состоит из одного файла)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Форум автоматические определители кодировок (2005)
- Форум Автоматическое распознавание каптчи (2011)
- Форум Анонс (2009)
- Форум Анонсы (2008)
- Форум Распознавание такое распознавание (2011)
- Форум конвертилка кодировок (2003)
- Форум проблема кодировок (2006)
- Форум Преобразование кодировок (2006)
- Форум конвертер кодировок (2005)
- Форум Распознавание (2007)