LINUX.ORG.RU

Исправление битой кодировки


0

1

Имеется ScientificLinux 6.5 (вроде. последний, короче). На входе имею текстовый файл, представляющий собой смесь английского и русского в utf-8 и 1251. Хочется исправить кодировку на utf-8 во всём файле.

Хочется обойтись без написания отдельных программ, только bash и стандартными утилитами из репозитория.

Подскажете к каким утилитам читать доку? ;-)

★★★★★

Ответ на: комментарий от zaharov

Не подходит. iconv -cs -f cp1251 -t utf8 <файл> исправляет 1251, но превращает utf8 в кракозябры.

atrus ★★★★★
() автор топика

Уже не надо. На перле набыдлокодил. :)

atrus ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

Ясно, 4-х байтовый utf8mb4 поддерживается.

KRoN73 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.