LINUX.ORG.RU

Извлечено из zip-архива? Я так и не придумал, что с этим делать. Виртуалка с вендой спасла.

CYB3R ★★★★★
()
Ответ на: комментарий от anonymous
echo 'Кому потрібні фемтосоти' |iconv -f utf8 -t ISO-8859-1
Кому потрібні фемтосоти
anonymous
()

Они все в одной кодировке?

Тогда bash+iconv+mv+find

anonymous
()

как вариант :

convmv -f cp866 -t utf8 -r --notest *
не факт что поможет, но всё же...

Gramozeka ★★
()

вот ещё приблуда для наутилуса (не проверял, но некоторые хвалят) тыц

Gramozeka ★★
()
Ответ на: комментарий от anonymous

Ага, оно:

convmv -f utf8 -t iso-8859-1 --notest *

Странное направление преобразования, конечно, но работает.

Всем спасибо.

post-factum ★★★★★
() автор топика
Ответ на: комментарий от GreyDoom

Не нагуглил. Можно больше ключевых слов?

CYB3R ★★★★★
()

Тут описано.

The UnZip package assumes that filenames stored in the ZIP archives created on non-Unix systems are encoded in CP850, and that they should be converted to ISO-8859-1 when writing files onto the filesystem. Such assumptions are not always valid. In fact, inside the ZIP archive, filenames are encoded in the DOS codepage that is in use in the relevant country, and the filenames on disk should be in the locale encoding. In MS Windows, the OemToChar() C function (from User32.DLL) does the correct conversion (which is indeed the conversion from CP850 to a superset of ISO-8859-1 if MS Windows is set up to use the US English language), but there is no equivalent in Linux.

When using unzip to unpack a ZIP archive containing non-ASCII filenames, the filenames are damaged because unzip uses improper conversion when any of its encoding assumptions are incorrect. For example, in the ru_RU.KOI8-R locale, conversion of filenames from CP866 to KOI8-R is required, but conversion from CP850 to ISO-8859-1 is done, which produces filenames consisting of undecipherable characters instead of words (the closest equivalent understandable example for English-only users is rot13).

CYB3R ★★★★★
()
Ответ на: комментарий от anonymous

Это описание, почему сбивается кодировка, если мы используем unzip. Дальше инструкция, как это лечить:

convmv -f iso-8859-1 -t cp850 -r --nosmart --notest \
    </path/to/unzipped/files>
convmv -f cp866 -t koi8-r -r --nosmart --notest \
    </path/to/unzipped/files>

CYB3R ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.