LINUX.ORG.RU

чем посмотреть?


0

0

Есть файл. Неизвестна его кодировка.
1) как узнать его кодировку?


P.S. - а то я уж думал наваять скрипт который перебирает все кодировки и перекодирует мне его koi8-r

Есть подозрение что файл в кодировке UNICODE
но
iconv -c --from-code=UNICODE --to-code=koi8-r --verbose sys.bpl > /tmp/sys.txt

не дает читабельного результата.

> 1) как узнать его кодировку?

file /path/to/file.txt

JB ★★★★★
()

Да такой кодировки как UNICODE и нет. utf-8, utf-16 есть. Скорее всего это utf-8 (хотя, если текст английский, точно не utf-8). Пробуй utf-8 (или utf8).

Envel ★★★
()
Ответ на: комментарий от sasaimns

>file sys.bpl возвращает sys.bpl: MS-DOS executable (EXE), OS/2 or MS Windows

Так он же в этом случае бинарным должен быть, или я не прав?

genmaxxx
()
Ответ на: комментарий от sasaimns

родной !,я имел ввиду НЕ ICONV а ИМЕННО программу WHATRUS из пакета RUSCONV

сам rusconv , помоему, unicode не перекодирует
ftp://ftp.kiarchive.ru/pub/unix/convert/char/rusconv.3.11.tar.gz
http://www.opennet.ru/prog/info/514.shtml?skip=-5
PS
http://dret.net/glossary/utf
http://dret.net/glossary/ucs

botrops-schlegelii ★★
()
Ответ на: комментарий от sasaimns

UTF-8
ISO-10646-UCS-2 UCS-2 CSUNICODE
UCS-2BE UNICODE-1-1 UNICODEBIG CSUNICODE11
UCS-2LE UNICODELITTLE
ISO-10646-UCS-4 UCS-4 CSUCS4
UCS-4BE
UCS-4LE
UTF-16
UTF-16BE
UTF-16LE
UTF-32
UTF-32BE
UTF-32LE
UNICODE-1-1-UTF-7 UTF-7 CSUNICODE11UTF7
UCS-2-INTERNAL
UCS-2-SWAPPED
UCS-4-INTERNAL
UCS-4-SWAPPED

botrops-schlegelii ★★
()
Ответ на: комментарий от genmaxxx

Прав.. Но там есть текст который мне надо выташить. Т.е в теле bpl есть читабельные слова. Вот из мне и надо выташить.

sasaimns
() автор топика
Ответ на: комментарий от sasaimns

Чето не хочет rusconv собираться :(
mail src # make all
gcc -D_FOR_UNIX_ rusconv.c -o rusconv
In file included from rusconv.c:265:
xxx2yyy.h:23:8: warning: extra tokens at end of #endif directive
xxx2yyy.h:138:19: pasting "=" and "alt" does not give a valid preprocessing token
xxx2yyy.h:139:19: pasting "=" and "koi" does not give a valid preprocessing token
xxx2yyy.h:140:19: pasting "=" and "mac" does not give a valid preprocessing token
xxx2yyy.h:141:19: pasting "=" and "win" does not give a valid preprocessing token
xxx2yyy.h:142:19: pasting "=" and "alt" does not give a valid preprocessing token
xxx2yyy.h:143:19: pasting "=" and "koi" does not give a valid preprocessing token
xxx2yyy.h:144:19: pasting "=" and "mac" does not give a valid preprocessing token
xxx2yyy.h:145:19: pasting "=" and "win" does not give a valid preprocessing token
xxx2yyy.h:146:19: pasting "=" and "alt" does not give a valid preprocessing token
xxx2yyy.h:147:19: pasting "=" and "koi" does not give a valid preprocessing token
xxx2yyy.h:148:19: pasting "=" and "mac" does not give a valid preprocessing token
xxx2yyy.h:149:19: pasting "=" and "win" does not give a valid preprocessing token
xxx2yyy.h:150:19: pasting "=" and "alt" does not give a valid preprocessing token
xxx2yyy.h:151:19: pasting "=" and "koi" does not give a valid preprocessing token
xxx2yyy.h:152:19: pasting "=" and "mac" does not give a valid preprocessing token
xxx2yyy.h:153:19: pasting "=" and "win" does not give a valid preprocessing token
make: *** [rusconv] Ошибка 1

sasaimns
() автор топика
Ответ на: комментарий от sasaimns

Все вопрос снимаю. Вычислил путем перебора iconv -c --from-code=UTF16LE Это читабельно :)

sasaimns
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.