LINUX.ORG.RU

Как узнать кодировку файла или просто набора символов?


1

1

Пришла в GAIM кракозяка -- пробовал разные варианты с iconv - все без толку. Правильно я понимаю -- человеческий текст не восстановить, т.к. она запорчен? НА будущее: как узнать в какой кодировке кракозяквы?

Перебором и проверкой результата по словарю. Рекомендую еще посмотреть на этот баг: http://developer.pidgin.im/ticket/1645 - там упоминается такой перл, как "I confirm that converting that from UTF-16 to Windows-1251 results in that valid UTF-8 string".

AEP ★★★★★
()
Ответ на: комментарий от dGhost

>echo "message" | iconv -f utf-8 -t cp1251 уже пробовали?

iconv: illegal input sequence at position 0

Да хрен с ним с Пиджин то. Интересно вообще: есть набор символов псевдограифики и ощущение того, что за ними скрывается осмысленный текст. Как за разумное время его прочитать?

Unforgiven
() автор топика
Ответ на: комментарий от anonymous

>pidgin ненужен. licq - наше всьо

licq может irc, jabber?

baaba ★★★
()

Можно попробовать enca. Иногда очень помогает.

$ eix enca
 [I] app-i18n/enca
     Available versions:  1.0 1.9
     Homepage:            http://trific.ath.cx/software/enca/
     Description:         ENCA detects the character 
coding of a file and converts it if desired

TuxR ★★★★
()
Ответ на: комментарий от Unforgiven

Я обычно делаю

for e in `iconv -l`; do echo $e; iconv -f $e <<< 'образец'; echo; done 2>/dev/null | less

Если в образце лежит осмысленный текст, то обычно за него легко зацепиться глазом при просмотре выхлопа этой команды. Конечно, это не поможет в случае дважды закодированного текста.

Jini ★★
()

А чё, decoder.design.ru больше не работает? 

km ★★★
()
Ответ на: комментарий от Igron

>Есть такая хорошая штука, konwert.

Любопытная вещь. Спасибо - не знал. Она определила кодировку, оказалось непонятно как cp866. Вот только результат работы команды

[kodess | 11:08 | ~]iconv --verbose erunda.txt --from-code cp866 --to-code utf-8 -o erundautf

более чем странный. Вот например кусок (не знаю как будет в браузере читаться конечно)

б├и├з├н├е├▒ ├░├а├з├в├и├в├а├е├▓├▒├┐

Unforgiven
() автор топика
Ответ на: комментарий от Unforgiven

Декодер этот Артемия Лебедева вообще ужас показывает...

Unforgiven
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.