LINUX.ORG.RU
ФорумTalks

раскодируйте ;)

 , ,


0

1

http://www.youtube.com/watch?v=RirqnBUQTEU&feature=youtu.be

На видео 437 кодировка. Записал в файл с помощью таблицы символов, но попытки понять, а что там должно быть, не увенчались успехом.

Но в отличие от бинарного файла, почти нет симводов < 128, что наводит на мысль, что там все-таки plain text на русском

★★★★★

Последнее исправление: cvs-255 (всего исправлений: 1)
Для воспроизведения видео требуется проигрыватель Adobe Flash.
Загрузить последнюю версию
exception13 ★★★★★
()

Можно попробовать взломать частотным анализом, но проблема в том, что кодировки бывают двухбайтными, что, впрочем, задачу не слишком усложняет.

imtw
()

да да ) тоже трещал с этого когда увидел первый раз )))

nerfur ★★★
()
Ответ на: комментарий от exception13

проверил 866, cp1251, koi8-r, iso8859-5. Все не то

cvs-255 ★★★★★
() автор топика
Ответ на: комментарий от Ustin

enca говорит, что koi8-r, но

cat t.txt|iconv -f koi8-r -t utf8

дает

²хйх╬кдхц

cvs-255 ★★★★★
() автор топика

А собственно почему это не может быть случайным набором символов для постановки?

Deleted
()

женщина же уже всё раскодировала за вас же.

вопрос-как помочь Небиру?

pawnhearts ★★★★★
()

Ничего не получится. Текст получен методом «сканирования на принтер» (так тетка сказала). Поэтому надо искать (а точнее, придумывать и реализовывать) алгоритм раскодирования из листа бумаги на экран или на монитор. Ну, или, например, распознавания из рук тетки в «компьютор».

GateKeeper ★★
()
Ответ на: комментарий от GateKeeper

Этот человек прав ведь. Сканер с случайно включенной кривой рукой функцией распознавания текста легко может дать такую кашу.

Ustin
()
Ответ на: комментарий от imtw

iconv не умеет делать частотный анализ, afaik.

я перепробовал все известные мне кодировки русского (кроме utf-16).

cvs-255 ★★★★★
() автор топика
Ответ на: комментарий от pawnhearts

9d c8 ca c8 be cb c4 c8 c3 23 cc bf c5 31 be c8 bс

оно же

¥╚╩╚╛╦─╚├#╠┐┼1╛╚╝

cvs-255 ★★★★★
() автор топика
Ответ на: комментарий от pawnhearts
#! /usr/bin/perl

@cp = ("866", "cp1251", "koi8-r");

foreach (@cp)
{
        $cp1 = $_;

        foreach (@cp)
        {
                $cp2 = $_;

                foreach (@cp)
                {
                        $cp3 = $_;
                        print "$cp1 $cp2 $cp3 : ";
                        system("cat test.txt | iconv -f $cp1 -t $cp2 -c | iconv -f $cp3 -t utf8 -c");
                        print("\n");
                }
        }
}


866 866 866 : Э╚╩╚╛╦─╚├#╠┐┼1╛╚╝
866 866 cp1251 : ќИКИѕЛДИГ#МїЕ1ѕИј
866 866 koi8-r : ²хйх╬кдхц#л©е1╬х╪
866 cp1251 866 : ▌#1
866 cp1251 cp1251 : Э#1
866 cp1251 koi8-r : щ#1
866 koi8-r 866 : №л╗лм╕АлЖ#▒ГК1мло
866 koi8-r cp1251 : ь«»«¬ёЂ«†#±ѓЉ1¬«®
866 koi8-r koi8-r : Э╚╩╚╛╦─╚├#╠┐┼1╛╚╝
cp1251 866 866 : ИКИЛДИГ#МїЕ1И
cp1251 866 cp1251 : €Љ€‹„€ѓ#Њх…1€
cp1251 866 koi8-r : ┬┼┬▀└┬┐#▄У┘1┬
cp1251 cp1251 866 : Э╚╩╚╛╦─╚├#╠┐┼1╛╚╝
cp1251 cp1251 cp1251 : ќИКИѕЛДИГ#МїЕ1ѕИј
cp1251 cp1251 koi8-r : ²хйх╬кдхц#л©е1╬х╪
cp1251 koi8-r 866 : щыщьфщч#эх1щ
cp1251 koi8-r cp1251 : йлймдйз#не1й
cp1251 koi8-r koi8-r : ИКИЛДИГ#МЕ1И
koi8-r 866 866 : хйх╬кдхц#ле1╬х╪
koi8-r 866 cp1251 : е©еОЄ¤еж#«Ґ1ОеШ
koi8-r 866 koi8-r : Е╘Ен╙╓ЕФ#╚╔1нЕь
koi8-r cp1251 866 : їщїъфїЎ#ыйх1ї
koi8-r cp1251 cp1251 : хйхкдхц#л©е1х
koi8-r cp1251 koi8-r : УИУЙДУЖ#К╘Е1У
koi8-r koi8-r 866 : Э╚╩╚╛╦─╚├#╠┐┼1╛╚╝
koi8-r koi8-r cp1251 : ќИКИѕЛДИГ#МїЕ1ѕИј
koi8-r koi8-r koi8-r : ²хйх╬кдхц#л©е1╬х╪
cvs-255 ★★★★★
() автор топика

там же ясно сказано: «КРИК О ПОМОЩИ С ПЛАНЕТЫ НИБИРУ»

int13h ★★★★★
()

В большинстве кодировок ASCII остаётся на месте, в том числе цифры и знаки препинания. Не думаю, что «#53;<48:» может обозначать что-либо осмысленное в тексте.

PolarFox ★★★★★
()
Ответ на: комментарий от PolarFox

Там на бумаге есть что-то растровое, и оно темное

cvs-255 ★★★★★
() автор топика

Возращаюсь я из отпуска, спрашиваю как без меня контора работала (я один компами занимаюсь), зовет меня один товарисч и хвастается. Смотри, говорит, запускает оутлук, ищет письмо, ну я смотрю KOI-8, вот думаю сам научился кодировку переключать, но не тут то было! Он его прямо в KOI8 и начал читать, не быстро, но читал! Я со стула чуть не упал. Потом показывает бумажку на ней таблица перевода KOI8-CP1251
// комменты к этому видео

int13h ★★★★★
()

запрещать надо телевидение с этими «контактерами»

int13h ★★★★★
()
Ответ на: комментарий от cvs-255

Еще странность: почти каждая строка заканчивается на #5 (или #7) и после комбинация цифр 1345789 и знаков :;<
Решетка вообще напоминает пробел по использованию, если присмотреться.

Ustin
()
Ответ на: комментарий от Ustin

короче это не битая кодировка, а какой-то шифр.

ещё похоже на то что там сдвиг какой-то этого всего

pawnhearts ★★★★★
()
Ответ на: комментарий от buddhist

Ну все-таки в бинарных файлах более разнообразный набор символов

cvs-255 ★★★★★
() автор топика
Ответ на: комментарий от cvs-255

я перепробовал все известные мне кодировки русского

Частотный анализ позволяет восстановить любую неизвестную или случайную кодировку. "Золотого жука" не читали?

imtw
()
Ответ на: комментарий от imtw

Читал, но тут проще перебрать известные. Тем более, что нет уверенности, что это текст. Скрипт выше это и сделал.

cvs-255 ★★★★★
() автор топика
Последнее исправление: cvs-255 (всего исправлений: 1)
Ответ на: комментарий от cvs-255

Если известная не подошла, пора искать неизвестную, я как раз об этом. С двухбайтовыми сложнее, нужно сначала попробовать пронумеровать все часто встречающиеся пары. Да, видео не смотрел.

imtw
()
Ответ на: комментарий от imtw

пора искать неизвестную

Да так я и в самом деле «послание нибиру» отыщу))

cvs-255 ★★★★★
() автор топика

Я такое видел когда оператива у принтера побилась. Так, что ничего вы скорее всего не раскодируете

visual ★★★
()

и кстате если уж на то пошло то на видио видет перевёрнутый вопрос - его нет в 866 и 1251

visual ★★★
()

Среди кодов ниже 128 в том числе должны быть пробелы.

PolarFox ★★★★★
()

Двойной троллинг на РенТВ? %)

FiXer ★★☆☆☆
()
Ответ на: комментарий от Jetty

cat test.txt|iconv -f cp1251 -t koi8-r -c|iconv -f cp1251 -t utf8

йлймдйз#не1й

cat test.txt|iconv -f koi8-r -t cp1251 -c|iconv -f koi8-r -t utf8

УИУЙДУЖ#К╘Е1У

не то

cvs-255 ★★★★★
() автор топика
Последнее исправление: cvs-255 (всего исправлений: 2)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.