sh-скрипт - поиск в бинарном файле - как сделать быстрее ?

0

0

вот написал скрипт, для выдирания архивов из
всяких там makeself.bin и тд;
жутко медленный - как сделать быстрее (на shell) ?

#!/bin/sh
l=`du -b $1 |awk 'BEGIN {RS=""} {FS=""} { print $1 }'`
for (( i=0; i<=$l ; i++));do
k=`xxd -l3 -ps -s$i $1`
case "$k" in
"1f8b08" ) dd if=$1 of=$1.out.gz bs=1 skip=$i && exit 0 ;;
"425a68" ) dd if=$1 of=$1.out.bz2 bs=1 skip=$i && exit 0 ;;
"1f9d90" ) dd if=$1 of=$1.out.Z bs=1 skip=$i && exit 0 ;;
"526172" ) dd if=$1 of=$1.out.rar bs=1 skip=$i && exit 0 ;;
"504b03" ) dd if=$1 of=$1.out.zip bs=1 skip=$i && exit 0 ;;
esac
done

Ссылка

←	union u myU ??????

ext2fs: Filesystem state

→

dd c bs=1 будет медленным.

dilmah ★★★★★
(13.06.06 12:47:52 MSD)

Ответ на: комментарий от dilmah 13.06.06 12:47:52 MSD

libo tail -c delaj, libo dd s bolshim bs

dilmah ★★★★★
(13.06.06 12:48:29 MSD)

Ссылка

Ответ на: комментарий от dilmah 13.06.06 12:47:52 MSD

это то ясно -
только что вспомнил про другие параметры dd
- просто ,вероятно(?), надо будет заменить
bs=1 skip=$i
на
ibs=1 obs=32k skip=$i

типа:

"1f8b08" ) dd if=$1 of=$1.out.gz ibs=1 obs=32k skip=$i && exit 0 ;;

- по идее должно дать выигрыш в скорости ...
зы
man dd рулит - а я забыл это ...

botrops-schlegelii ★★
(13.06.06 13:42:28 MSD) автор топика

Ответ на: комментарий от botrops-schlegelii 13.06.06 13:42:28 MSD

a zachem? prosto vyravnivaj na granicu 32k i vezde ispolzuj bs=32k

dilmah ★★★★★
(13.06.06 14:35:07 MSD)

Ответ на: комментарий от dilmah 13.06.06 14:35:07 MSD

а ты уверен, что то человек, который запаковывал файлы в сраный makeself,инсталлшилд или просто сраный-sfx, выравнивает положение заголовка файла на 32k в теле sfx ?
я уверен , что не выравнивает(сам так делаю) - поэтому я последовательно перебираю 3 байта hex-дампа из потока...

botrops-schlegelii ★★
(13.06.06 15:23:40 MSD) автор топика

Ссылка

Ответ на: комментарий от dilmah 13.06.06 14:35:07 MSD

http://www.mcsr.olemiss.edu/cgi-bin/man-cgi?dd

bs=BYTES
force ibs=BYTES and obs=BYTES

и если bs=32k, то как я получю skip=115045 ?

botrops-schlegelii ★★
(13.06.06 15:28:06 MSD) автор топика

Ответ на: комментарий от botrops-schlegelii 13.06.06 15:28:06 MSD

togda luchshe tail -c XXX | head -c XXX

dilmah ★★★★★
(13.06.06 16:08:10 MSD)

Ответ на: комментарий от dilmah 13.06.06 16:08:10 MSD

спасибо - попробую

botrops-schlegelii ★★
(13.06.06 16:29:59 MSD) автор топика

Ответ на: комментарий от botrops-schlegelii 13.06.06 16:29:59 MSD

не поможет - решил искать не там где потерял, а там где светло :
$
$cat ./shell.sh
a=`echo 1024*1024|bc -l`
for (( b=0; b<=$a ; b++));do
echo $b >/dev/null
done
$
$time ./shell.sh
real ~1m17s
$
$cat ./seq.sh
a=`echo 1024*1024|bc -l`
for b in `seq 0 $a`;do
echo $b >/dev/null
done
$
$time ./seq.sh
real ~0m59s #будем считать ~1m
$

то есть;
$echo "650*1024*1024/(1024*1024)/60/24"|bc -l
.45138888888888888888
$
за пол суток я найду заголовок bzip2 архива в конце 650Mb имиджа cdrom
- надо искать _неинтерактивный_ hex-dumper, с функцией поиска ...

ps
Pentium-3 , linux-2.4.32

botrops-schlegelii ★★
(14.06.06 10:29:26 MSD) автор топика

Ответ на: комментарий от botrops-schlegelii 14.06.06 10:29:26 MSD

ИМХО, за сутки (которые уже прошли с момента начала этой темы) уже можно было на С написать прогу...

>l=`du -b $1 |awk 'BEGIN {RS=""} {FS=""} { print $1 }'`

почему размер файла берется через du, а не через "ls -l" или "stat"?

mky ★★★★★
(14.06.06 17:44:14 MSD)

Ответ на: комментарий от mky 14.06.06 17:44:14 MSD

>почему размер файла берется через du, а не через "ls -l" или "stat"?
это не важно - мне бы побыстрее заголовок найти
>уже можно было на С написать прогу...
или на F77

botrops-schlegelii ★★
(15.06.06 10:54:38 MSD) автор топика

Ссылка

Ответ на: комментарий от mky 14.06.06 17:44:14 MSD

http://www.mcsr.olemiss.edu/cgi-bin/man-cgi?du
"ls -l" не очень удобно - в плане сортировки вообще - в скриптах ,IMHO, лучше find
ps

du -b
-b, --bytes
equivalent to '--apparent-size --block-size=1'

и чем это не так если

ls --block-size=1

--block-size=SIZE
use SIZE-byte blocks

botrops-schlegelii ★★
(15.06.06 11:03:42 MSD) автор топика

Ответ на: комментарий от botrops-schlegelii 15.06.06 11:03:42 MSD

>"ls -l" не очень удобно - в плане сортировки вообще - в скриптах ,IMHO, лучше find

Кому как... Хотя я не понял про сортировку

>и чем это не так если

Да мне без разницы, разве что раньше du не понимал --apparent-size.

Ну дак на каком языке будешь прогу писать? :))

mky ★★★★★
(15.06.06 14:50:49 MSD)

Ответ на: комментарий от mky 15.06.06 14:50:49 MSD

пока поищу неинтерактивный hex-dumper - чтобы выдавал положение искомого сегмента; потом ,может быть, фортран-77 буду вспоминать
Ж-)

anonymous
(15.06.06 15:23:04 MSD)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	union u myU ??????

Development

ext2fs: Filesystem state

→

Похожие темы