LINUX.ORG.RU

теоретически всё верно. Если начинать с полного нуля, полчаса хватит. Надо только сказать, что можно делать "man something", и через полчаса полюбому можно начинать качать )

jcd ★★★★★
()

Учитывая что баш даже осваивать не надо - скриптов в гугле полно, то этот телепорт покупают те, кто не в курсе существования баша вообще.

anonymous
()
Ответ на: комментарий от anonymous

>этот телепорт покупают те, кто не в курсе существования баша вообще.

ещё бы - он под винду вроде.

jcd ★★★★★
()

Я как не мучался, но заставить баш и вгет выкачивать сайты целиком я не смог.

Телепорт проще, удобнее и все равно free as beer. (с лекарством от жадности)

Lockywolf ★★★
()

wget на самом деле на слишком продвинут в рекурсивном скачивании, например, не идёт по ссылкам из файлов, отличающихся от html. Лор ты вгетом ещё, может быть, скачаешь, но не особо больше.

RommeDeSerieux
()
Ответ на: комментарий от RommeDeSerieux

> Лор ты вгетом ещё, может быть, скачаешь, но не особо больше.

+1 красноглазики как всегда пукнули в лужу

anonymous
()
Ответ на: комментарий от Lockywolf

> Я как не мучался, но заставить баш и вгет выкачивать сайты целиком я не смог.

Ниасилятор либастрал детектед

temy4
()
Ответ на: комментарий от RommeDeSerieux

> wget на самом деле на слишком продвинут в рекурсивном скачивании, например, не идёт по ссылкам из файлов, отличающихся от html.

Для этого и нужен баш. Плюс ещё пара минут на grep и пара часов на sed :)

question4 ★★★★★
()
Ответ на: комментарий от Lockywolf

> Я как не мучался, но заставить баш и вгет выкачивать сайты целиком я не смог.

Можно пример такого сайта?

question4 ★★★★★
()
Ответ на: комментарий от question4

>>Можно пример такого сайта?

Он сдох давно. Порнушник какой-то. Но там были красивые галереи.

Они написали, что умирают, и я решил архива ради выкачать. Но честно говоря, я заткнулся уже на том, чтобы выкачать www.domain.name/something/*

при том, что индекс файлов отдавался. да и неинтересно было мучаться.

быстренько телепортом сделал.

Lockywolf ★★★
()
Ответ на: комментарий от xargs

>>ноухау забесплатно не раздаются ;) копия моего скрипта за 2450$ только, деньги вперед!

Не-не-не, уговор дороже денег.

Предложил - давай пиши.

Lockywolf ★★★
()
Ответ на: комментарий от xargs

А кстати зря смеешься. Программа-то выполнится. только все из pwd она попробует скачать то же самое в ту же pwd ^_^

temy4
()
Ответ на: комментарий от temy4

>>А кстати зря смеешься. Программа-то выполнится. только все из pwd она попробует скачать то же самое в ту же pwd ^_^

Да, это я ступил. Надо

wget \*

Lockywolf ★★★
()
Ответ на: комментарий от anonymous

> Для вас интернет заканчивается на http?

Для нас интрнеты наачинаются на http://

anonymous
()

>неужели bash такой страшный?

суди сам, вот скриптик для выкачивания галлерей с е-хентая, который среди защит имеет:
- отдачу пустоты эксклюзивно для обладателей слова 'wget' в юзер-агенте
- отдачу собственно самого изображения только по правильному кукису

#!/bin/sh

[ ! $1 ] && { echo -e "use $0 <gallery overview url> [gallery local name] [from which image number begin]\ne.g. $0 http://g.e-hentai.org/g/57901/4167e89800/ se_l 14"; exit; }; 
tmpdir="tmp"; 
storagedir="storage"; 
wget_glob_opts='-U "lor mindless anonymous" -q -c'; 
[ ! -e $tmpdir ] && { mkdir $tmpdir; }; 
[ ! -e $storagedir ] && { mkdir $storagedir; }; 

gallery="$1"; 
start=${3:-1}; 
start=$(($start-1)); 

to_full() {
  i=$1; 
  length=$2; 
  while [ ${#i} -lt $length ]; do 
    i="0${i}"; 
  done; 
  echo "$i"; 
}; 

echo -n "downloading ${gallery}..."; 
wget $wget_glob_opts -O "$tmpdir/gallery.html" "$gallery" && { echo "done"; } || { echo "failed"; }; 
gallery_name_default=`sed -ne '/<title>/{s/\(.*<title>\|[[:space:]]* - E-[^-]*<\/title>\|[[:punct:]]\)//g;s/[[:space:]]\{1,\}/_/g;p}' "$tmpdir/gallery.html" | tr [:upper:] [:lower:]`; 
gallery_name=${2:-$gallery_name_default}; 
[ ! -e "$storagedir/$gallery_name" ] && mkdir "$storagedir/$gallery_name"; 
images=`sed -ne 's/.*Showing [0-9]*-[0-9]* of \([0-9]*\) images.*/\1/p' "$tmpdir/gallery.html"`; 
itera_int=$start; 
image_page=`sed -ne 's|.*<a class="[^"]*" href="\([^"]*\)" rel="[^"]*"><img class="[^"]*" alt="[^"]*" title="[^"]*" src="[^"]*" /><br />01</a>.*|\1|p' "$tmpdir/gallery.html"`; 

while [ $itera_int -lt $images ]; do
  wget $wget_glob_opts --keep-session-cookies --save-cookies="$tmpdir/cookie" -O "$tmpdir/image.html" "$image_page"; 
  temp=`sed -ne 's|.*<a href="\([^"]*\)"><img id="[^"]*" src="\([^"]*\)" alt="[^"]*" title="[^"]*" style="[^"]*" /></a>.*|\1 \2|p' "$tmpdir/image.html"`; 
  image_page=`echo $temp | cut -d' ' -f1`; 
  image_link=`echo $temp | cut -d' ' -f2`; 
  let itera_int++; 
  itera=`to_full $itera_int ${#images}`; 
  image_ext=`echo "$image_link" | sed 's/.*\.\([^.]\{,5\}\)$/\1/g'`; 
  image_name="${itera}.${image_ext}"; 
  echo -n "  downloading image ($itera/$images)..."; 
  wget $wget_glob_opts --load-cookies="$tmpdir/cookie" -O "$storagedir/$gallery_name/$image_name" "$image_link" && { echo "ok"; } || { echo "fail"; }; 
  rm -f "$tmpdir/image.html"; 
  rm -f "$tmpdir/cookie"; 
  sleep 1;
done; 

rm -f "$tmpdir/gallery.html"; 

anonymous
()
Ответ на: комментарий от vitroot

>а вот от анонимуса я такого даже никогда и не ожидал О_о

прошу пояснить что стало причиной вашего недоумения: распростынивание поста, выставление на всеобщее обозрение криво написанного шеллскрипта, заинтересованность в левых хентайных галлереях или же богохульство в примере?

anonymous
()

ёптить. вы что, не осилили все wget --mirror?

Komintern ★★★★★
()
Ответ на: комментарий от oguretz

>о майн готт... просто рёхнуца можно. не так как автор скрипта на хентае, но всё же...

да что вам так в этом скрипте не нравится-то? ну да, написан не очень аккуратно, делает только то, что мне нужно, но так я же изначально его не для публики, а для себя за часик набросал, что бы пару галлереек в свою коллекцию добавить, но ведь и ничего дико неправильного я в нем не вижу, так зачем такие охи-ахи-то? и если что-то такое и есть, то не охайте лучше, а прямо покажите, что не так - запомню на будущее.

anonymous
()
Ответ на: комментарий от anonymous

хотя конечно да, отдельные моенты можно сделать лучше - банальным -le в цикле избавиться от лишней арифметики со start'ом, седовые регекспы менее жадными сделать, и уж если до ума доводить, то на гетоптс перейти, да и to_full наверняка можно красивей сделать, но тут почитать немного надо.

anonymous
()
Ответ на: комментарий от Barlog_M

>Не нашел по ссылке - куда потом девать Весь Интернет™?

Закачать обратно!

Alex_A_V ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.