LINUX.ORG.RU

История изменений

Исправление Zmicier, (текущая версия) :

«wget» я стартую со следующими параметрами:
на заглавной страничке русской Википедии.

Откуда эта манера описывать ввод словами? У вас точная формулировка приказа есть, но нам вы ее предлагаете восстановить по описанию.

$ wget -q -E -H -k -p -t 3 -T 10 \
  --user-agent='Mozilla/5.0 (X11; Linux i686; rv:10.0) Gecko/20100101 Firefox/33.0' \
  "https://ru.wikipedia.org/"

Так?

Можно как-то скачивать странички «полностью», чтобы не происходила дозагрузка?

Можно, конечно, просто википедики против, чтоб вы у них загружали картинки (см. строчку 151 в https://ru.wikipedia.org/robots.txt). А ГНУ Вэ-гет — это порядочный робот, и он по-умолчанию подчиняется их желанию.

Прикажите ему не подчиняться, если настаиваете:

$ wget -e 'robots=off' --page-requisites --convert-links --adjust-extension \
  "https://ru.wikipedia.org/"

Исправление Zmicier, :

«wget» я стартую со следующими параметрами:
на заглавной страничке русской Википедии.

Откуда эта манера описывать ввод словами? У вас точная формулировка приказа есть, но нам вы ее предлагаете восстановить по описанию.

$ wget -q -E -H -k -p -t 3 -T 10 \
  --user-agent='Mozilla/5.0 (X11; Linux i686; rv:10.0) Gecko/20100101 Firefox/33.0' \
  "https://ru.wikipedia.org/"

Так?

Можно как-то скачивать странички «полностью», чтобы не происходила дозагрузка?

Можно, конечно, просто Википедики против, чтоб вы у них загружали (см. строчку 151 в https://ru.wikipedia.org/robots.txt). А ГНУ Вэ-гет — это порядочный робот, и он по-умолчанию подчиняется их желанию.

Прикажите ему не подчиняться, если настаиваете:

$ wget -e 'robots=off' --page-requisites --convert-links --adjust-extension \
  "https://ru.wikipedia.org/"

Исправление Zmicier, :

«wget» я стартую со следующими параметрами:
на заглавной страничке русской Википедии.

Откуда эта манера описывать ввод словами? У вас точная формулировка приказа есть, но нам вы ее предлагаете восстановить по описанию.

$ wget -q -E -H -k -p -t 3 -T 10 --user-agent='Mozilla/5.0 (X11; Linux i686; rv:10.0) Gecko/20100101 Firefox/33.0' "https://ru.wikipedia.org/"

Так?

Можно как-то скачивать странички «полностью», чтобы не происходила дозагрузка?

Можно, конечно, просто Википедики против, чтоб вы у них загружали (см. строчку 151 в https://ru.wikipedia.org/robots.txt). А ГНУ Вэ-гет — это порядочный робот, и он по-умолчанию подчиняется их желанию.

Прикажите ему не подчиняться, если настаиваете:

$ wget -e 'robots=off' --page-requisites --convert-links --adjust-extension https://ru.wikipedia.org/

Исходная версия Zmicier, :

«wget» я стартую со следующими параметрами:
на заглавной страничке русской Википедии.

Откуда эта манера описывать ввод словами? У вас точная формулировка приказа есть, но нам вы ее предлагаете восстановить по описанию.

$ wget -q -E -H -k -p -t 3 -T 10 --user-agent='Mozilla/5.0 (X11; Linux i686; rv:10.0) Gecko/20100101 Firefox/33.0' "https://ru.wikipedia.org/"

Так?

Можно как-то скачивать странички «полностью», чтобы не происходила дозагрузка?

Можно, конечно, просто Википедики против, чтоб вы у них загружали (см. строчку 151 в https://ru.wikipedia.org/robots.txt) А ГНУ Вэ-гет порядочный робот и он по-умолчанию подчиняется их желанию.

Прикажите не подчиняться, если настаиваете:

$ wget -e 'robots=off' -pEk https://ru.wikipedia.org/