История изменений
Исправление Zmicier, (текущая версия) :
«wget» я стартую со следующими параметрами:
на заглавной страничке русской Википедии.
Откуда эта манера описывать ввод словами? У вас точная формулировка приказа есть, но нам вы ее предлагаете восстановить по описанию.
$ wget -q -E -H -k -p -t 3 -T 10 \
--user-agent='Mozilla/5.0 (X11; Linux i686; rv:10.0) Gecko/20100101 Firefox/33.0' \
"https://ru.wikipedia.org/"
Так?
Можно как-то скачивать странички «полностью», чтобы не происходила дозагрузка?
Можно, конечно, просто википедики против, чтоб вы у них загружали картинки (см. строчку 151 в https://ru.wikipedia.org/robots.txt). А ГНУ Вэ-гет — это порядочный робот, и он по-умолчанию подчиняется их желанию.
Прикажите ему не подчиняться, если настаиваете:
$ wget -e 'robots=off' --page-requisites --convert-links --adjust-extension \
"https://ru.wikipedia.org/"
Исправление Zmicier, :
«wget» я стартую со следующими параметрами:
на заглавной страничке русской Википедии.
Откуда эта манера описывать ввод словами? У вас точная формулировка приказа есть, но нам вы ее предлагаете восстановить по описанию.
$ wget -q -E -H -k -p -t 3 -T 10 \
--user-agent='Mozilla/5.0 (X11; Linux i686; rv:10.0) Gecko/20100101 Firefox/33.0' \
"https://ru.wikipedia.org/"
Так?
Можно как-то скачивать странички «полностью», чтобы не происходила дозагрузка?
Можно, конечно, просто Википедики против, чтоб вы у них загружали (см. строчку 151 в https://ru.wikipedia.org/robots.txt). А ГНУ Вэ-гет — это порядочный робот, и он по-умолчанию подчиняется их желанию.
Прикажите ему не подчиняться, если настаиваете:
$ wget -e 'robots=off' --page-requisites --convert-links --adjust-extension \
"https://ru.wikipedia.org/"
Исправление Zmicier, :
«wget» я стартую со следующими параметрами:
на заглавной страничке русской Википедии.
Откуда эта манера описывать ввод словами? У вас точная формулировка приказа есть, но нам вы ее предлагаете восстановить по описанию.
$ wget -q -E -H -k -p -t 3 -T 10 --user-agent='Mozilla/5.0 (X11; Linux i686; rv:10.0) Gecko/20100101 Firefox/33.0' "https://ru.wikipedia.org/"
Так?
Можно как-то скачивать странички «полностью», чтобы не происходила дозагрузка?
Можно, конечно, просто Википедики против, чтоб вы у них загружали (см. строчку 151 в https://ru.wikipedia.org/robots.txt). А ГНУ Вэ-гет — это порядочный робот, и он по-умолчанию подчиняется их желанию.
Прикажите ему не подчиняться, если настаиваете:
$ wget -e 'robots=off' --page-requisites --convert-links --adjust-extension https://ru.wikipedia.org/
Исходная версия Zmicier, :
«wget» я стартую со следующими параметрами:
на заглавной страничке русской Википедии.
Откуда эта манера описывать ввод словами? У вас точная формулировка приказа есть, но нам вы ее предлагаете восстановить по описанию.
$ wget -q -E -H -k -p -t 3 -T 10 --user-agent='Mozilla/5.0 (X11; Linux i686; rv:10.0) Gecko/20100101 Firefox/33.0' "https://ru.wikipedia.org/"
Так?
Можно как-то скачивать странички «полностью», чтобы не происходила дозагрузка?
Можно, конечно, просто Википедики против, чтоб вы у них загружали (см. строчку 151 в https://ru.wikipedia.org/robots.txt) А ГНУ Вэ-гет порядочный робот и он по-умолчанию подчиняется их желанию.
Прикажите не подчиняться, если настаиваете:
$ wget -e 'robots=off' -pEk https://ru.wikipedia.org/