LINUX.ORG.RU

Как загружать и парсить веб-страницы на C++/Qt?

 , ,


0

2

Не в том смысле, как работать с QNetworkAccessManager, а как правильно получить контент сайта. Запросил я сайт, а QNetworkAccessManager возвращает либо «Moved permanently», либо «требуется javascript и cookies для просмотра сайта», а в браузере эти сайты отображаются нормально. Какие по этому вопросу есть варианты решений что бы не заморочно получить контент, примерно в том виде, как его видно в браузере при просмотре исходного кода страницы?



Последнее исправление: victor79 (всего исправлений: 1)
Ответ на: комментарий от UVV

Да я спрашивал уже. С тех пор что-нибудь изменилось?

Конкрентно эту багу я давно починил, но в новой ветке зависимости от leveldb нет. Теперь собирается cmake'ом, если откроешь список публичных опций то увидишь все, что можно безопасно повыключать.

Вот такие опции использовали для сборки phantomjs (со статическим Qt)

https://gist.github.com/Vitallium/c08aca68712a986254b6e6c905c1497e

Или может ты озвучишь причины, по которым его выкинули из Qt?

Как уже отвечал в [1], «a combination of executive meddling and failure to find efficient development process». Ну и еще отношения с эппловцами у них в тот момент не очень хорошие сложились.

[1] http://qtwebkit.blogspot.ru/2016/08/qtwebkit-im-back.html

annulen ★★★★★
()
Ответ на: комментарий от annulen

ОК, понял. Спасибо за проделанную работу! Ещё вопрос в догонку. На какие средства идёт поддержка вебкита? Чисто контрибьютор в свободное время или это нужно компании, в которой ты работаешь? Много вас контрибьюторов?

UVV ★★★★★
()
Ответ на: комментарий от UVV

На какие средства идёт поддержка вебкита? Чисто контрибьютор в свободное время или это нужно компании, в которой ты работаешь?

То и другое

Много вас контрибьюторов?

Можно тут посмотреть https://github.com/annulen/webkit/pulls?q=is:pr

Но в основном код пишу я (или бэкпортирую вещи из апстрима), контрибьторы больше помогают с нахождением багов и обсуждением решений

annulen ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.