Пишу парсер одного html-сайта. Вот код:
#!/usr/bin/env python3
# -*- encoding: utf-8 -*-
from urllib.request import urlopen
from lxml import etree
html = urlopen("http://google.com").read() # гугл, например.
html = html.decode("cp1251").encode("utf-8")
parser = etree.HTMLParser()
tree = etree.parse(html, parser)
print(u"Этот текст никогда не выведется.")
Из исходника должно быть понятно, что текст «Этот текст никогда не выведется.» никогда не выведется. Причём исходники самого сайта выводятся. Весь код после «tree = etree.parse(html, parser)» игнорируется полностью. Покажите мне кто-нибудь, где я дурак?