LINUX.ORG.RU

[python3.2][archlinux]

 


0

1
#!/usr/bin/python
import urllib.request
# подключили библиотеку urllib
import lxml.html
# подключили библиотеку lxml

page = urllib.request.urlopen("http://habrahabr.ru/")
# Открываем наш любимый Хабр

doc = lxml.html.document_fromstring(page.read())
# Получили HTML-код главной страницы Хабра

for topic in doc.cssselect('h2.entry-title a.topic'):
	print(topic.text)
        # выводим на экран названия топиков.

Почему?

File "./main.py", line 14, in <module> print(topic.text) UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-12: ordinal not in range(128)


Ответ на: комментарий от ei-grad
Traceback (most recent call last):
  File "./main.py", line 14, in <module>
    print(topic.text.decode('utf-8'))
AttributeError: 'str' object has no attribute 'decode'

бред какой-то...

Andaril
() автор топика
Ответ на: комментарий от ei-grad

Видимо нет... вместо русского в терминале знаки вопроса...

Andaril
() автор топика

>[python3.2][archlinux]

Только что проверил, всё работает.

У тебя какая локаль?

anonymous
()
Ответ на: комментарий от anonymous

C POSIX en_US en_US.iso88591 en_US.utf8 ru_RU.utf8

в консоле вместо русского знаки вопросов... интерфейс английский гном третий... )))

Andaril
() автор топика
Ответ на: комментарий от ei-grad

попробовал в xterm -u8 и все ок.

всем спасибо.

Andaril
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.