Как извлечь текст из тегов с помощью ElementTree

0

1

Есть у меня XML-файл:

<class id="1" name="good/bad">
    <verb>
        <token>like</token>
        <token>feel</token>
    </verb>
    <mess>This is <sugg>not</sugg> text</mess>
    <id type="incorrect">I'm glad to <marker>unsee you</marker>.</id>
    <id type="correct">I'm glad to see you.</id>
</class>

Мне нужно извлечь текст из определенных тэгов. На http://effbot.org как-то примеров негусто и вообще документация бедная. Может, есть где-то хорошие примеры? И как мне реализовать текст в одинаковых тегах (token) как отдельные объекты? Спасибо заранее! Результат примерно должно быть следующим:

(like) feel > not #This is not text

Ссылка

←	тайм-аут при вызове connect

Разработка модулей ядра для FreeBSD

→

http://docs.python.org/library/xml.etree.elementtree.html?highlight=xml parser

смотри есть брать

p = tree.find('verb')

вернёт объект из которого можно будет получить

p[0].text p[1].text

как то так. не особо я с xml дружил

ggrn ★★★★★
(19.06.12 01:52:08 MSK)

Ответ на: комментарий от ggrn 19.06.12 01:52:08 MSK

Не все так просто. print p возвращает:

<Element 'verb' at 0x7f16db19b190>

NoNameNoNumber ★
(19.06.12 02:12:27 MSK) автор топика

Ссылка

Ответ на: комментарий от ggrn 19.06.12 01:52:08 MSK

Надо print ET.tostring(p), но это все равно не нативно. Тогда и ElementTree не нужен, грубо говоря.

NoNameNoNumber ★
(19.06.12 02:18:31 MSK) автор топика

Ответ на: комментарий от NoNameNoNumber 19.06.12 02:18:31 MSK

ок. если не хочешь читать доку.

from xml.etree.ElementTree import ElementTree
tree = ElementTree()
tree.parse("filename.xml")
p = tree.find('verb')
for i in range(len(p)):
    print p[i].text

Если тяжко с английским найди Дэвид Бизли Python подробный справочник издание 4.

ggrn ★★★★★
(19.06.12 02:37:56 MSK)