История изменений
Исправление
Rainor,
(текущая версия)
:
Хвататься в xpath за text() - сомнительная затея, если тот не нормализирован в понятном для парсера виде.
Плясать придется в сторону
r'''//*[contains(text(), "Ne'xt") or contains(text(), "Ne%27xt") or contains(text(), "Ne`xt" и т.д.) ]'''
P.S. Отсутствие формализации таких случаев и приводит к тому, что подчас html проще парсить регулярками, чем xpath\csspath.
Исправление
Rainor,
:
Хвататься в xpath за text() - сомнительная затея, если тот не нормализирован в понятном для парсера виде.
Плясать придется в сторону
r'''//*[contains(text(), "Ne'xt") or contains(text(), "Ne%27xt") or contains(text(), "Ne`xt" и т.д.) ]'''
P.S. Отсутствие формализации таких случаев и приводит к тому, что подчас html проще парсить регулярками, чем xpath\csspath.
Исходная версия Deleted, :
Хвататься в xpath за text() - сомнительная затея, если тот не нормализирован в понятном для парсера виде.
Плясать придется в сторону
r"'//*[contains(text(), «Ne'xt») or contains(text(), «Ne%27xt») or contains(text(), «Ne`xt» и т.д.) ]"'
P.S. Отсутствие формализации таких случаев и приводит к тому, что подчас html проще парсить регулярками, чем xpath\csspath.