История изменений
Исправление vtVitus, (текущая версия) :
Я тырил код для кусков html отсюда( подходит ли это для полновесного html х.з.) -
https://stackoverflow.com/questions/9022140/using-xpath-contains-against-html...
TagNode tagNode = new HtmlCleaner().clean(
"<div><table><td id='1234 foo 5678'>Hello</td>");
org.w3c.dom.Document doc = new DomSerializer(
new CleanerProperties()).createDOM(tagNode);
//And then use the standard JAXP interfaces to query it:
XPath xpath = XPathFactory.newInstance().newXPath();
String str = (String) xpath.evaluate("//div//td[contains(@id, 'foo')]/text()",
doc, XPathConstants.STRING);
System.out.println(str);
Исправление vtVitus, :
Я тырил код для кусков html отсюда, подходи ли это для полновесного html х.з. -
https://stackoverflow.com/questions/9022140/using-xpath-contains-against-html...
TagNode tagNode = new HtmlCleaner().clean(
"<div><table><td id='1234 foo 5678'>Hello</td>");
org.w3c.dom.Document doc = new DomSerializer(
new CleanerProperties()).createDOM(tagNode);
//And then use the standard JAXP interfaces to query it:
XPath xpath = XPathFactory.newInstance().newXPath();
String str = (String) xpath.evaluate("//div//td[contains(@id, 'foo')]/text()",
doc, XPathConstants.STRING);
System.out.println(str);
Исходная версия vtVitus, :
Я тырил код отсюда -
https://stackoverflow.com/questions/9022140/using-xpath-contains-against-html...
TagNode tagNode = new HtmlCleaner().clean(
"<div><table><td id='1234 foo 5678'>Hello</td>");
org.w3c.dom.Document doc = new DomSerializer(
new CleanerProperties()).createDOM(tagNode);
//And then use the standard JAXP interfaces to query it:
XPath xpath = XPathFactory.newInstance().newXPath();
String str = (String) xpath.evaluate("//div//td[contains(@id, 'foo')]/text()",
doc, XPathConstants.STRING);
System.out.println(str);