文字を含むタグを取り出すxpath

CSSで取り出したり、XPathをフルパスで取り出すと面倒なので。

doc.xpath("//*[contains(./text(),'Ruby')]")

Xpathはソレだけでクエリ言語として成立しているので、これを覚えるのが一番手っ取り早い。

//タグ[contains( ./text() , "文字列" )]

または属性で絞って

//タグ[contains( ./@attr , "文字列" )]

//*[contains( ./@attr , "文字列" )]

あまりにざっくり書くと、親子ノードを連れてきちゃうので、タグや属性・text()は入れた方がいい
//*は全ノードを示す

いいえ、違います

ぜんぜん違うんだお

ret = document.evaluate("//*[contains(text(),'検索文字')]",document)

それマグで！