XPath的following轴怎么选择之后的节点?(节点.选择.XPath...)

wufei123 发布于 2025-08-29 阅读(4)

xpath的following轴用于选择当前节点之后的所有非祖先、非属性、非命名空间节点,按文档顺序排列,可通过following::node()选择所有后续节点,或使用following::p、following::a[@href]、following::div[contains(@class,'content')]等表达式精确选择特定类型节点;与following-sibling轴不同,following轴范围更广,包含所有后续节点而不仅限于兄弟节点;在实际应用中,可结合定位标志元素提取后续内容,如//h2[text()='related articles']/following::a提取相关文章链接,或//input[@id='username']/following::span[@class='error-message']定位表单错误信息,从而实现高效的数据提取与自动化测试。

XPath的following轴怎么选择之后的节点?

XPath 的

following
轴用于选择当前节点之后的所有节点,这些节点与当前节点不在同一个父节点下,并且在文档树中按照文档顺序出现。简单来说,它会选取当前节点结束标签之后,直到文档结束的所有节点,排除祖先节点、属性节点和命名空间节点。

选择之后的节点,可以使用

following::node()
选择所有后续节点,或者使用更具体的 XPath 表达式,比如
following::p
选择所有后续的
<p>
元素。

XPath

following
轴的具体用法和注意事项。 如何精确选择特定类型的后续节点?

following
轴默认会选择所有类型的后续节点。如果只想选择特定类型的节点,例如所有的段落
<p>
标签,可以使用
following::p
。如果需要选择带有特定属性的节点,可以结合属性选择器,例如
following::a[@href]
选择所有带有
href
属性的链接。更复杂的选择可以使用谓语,例如
following::div[contains(@class, 'content')]
选择所有包含
class
属性且属性值包含
content
<div>
元素。

举个例子,假设有以下 HTML 片段:

<div>
  <p>This is the first paragraph.</p>
</div>
<span>Some text here</span>
<p>This is the second paragraph.</p>
<a href="https://example.com">Example Link</a>

如果当前节点是第一个

<p>
标签,那么
following::p
将会选择到 “This is the second paragraph.” 这个
<p>
标签。
following::a[@href]
将会选择到 "Example Link" 这个
<a>
标签。
following
轴和
following-sibling
轴的区别是什么?

following
轴和
following-sibling
轴是 XPath 中两个不同的轴,它们的选择范围不同。
following
轴选择的是当前节点之后的所有节点,不包括祖先节点、属性节点和命名空间节点,而
following-sibling
轴选择的是当前节点之后的所有兄弟节点,即与当前节点具有相同父节点的节点。

用一个简单的例子来说明:

<div>
  <p>First paragraph</p>
  <span>Some text</span>
  <p>Second paragraph</p>
</div>
<a href="#">Link</a>

如果当前节点是 "First paragraph" 这个

<p>
标签,那么
following::p
会选择 "Second paragraph" 这个
<p>
标签,而
following-sibling::p
也会选择 "Second paragraph" 这个
<p>
标签。但是,如果使用
following::a
,则会选择 "Link" 这个
<a>
标签,而
following-sibling::a
不会选择任何节点,因为
<a>
标签不是
<p>
标签的兄弟节点。

总结一下:

following
轴的选择范围更广,而
following-sibling
轴的选择范围更窄,仅限于兄弟节点。 如何在实际应用中使用
following
轴?

following
轴在网页抓取、数据提取和自动化测试等领域非常有用。例如,可以使用
following
轴来定位网页中特定元素之后的动态内容,或者根据某个标志性元素来查找相关的后续元素。

假设一个网页的结构如下:

<h1>Article Title</h1>
<div class="content">
  <p>Introduction paragraph.</p>
  <p>Main content paragraph 1.</p>
</div>
<div class="related-articles">
  <h2>Related Articles</h2>
  <ul>
    <li><a href="#">Article 1</a></li>
    <li><a href="#">Article 2</a></li>
  </ul>
</div>

如果想要提取 "Related Articles" 标题之后的所有链接,可以使用 XPath 表达式

//h2[text()='Related Articles']/following::a
。这个表达式首先定位到文本内容为 "Related Articles" 的
<h2>
标签,然后使用
following::a
选择该标题之后的所有
<a>
标签。

另一个例子是在自动化测试中,如果一个表单的错误信息显示在输入框之后,可以使用

following
轴来定位错误信息。例如,如果输入框的 HTML 结构如下:
<input type="text" id="username" name="username">
<span class="error-message">Username is required.</span>

可以使用 XPath 表达式

//input[@id='username']/following::span[@class='error-message']
来定位错误信息。

总而言之,

following
轴是一个非常灵活和强大的 XPath 轴,可以用于选择各种类型的后续节点,从而实现更精确和高效的网页数据提取和自动化测试。

以上就是XPath的following轴怎么选择之后的节点?的详细内容,更多请关注知识资源分享宝库其它相关文章!

标签:  节点 选择 XPath 

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。