XPath基础学习.docx
- 文档编号:6316349
- 上传时间:2023-01-05
- 格式:DOCX
- 页数:12
- 大小:19.13KB
XPath基础学习.docx
《XPath基础学习.docx》由会员分享,可在线阅读,更多相关《XPath基础学习.docx(12页珍藏版)》请在冰豆网上搜索。
XPath基础学习
XPath基础学习
目录
1.XPath概述2
1.1什么是XPath?
2
1.2XPath路径表达式2
1.3XPath标准函数2
2.XPath术语2
3.XPath语法3
2.1选取节点4
2.2谓语(Predicates)5
2.3选取未知节点5
2.4选取若干路径6
4.XPathAxes(坐标轴)7
位置路径表达式7
5.XPath运算符8
6.XML实例文档9
节点选取10
选取所有的book节点11
选取第一个book节点11
选取price11
选取价格高于35的price价格11
选取价格高于35的title节点11
1.XPath概述
1.1什么是XPath?
XPath是一门在XML文档中查找信息的语言,用于在XML文档中通过元素和属性进行导航。
∙XPath使用路径表达式在XML文档中进行导航
∙XPath包含一个标准函数库
∙XPath是XSLT中的主要元素
∙XPath是一个W3C标准
1.2XPath路径表达式
XPath使用路径表达式来选取XML文档中的节点或者节点集。
这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
1.3XPath标准函数
XPath含有超过100个内建的函数。
这些函数用于字符串值、数值,日期和时间比较、节点和QName处理、序列处理、逻辑值等等。
2.XPath术语
节点(Node)
在XPath中,有七种类型的节点:
元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。
XML文档是被作为节点树来对待的。
树的根被称为文档节点或者根节点。
xmlversion="1.0"encoding="ISO-8859-1"?
>
上面的XML文档中的节点例子:
lang="en"(属性节点)
基本值(或称原子值,Atomicvalue)
基本值是无父或无子的节点。
基本值的例子:
JK.Rowling
"en"
项目(Item)
项目是基本值或者节点。
节点关系
父(Parent)
每个元素以及属性都有一个父。
book元素是title、author、year以及price元素的父:
子(Children)
元素节点可有零个、一个或多个子。
title、author、year以及price元素都是book元素的子:
同胞(Sibling)
拥有相同的父的节点。
title、author、year以及price元素都是同胞:
先辈(Ancestor)
某节点的父、父的父,等等。
title元素的先辈是book元素和bookstore元素:
后代(Descendant)
某个节点的子,子的子,等等。
bookstore的后代是book、title、author、year以及price元素:
3.XPath语法
XPath使用路径表达式来选取XML文档中的节点或节点集。
节点是通过沿着路径(path)或者步(steps)来选取的。
我们将在下面的例子中使用这个XML文档。
xmlversion="1.0"encoding="ISO-8859-1"?
>
3.1选取节点
XPath使用路径表达式在XML文档中选取节点。
节点是通过沿着路径或者step来选取的。
下面列出了最有用的路径表达式:
表达式
描述
nodename
选取此节点的所有子节点
/
从根节点选取
//
从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置
.
选取当前节点
..
选取当前节点的父节点
@
选取属性
在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:
路径表达式
结果
bookstore
选取bookstore元素的所有子节点
/bookstore
选取根元素bookstore
注释:
假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径!
bookstore/book
选取所有属于bookstore的子元素的book元素。
//book
选取所有book子元素,而不管它们在文档中的位置。
bookstore//book
选择所有属于bookstore元素的后代的book元素,而不管它们位于bookstore之下的什么位置。
//@lang
选取所有名为lang的属性。
3.2谓语(Predicates)
谓语用来查找某个特定的节点或者包含某个指定的值的节点。
谓语被嵌在方括号中。
在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:
路径表达式
结果
/bookstore/book[1]
选取属于bookstore子元素的第一个book元素。
/bookstore/book[last()]
选取属于bookstore子元素的最后一个book元素。
/bookstore/book[last()-1]
选取属于bookstore子元素的倒数第二个book元素。
/bookstore/book[position()<3]
选取最前面的两个属于bookstore元素的子元素的book元素。
//title[@lang]
选取所有拥有名为lang的属性的title元素。
//title[@lang='eng']
选取所有title元素,且这些元素拥有值为eng的lang属性。
/bookstore/book[price>35.00]
选取所有bookstore元素的book元素,且其中的price元素的值须大于35.00。
/bookstore/book[price>35.00]/title
选取所有bookstore元素中的book元素的title元素,且其中的price元素的值须大于35.00。
3.3选取未知节点
XPath通配符可用来选取未知的XML元素。
通配符
描述
*
匹配任何元素节点
@*
匹配任何属性节点
node()
匹配任何类型的节点
实例
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
路径表达式
结果
/bookstore/*
选取bookstore元素的所有子节点
//*
选取文档中的所有元素
//title[@*]
选取所有带有属性的title元素。
3.4选取若干路径
通过在路径表达式中使用“|”运算符,您可以选取若干个路径。
实例
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
路径表达式
结果
//book/title|//book/price
选取所有book元素的title和price元素。
//title|//price
选取所有文档中的title和price元素。
/bookstore/book/title|//price
选取所有属于bookstore元素的book元素的title元素,以及文档中所有的price元素。
4.XPathAxes(坐标轴)
轴可定义某个相对于当前节点的节点集。
轴名称
结果
ancestor
选取当前节点的所有先辈(父、祖父等)
ancestor-or-self
选取当前节点的所有先辈(父、祖父等)以及当前节点本身
attribute
选取当前节点的所有属性
child
选取当前节点的所有子元素。
descendant
选取当前节点的所有后代元素(子、孙等)。
descendant-or-self
选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
following
选取文档中当前节点的结束标签之后的所有节点。
namespace
选取当前节点的所有命名空间节点
parent
选取当前节点的父节点。
preceding
选取文档中当前节点的开始标签之前的所有节点。
preceding-sibling
选取当前节点之前的所有同级节点。
self
选取当前节点。
位置路径表达式
位置路径可以是绝对的,也可以是相对的。
绝对路径起始于正斜杠(/),而相对路径不会这样。
在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:
绝对位置路径:
/step/step/...
相对位置路径:
step/step/...
每个步均根据当前节点集之中的节点来进行计算。
步(step)包括:
轴(axis):
定义所选节点与当前节点之间的树关系
节点测试(node-test):
识别某个轴内部的节点
零个或者更多谓语(predicate):
更深入地提炼所选的节点集
步的语法:
轴名称:
:
节点测试[谓语]
实例
例子
结果
child:
:
book
选取所有属于当前节点的子元素的book节点
attribute:
:
lang
选取当前节点的lang属性
child:
:
*
选取当前节点的所有子元素
attribute:
:
*
选取当前节点的所有属性
child:
:
text()
选取当前节点的所有文本子节点
child:
:
node()
选取当前节点的所有子节点
descendant:
:
book
选取当前节点的所有book后代
ancestor:
:
book
选择当前节点的所有book先辈
ancestor-or-self:
:
book
选取当前节点的所有book先辈以及当前节点(假如此节点是book节点的话)
child:
:
*/child:
:
price
选取当前节点的所有price孙。
5.XPath运算符
XPath表达式可返回节点集、字符串、逻辑值以及数字。
运算符
描述
实例
返回值
|
计算两个节点集
//book|//cd
返回所有带有book和cd元素的节点集
+
加法
6+4
10
-
减法
6-4
2
*
乘法
6*4
24
div
除法
8div4
2
=
等于
price=9.80
price是9.80,则返true。
否则false
!
=
不等于
price!
=9.80
price不是9.80,则返true。
否则false
<
小于
price<9.80
如果price是9.00,则返回true。
如果price是9.90,则返回false。
<=
小于或等于
price<=9.80
如果price是9.00,则返回true。
如果price是9.90,则返回false。
>
大于
price>9.80
如果price是9.90,则返回true。
如果price是9.80,则返回false。
>=
大于或等于
price>=9.80
如果price是9.90,则返回true。
如果price是9.70,则返回false。
or
或
price=9.80orprice=9.70
如果price是9.80,则返回true。
如果price是9.50,则返回false。
and
与
price>9.00andprice<9.90
如果price是9.80,则返回true。
如果price是8.50,则返回false。
mod
计算除法的余数
5mod2
1
6.XML实例文档
我们将在下面的例子中使用这个XML文档:
"books.xml":
xmlversion="1.0"encoding="ISO-8859-1"?
>
在您的浏览器中查看此"books.xml"文件。
节点选取
我们将使用微软的XMLDOM对象来载入XML文档,并使用selectNodes()函数从XML文档选取节点:
setxmlDoc=CreateObject("Microsoft.XMLDOM")
xmlDoc.async="false"
xmlDoc.load("books.xml")
xmlDoc.selectNodes(路径表达式)
选取所有的book节点
下面的这个例子选取了bookstore元素下所有的book节点:
xmlDoc.selectNodes("/bookstore/book")
选取第一个book节点
下面的例子仅选取bookstore元素下第一个book节点:
xmlDoc.selectNodes("/bookstore/book[0]")
注释:
IE5和6会把[0]作为第一个节点来执行,但是根据W3C的标准,应该使用[1]!
!
注释:
这个问题在IE6SP2中被纠正了!
选取price
下面的例子从所有的price节点选取文本:
xmlDoc.selectNodes("/bookstore/book/price/text()")
选取价格高于35的price价格
下面的例子会选取所有价格高于35的price节点:
xmlDoc.selectNodes("/bookstore/book[price>35]/price")
选取价格高于35的title节点
下面的例子会选取所有价格高于35的title节点:
xmlDoc.selectNodes("/bookstore/book[price>35]/title")
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XPath 基础 学习
![提示](https://static.bdocx.com/images/bang_tan.gif)