美高梅官方网站3045-mgm6608美高梅app下载
转发--SQL Server 二〇〇七的XQuery介绍

转发--SQL Server 二〇〇七的XQuery介绍

作者:美高梅官方网站3045    来源:未知    发布时间:2019-11-27 21:37    浏览量:

XML查询技术

XML文档以一个纯文本的形式存在,主要用于数据存储。不但方便用户读取和使用,而且使修改和维护变得更容易。

 

原文地址:

XML数据类型

XML是SQL Server中内置的数据类型,可用于SQL语句或者作为存储过程的参数。用户可以直接在数据库中存储、查询和管理XML文件。XML数据类型还能保存整个XML文档。XML数据类型和其他数据类型不存在根本上的差别,可以把它用在任何普通SQL数据类型可以使用的地方。
示例1:创建一个XML变量并用XML填充

DECLARE @doc XML
SELECT @doc='<Team name="Braves" />';

示例2:创建XML数据类型列

CREATE TABLE t1(
column1 INT,
column2 XML,
CONSTRAINT pk_column1 PRIMARY KEY(column1));

在上面的示例中,column2列是XML数据类型列。
示例3:不能将XML数据类型列设置为主键或外键

CREATE TABLE t1(
column1 INT,
column2 XML,
CONSTRAINT pk_column1 PRIMARY KEY(column2));

执行上面的代码,报错如下:
消息1919,级别16,状态1,第1 行
表't1' 中的列'column2' 的类型不能用作索引中的键列。
消息1750,级别16,状态0,第1 行
无法创建约束。请参阅前面的错误消息。
XML数据类型的使用限制
只有STRING数据类型才能转换成XML。
XML列不能应用于GROUP BY语句中
XML数据类型存储的数据不能超过2GB
XML数据类型字段不能被设置成主键或者外键或称为其一部分。
Sql_variant数据类型字段的使用不能把XML数据类型作为种子类型。
XML列不能指定为唯一的。
COLLATE子句不能被使用在XML列上。
存储在数据库中的XML仅支持128级的层次。
表中最对只能拥有32个XML列。
XML列不能加入到规则中。
唯一可应用于XML列的内置标量函数是ISNULL和COALESCE。
具有XML数据类型列的表不能有一个超过15列的主键。

SQL Server对于XML支持的核心在于XML数据的格式,这种数据类型可以将XML的数据存储于数据库的对象中,比如variables, columns, and parameters。当你用XML数据类型配置这些对象中的一个时,你指定类型的名字就像你在SQLServer 中指定一个类型一样。

类型化的XML和非类型化的XML

可以创建xml类型的变量,参数和列,或者将XML架构集合和xml类型的变量、参数或列关联,这种情况下,xml数据类型实例称之为类型化xml实例。否则XML实例称为非类型化的实例。

XML的数据类型确保了你的XML数据被完好的构建保存,同时也符合ISO的标准。在定义一个XML数据类型之前,我们首先要知道它的几种限制,如下:

 

XML数据类型方法

XML数据类型共有5种方法
query():执行一个XML查询并返回查询结果(返回一个XML数据类型)。
示例4

DECLARE @xmlDoc XML--声明XML类型的变量@xmlDoc
SET @xmlDoc='<students>
    <class name="数学" NO="8501">
        <student>
            <name>李林</name>
            <sex>男</sex>
            <age>16</age>
            <address>江苏</address>
        </student>
    </class>
</students>'--将XML实例分配给变量@xmlDoc
SELECT @xmlDoc.query('/students/class/student') AS test
--用query()查询@xmlDoc变量实例中标签<student>的子元素

查询结果如图所示
图片 1
点击查询结果
图片 2
如想查询标签

DECLARE @addr XML--声明一个XML类型变量@addr
SET @addr='/students/class/student'
SELECT @addr.exist('/students/class="江苏"') AS 返回值

结果如图所示
图片 3

注:exsit()方法的参数不必做精确定位

Value():计算一个查询并从XML中返回一个简单的值(只能返回单个值,且该值为非XML数据类型)。
Value()方法有2个参数XQuery和SQLType,XQuery参数表示命令要从XML实例内部查询数据的具体位置,SQLType参数表示value()方法返回的值的首选数据类型。
示例6

DECLARE @xmlDoc XML--声明XML类型的变量@xmlDoc
DECLARE @classID INT--声明INT类型的变量@classID
SET @xmlDoc='<students>
    <class name="数学" NO="8501">
        <student>
            <name>李林</name>
            <sex>男</sex>
            <age>16</age>
            <address>江苏</address>
        </student>
    </class>
</students>'--将XML实例分配给变量@xmlDoc
SET @classID=@xmlDoc.value('(/students/class/@NO)[1]','INT')
--将value()方法返回值赋值给变量@classID
SELECT @classID AS classID

查询结果如图所示
图片 4

注:SQLType不能是XML数据类型,公共语言运行时(CLR)用户定义类型,image,text,ntext或sql_variant数据类型,但可以是用户自定义数据类型SQL。

Modify():在XML文档的适当位置执行一个修改操作。它的参数XML_DML代表一串字符串,根据此字符串表达式来更新XML文档的内容。
示例7:在@xmlDoc的实例中,元素

DECLARE @xmlDoc XML--声明XML类型的变量@xmlDoc
SET @xmlDoc='<students>
    <class name="数学" NO="8501">
        <student>
            <name>李林</name>
            <sex>男</sex>
            <age>16</age>
            <address>江苏</address>
        </student>
    </class>
</students>'
SELECT @xmlDoc AS '插入节点前信息'
SET @xmlDoc.modify('insert <学历>本科</学历> after (students/class/student/age)[1]')
SELECT @xmlDoc AS '插入节点后信息'

查询结果插入节点后信息如图所示
图片 5

注:modify()方法的参数中insert和其他关键字必须小写,否则会报错

Nodes():允许把XML分解到一个表结构中。此方法将XML数据类型实例拆分为关系数据,并返回包含原始XML数据的行集。
示例8:依然用@locat参数的实例来示范

DECLARE @locat XML--声明XML变量@locat
SET @locat=
'<root>
    <location locationID="8">
        <step>8的步骤</step>
        <step>8的步骤</step>
        <step>8的步骤</step>
    </location>
    <location locationID="9">
        <step>9的步骤</step>
        <step>9的步骤</step>
        <step>9的步骤</step>
    </location>
    <location locationID="10">
        <step>10的步骤</step>
        <step>10的步骤</step>
        <step>10的步骤</step>
    </location>
    <location locationID="11">
        <step>11的步骤</step>
        <step>11的步骤</step>
        <step>11的步骤</step>
    </location>
</root>'--@locat变量的实例

SELECT T.Loc.query('.') AS result
FROM @locat.nodes('/root/location') T(Loc)
GO

查询结果如下图所示
图片 6

  • 一个实例的XML列不能包含超过2GB的数据。
  • 一个XML的列不能是索引。
  • XML对象不能使用Group By的子句中。
  • XML的数据类型不支持比较和排序。

引用:

XQuery简介

XQuery是一种查询语言,可以查询结构化或者半结构化的数据。SQL Server 2008中对XML数据类型提供了支持,可以存储XML文档,然后使用XQuery语言进行查询。

定义一个XML变量

摘要

FOR XML子句

通过在SELECT语句中使用FOR XML子句可以把数据库表中的数据检索出来并生成XML格式。SQL Server 2008支持FOR XML的四种模式,分别是RAW模式,AUTO模式,EXPLICIT模式和PATH模式。

DECLARE @ClientList XML
SET @ClientList =
'<?xml version="1.0" encoding="UTF-8"?>
<!-- A list of current clients -->
<People>
<Person id="1234">
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Person>
<Person id="5678">
<FirstName>Jane</FirstName>
<LastName>Doe</LastName>
</Person>
</People>'
SELECT @ClientList
GO

本文介绍了SQL Server 2005能够支持的XQuery的各方面特性如FLWOR语句,XQuery的操作,if-then-else结构,XML的构造函数,XQuery的内置函数,类型的转换操作符,并举例说明了上述XQuery功能的应用和操作。本文同时也对SQL Server 2005所不能支持的XQuery的特性进行了分析讨论,并提出了实际工作中的解决方案。在本文的最后章节中,详细举例介绍了三种特定的XQuery应用场景。

FOR XML RAW

将表转换成元素名称是row,属性名称为列名或者列的别名。
示例9:将Student表转换为XML格式(FOR XML RAW)
Student表的数据如图所示
图片 7
执行语句:

SELECT * FROM Student FOR XML RAW;

查询结果如图所示
图片 8
图片 9

这个例子通过使用DECLARE  声明去定义名为@ClientList 的变量,当我声明变量的时候,只需要包含XML的数据类型的名字在变量名后。

引用:

FOR XML AUTO

使用表名称作为元素名称,使用列名称作为属性名称,SELECT关键字后面列的顺序用于XML文档的层次。
示例10:将Student表转换为XML格式(FOR XML AUTO)
执行语句:

SELECT * FROM Student FOR XML AUTO;

查询结果如图所示
图片 10
图片 11

我设定了变量的值,然后使用select 来检索这个值。和我们想的一样,它返回了XML的文档。如下:

内容目录

FOR XML EXPLICIT

允许用户显式地定义XML树的形状,不受AUTO模式中的种种限制。不能将FOR XML EXPLICIT直接用在SELECT子句中。
示例11:将xmlTest表转换为XML格式(FOR XML EXPLICIT)
XmlTest表的数据如图所示
图片 12

SELECT DISTINCT 1 AS TAG,--指定顶级层级序号1
NULL AS PARENT,--该层级没有父级
NULL AS '班级信息!1!',
NULL AS '班级信息!2!班级',
NULL AS '班级信息!2!班级类型',
NULL AS '班级信息!2!班主任',
NULL AS '学生信息!3!学号!Element',
NULL AS '学生信息!3!学生姓名!Element',
NULL AS '学生信息!3!性别!Element',
NULL AS '学生信息!3!总分!Element'--设置所有层级元素和属性命名,暂时不对这些元素赋值
--例如在“学生信息!3!总分!Element”格式中,学生信息是元素名,3表示该元素所处层级,总分表示属性名
--Element指出生成以属性单独为一行的XML格式
UNION ALL--层级之间用UNION ALL相连
SELECT DISTINCT 2 AS TAG,--指定二级层级序号2
1 AS PARENT,--父级序号是序号为1的层级
NULL,--在层级的代码中已列出了所有层级元素和属性命名,因此这里给元素和属性做赋值。这句语句对应层级代码中“NULL AS '班级信息!1!'”,说明我希望该元素作为独立成行的标签,没有赋值。
班级,--对层级中的“NULL AS '班级信息!2!班级'”赋值,将xmlTest表中的班级赋值给属性班级
班级类型,--对层级中的“NULL AS '班级信息!2!班级类型'”赋值,将xmlTest表中的班级赋值给属性班级类型
班主任,--同上
NULL,--这句语句开始对应的是层级的属性,因此在层级的代码中不做赋值,在下面层级的代码中做赋值
NULL,
NULL,
NULL
FROM xmlTest--指出上面赋值的数据源来自于xmlTest表
UNION ALL--各个层级之间用UNION ALL连接
SELECT 3 AS TAG,--指定3级层级序号3
2 AS PARENT,--父级是序号为2的层级
NULL,--对应层级的”NULL AS '班级信息!1!'“语句,不希望它有值,所以不做赋值
NULL,--这三个NULL对应层级的各个属性,在层级的代码中已经做过赋值,因此在这里不做赋值
NULL,
NULL,
学号,--对应层级1代码中的层级3属性,在层级代码3中进行赋值
学生姓名,
性别,
年级总分
FROM xmlTest
FOR XML EXPLICIT;--将上述查询转换为XML,不能漏掉,否则结果会以表格形式显示

查询结果如图所示
图片 13
图片 14
在结果图中我们发现,红框中3个班级信息列在一起,而所有学生都列在高一3班下,这不是我们想要的结果,我们希望每个班级对应自己的学生。那么如何解决此类问题呢,这涉及到排序。

注:如果层级中有多个数据完全重复,可以在该层级对应的代码前加DISTINCT关键字去除重复元素。

首先删除代码行末的FOR XML EXPLICIT语句,仅仅执行剩下的部分,使结果以表格形式呈现,那么结果如下
图片 15
这个表格每行的顺序也代表了该表格转化为XML文档后内容显示顺序。图中层级2(TAG=2)的几行,位置都在一起,这也就是为什么层级3的所有数据都在高一3班下面了。我们需要对表格每行的顺序进行调整,使学生所在行按照xmlTest表中的数据逻辑分散在班级行之下。但是根据上面的表格发现,不管按照什么字段排序,都不可能达到效果。
正确代码如下

SELECT DISTINCT 1 AS TAG,
NULL AS PARENT,
NULL AS '班级信息!1!',
NULL AS '班级信息!2!班级',
NULL AS '班级信息!2!班级类型',
NULL AS '班级信息!2!班主任',
NULL AS '学生信息!3!学号!Element',
NULL AS '学生信息!3!学生姓名!Element',
NULL AS '学生信息!3!性别!Element',
NULL AS '学生信息!3!总分!Element'
UNION ALL
SELECT DISTINCT 2 AS TAG,
1 AS PARENT,
NULL,
班级,
班级类型,
班主任,
NULL,
NULL,
NULL,
NULL
FROM xmlTest
UNION ALL
SELECT 3 AS TAG,
2 AS PARENT,
NULL,
班级,
班级类型,
班主任,
学号,
学生姓名,
性别,
年级总分
FROM xmlTest
ORDER BY [班级信息!2!班级],[学生信息!3!学号!Element]
FOR XML EXPLICIT;

对比第一次代码,我们发现上面的代码不止在行末对数据按元素属性进行了排序,还在赋值的代码中有所改动。在层级1代码中完全没有改动,因为层级1的代码作用是设置XML格式的,对数据排序没有影响。在下面几个层级的赋值部分,每个层级的代码中都对上面几个层级的元素重复赋值,这样做使结果的表格中不再有那么多属性值是NULL,可以方便排序。最后再按照元素[班级信息!2!班级]和[学生信息!3!学号!Element]排序。让我们看看结果如何。
运行上面的代码,但不运行FOR XML EXPLICIT语句,看看表格中数据内容和行顺序是否改变
图片 16
如图所示,发现行数据和学生数据的顺序显示正确。运行所有代码得到XML文档,结果如图所示
图片 17
由于XML文档内容过长,不贴图了,直接复制所有XML内容展示一下。

<班级信息>
  <班级信息 班级="高一1班" 班级类型="创新班" 班主任="李玉虎">
    <学生信息>
      <学号>20180101</学号>
      <学生姓名>李华</学生姓名>
      <性别>男</性别>
      <总分>5.680000000000000e+002</总分>
    </学生信息>
    <学生信息>
      <学号>20180103</学号>
      <学生姓名>孙丽</学生姓名>
      <性别>女</性别>
      <总分>3.390000000000000e+002</总分>
    </学生信息>
    <学生信息>
      <学号>20180108</学号>
      <学生姓名>吴伟</学生姓名>
      <性别>男</性别>
      <总分>5.280000000000000e+002</总分>
    </学生信息>
  </班级信息>
  <班级信息 班级="高一2班" 班级类型="重点班" 班主任="姜杰">
    <学生信息>
      <学号>20180102</学号>
      <学生姓名>张三</学生姓名>
      <性别>男</性别>
      <总分>6.270000000000000e+002</总分>
    </学生信息>
    <学生信息>
      <学号>20180104</学号>
      <学生姓名>袁康</学生姓名>
      <性别>男</性别>
      <总分>4.820000000000000e+002</总分>
    </学生信息>
    <学生信息>
      <学号>20180106</学号>
      <学生姓名>赵四</学生姓名>
      <性别>男</性别>
      <总分>5.680000000000000e+002</总分>
    </学生信息>
  </班级信息>
  <班级信息 班级="高一3班" 班级类型="提高班" 班主任="师从光">
    <学生信息>
      <学号>20180105</学号>
      <学生姓名>王婷</学生姓名>
      <性别>女</性别>
      <总分>7.610000000000000e+002</总分>
    </学生信息>
    <学生信息>
      <学号>20180107</学号>
      <学生姓名>周其</学生姓名>
      <性别>女</性别>
      <总分>3.480000000000000e+002</总分>
    </学生信息>
    <学生信息>
      <学号>20180109</学号>
      <学生姓名>甄诚</学生姓名>
      <性别>女</性别>
      <总分>7.020000000000000e+002</总分>
    </学生信息>
  </班级信息>
</班级信息>

将上面的结果对比一下原始xmlTest表,看看每个班级和它下属学生的层级关系是否有误。

注:写FOR XML EXPLICIT代码要注意,层级1的代码中先设置层级结构,不要先急着赋值。在下属层级的代码中对层级1中的代码进行赋值,最好重复赋值,不然就会出现文中的排序问题。如果某个层级出现重复数据,在该层级的代码前加DISTINCT关键字。解决排序问题最好的办法是对各个层级的属性重复赋值并在末尾用ORDER BY按层级属性排序。

仔细观察上面的XML文档,发现总分属性的值是个float类型,要把它转换成int,只需要把层级3中对总分的赋值代码改成CAST(年级总分 AS int)
图片 18

<!-- A list of current clients -->
<People>
<Person id="1234">
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Person>
<Person id="5678">
<FirstName>Jane</FirstName>
<LastName>Doe</LastName>
</Person>
</People>

导言

FOR XML PATH

PATH模式提供了一种较简单的方法来混合元素及属性。在PATH模式中,列名或列别名被作为XPATH表达式来处理,这些表达式指定了如何将值映射到XML中。默认情况下,PATH模式为每一样自动生成

 

SQL Server 2005中的XML数据类型

没有名称的列

下面介绍一种简单的FOR XML PATH应用方式

SELECT 2+3 FOR XML PATH;--将2+3的值转换成xml格式

查询结果如图所示
图片 19

注:如果提供了空字符串FOR XML PATH(‘’)则不会生成任何元素。

SELECT 2+3 FOR XML PATH('');--将2+3的值转换成xml格式并去掉<row>

查询结果如图所示
图片 20
示例12:利用xmlTest表和mainTeacher表查询出xmlTest表中成绩>=700分的学生的班主任信息和学生信息,并转化成XML格式
XmlTest表数据如下图所示
图片 21
MainTeacher表数据如下图所示
图片 22
执行下面的语句

SELECT xmlTest.学号 AS '学生信息/@学号',--@符号表示该名称为属性名,斜杠表示子层级
xmlTest.学生姓名 AS '学生信息/@姓名',
xmlTest.班级 AS '学生信息/@班级',
mainTeacher.姓名 AS '学生信息/班主任信息/姓名',
mainTeacher.教师编号 AS '学生信息/班主任信息/教师编号',
mainTeacher.性别 AS '学生信息/班主任信息/性别',
mainTeacher.年龄 AS '学生信息/班主任信息/年龄',
mainTeacher.联系电话 AS '学生信息/班主任信息/联系电话'
FROM xmlTest,mainTeacher
WHERE xmlTest.年级总分>=700
AND xmlTest.班主任=mainTeacher.姓名
FOR XML PATH('result');--将根目录名改为result

查询结果如下所示

<result>
  <学生信息 学号="20180105" 姓名="王婷" 班级="高一3班">
    <班主任信息>
      <姓名>师从光</姓名>
      <教师编号>83928182</教师编号>
      <性别>男</性别>
      <年龄>28</年龄>
      <联系电话>15963002120</联系电话>
    </班主任信息>
  </学生信息>
</result>
<result>
  <学生信息 学号="20180109" 姓名="甄诚" 班级="高一3班">
    <班主任信息>
      <姓名>师从光</姓名>
      <教师编号>83928182</教师编号>
      <性别>男</性别>
      <年龄>28</年龄>
      <联系电话>15963002120</联系电话>
    </班主任信息>
  </学生信息>
</result>

接下来我们看看如何定义一个XML的列

在下面的例子中,我将创建一个商店客户的表,表中存储了ID和每个商店的客户信息。

USE AdventureWorks2008R2
GO
IF OBJECT_ID('dbo.StoreClients') IS NOT NULL
DROP TABLE dbo.StoreClients
GO
CREATE TABLE dbo.StoreClients
(
StoreID INT IDENTITY PRIMARY KEY,
ClientInfo XML NOT NULL
)
GO

接下来插入数据到这个表中,包括XML的文档和片段。我将声明一个XML的变量,然后用这个变量插入这个文档到表的数据行里面。

DECLARE @ClientList XML
SET @ClientList =
'<?xml version="1.0" encoding="UTF-8"?>
<!-- A list of current clients -->
<People>
<Person id="1234">
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Person>
<Person id="5678">
<FirstName>Jane</FirstName>
<LastName>Doe</LastName>
</Person>
</People>'
INSERT INTO dbo.StoreClients (ClientInfo)
VALUES(@ClientList)
GO

尽管变量将整个XML文档插入了进来,但是它是被当做一个单一的值插入到表列里面来。

正如以上所述,创建和插入都是很直接简单的,接下来我们看一下如何创建一个XML的参数

定义一个XML参数

例如,我定义@StoreClients 作为一个输入参数,并且配置它为XML的类型

USE AdventureWorks2008R2
GO
IF OBJECT_ID('dbo.AddClientInfo', 'P') IS NOT NULL
DROP PROCEDURE dbo.AddClientInfo
GO
CREATE PROCEDURE dbo.AddClientInfo
@StoreClients XML
AS
INSERT INTO dbo.StoreClients (ClientInfo)
VALUES(@StoreClients)
GO

然后我们再看看在存储过程中如何使用XML作为参数:

DECLARE @ClientList XML
SET @ClientList =
'<?xml version="1.0" encoding="UTF-8"?>
<!-- A list of current clients -->
<People>
<Person id="1234">
<FirstName>John</FirstName>
<LastName>Doe</LastName>
</Person>
<Person id="5678">
<FirstName>Jane</FirstName>
<LastName>Doe</LastName>
</Person>
</People>'
EXEC dbo.AddClientInfo @ClientList

过程也是很直接,先将XML数据赋值给变量,然后将变量作为参数执行SP,这是查询你会发现数据已经在表中了。

现在我们要学习一下XML类型支持的方法:query(``), value().

在这之前我们要知道一种表达式,就是XQuery,它是一种强大的脚本语言,用来获取XML的数据。SQLServer 支持这种语言的子集,所以我们能使用这种语言的表达式来检索和修改XML的数据。

类型化vs.非类型化的XML数据类型

TYPE命令

SQL Server支持TYPE命令将FOR XML的查询结果作为XML数据类型返回。
示例13:依然是上面的例子,将查询结果作为XML数据类型返回。

CREATE TABLE xmlType(xml_col XML);
--首先创建一个表xmlType,只有一列xml数据类型的xml_col
INSERT INTO xmlType
SELECT(--将上面的查询语句全部复制到括号中,末尾加上TYPE,表示将XML文档作为xml数据类型,并插入到表xmlType中
SELECT xmlTest.学号 AS '学生信息/@学号',
xmlTest.学生姓名 AS '学生信息/@姓名',
xmlTest.班级 AS '学生信息/@班级',
mainTeacher.姓名 AS '学生信息/班主任信息/姓名',
mainTeacher.教师编号 AS '学生信息/班主任信息/教师编号',
mainTeacher.性别 AS '学生信息/班主任信息/性别',
mainTeacher.年龄 AS '学生信息/班主任信息/年龄',
mainTeacher.联系电话 AS '学生信息/班主任信息/联系电话'
FROM xmlTest,mainTeacher
WHERE xmlTest.年级总分>=700
AND xmlTest.班主任=mainTeacher.姓名
FOR XML PATH('result'),TYPE
);
SELECT * FROM xmlType;--查询xmlType表

查询结果如图所示
图片 23
双击打开查看XML

<result>
  <学生信息 学号="20180105" 姓名="王婷" 班级="高一3班">
    <班主任信息>
      <姓名>师从光</姓名>
      <教师编号>83928182</教师编号>
      <性别>男</性别>
      <年龄>28</年龄>
      <联系电话>15963002120</联系电话>
    </班主任信息>
  </学生信息>
</result>
<result>
  <学生信息 学号="20180109" 姓名="甄诚" 班级="高一3班">
    <班主任信息>
      <姓名>师从光</姓名>
      <教师编号>83928182</教师编号>
      <性别>男</性别>
      <年龄>28</年龄>
      <联系电话>15963002120</联系电话>
    </班主任信息>
  </学生信息>
</result>
注意:

因为XQuery是一种非常复杂的语言,我们只是涉及了一部分他的组件,如果想要更进一步的理解它如何应用,请查看MSDN XQuery language reference.

那我们现在先来通过例子来看一下query()和value 两个方法是如何使用XML数据的。需要注意的是我接下来的测试环境是SQLServer2008 R2。实例中包含了ClientDB 数据库、ClientInfoCollection 的XML数据以及ClientInfo 表。

USE master;
GO

IF DB_ID('ClientDB') IS NOT NULL
DROP DATABASE ClientDB;
GO

CREATE DATABASE ClientDB;
GO

USE ClientDB;
GO

IF OBJECT_ID('ClientInfoCollection') IS NOT NULL
DROP XML SCHEMA COLLECTION ClientInfoCollection;
GO

CREATE XML SCHEMA COLLECTION ClientInfoCollection AS 
'<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema" 
xmlns="urn:ClientInfoNamespace" 
targetNamespace="urn:ClientInfoNamespace" 
elementFormDefault="qualified">
  <xsd:element name="People">
    <xsd:complexType>
      <xsd:sequence>
        <xsd:element name="Person" minOccurs="1" maxOccurs="unbounded">
          <xsd:complexType>
            <xsd:sequence>
              <xsd:element name="FirstName" type="xsd:string" minOccurs="1" maxOccurs="1" />
              <xsd:element name="LastName" type="xsd:string" minOccurs="1" maxOccurs="1" />
              <xsd:element name="FavoriteBook" type="xsd:string" minOccurs="0" maxOccurs="5" />
            </xsd:sequence>
            <xsd:attribute name="id" type="xsd:integer" use="required"/>
          </xsd:complexType>
        </xsd:element>
      </xsd:sequence>
    </xsd:complexType>
  </xsd:element>
</xsd:schema>';
GO

IF OBJECT_ID('ClientInfo') IS NOT NULL
DROP TABLE ClientInfo;
GO

CREATE TABLE ClientInfo
(
  ClientID INT PRIMARY KEY IDENTITY,
  Info_untyped XML,
  Info_typed XML(ClientInfoCollection)
);

INSERT INTO ClientInfo (Info_untyped, Info_typed)
VALUES
(
  '<?xml version="1.0" encoding="UTF-8"?>
  <People>
    <Person id="1234">
      <FirstName>John</FirstName>
      <LastName>Doe</LastName>
    </Person>
    <Person id="5678">
      <FirstName>Jane</FirstName>
      <LastName>Doe</LastName>
    </Person>
  </People>',
  '<?xml version="1.0" encoding="UTF-8"?>
  <People xmlns="urn:ClientInfoNamespace">
    <Person id="1234">
      <FirstName>John</FirstName>
      <LastName>Doe</LastName>
    </Person>
    <Person id="5678">
      <FirstName>Jane</FirstName>
      <LastName>Doe</LastName>
    </Person>
  </People>'
);

Listing 1: 创建测试环境和数据

XML数据类型的方法

FOR XML的嵌套查询

示例14:在示例12的查询结果中查询班主任联系电话

SELECT (
SELECT xmlTest.学号 AS '学生信息/@学号',
xmlTest.学生姓名 AS '学生信息/@姓名',
xmlTest.班级 AS '学生信息/@班级',
mainTeacher.姓名 AS '学生信息/班主任信息/姓名',
mainTeacher.教师编号 AS '学生信息/班主任信息/教师编号',
mainTeacher.性别 AS '学生信息/班主任信息/性别',
mainTeacher.年龄 AS '学生信息/班主任信息/年龄',
mainTeacher.联系电话 AS '学生信息/班主任信息/联系电话'
FROM xmlTest,mainTeacher
WHERE xmlTest.年级总分>=700
AND xmlTest.班主任=mainTeacher.姓名
FOR XML PATH('result'),TYPE).query('result/学生信息/班主任信息/联系电话') AS '优秀教师联系方式';

SELECT里面依然套用了示例13中被套用的代码,外面用了query方法,查询结果如下图所示
图片 24

<联系电话>15963002120</联系电话>
<联系电话>15963002120</联系电话>

The XML query() Method

query方法,通常被用来返回一个指定XML子集的无类型的XML实例,如下,用括号加单引号来实现表达式,语法:

db``_object``.query('``xquery_exp``')

当我们调用这个方法时,用真实数据库对象替换掉引号内的表达式。通过实例来比较一下结果有什么不一样。

SELECT Info_untyped.query('/People')
  AS People_untyped
FROM ClientInfo;

Listing 2: 使用query(``) 来获得<People>元素中的值

在这种情况下,将返回标签下所有的元素,包括子元素属性以及它们的值。

<People>
  <Person id="1234">
    <FirstName>John</FirstName>
    <LastName>Doe</LastName>
  </Person>
  <Person id="5678">
    <FirstName>Jane</FirstName>
    <LastName>Doe</LastName>
  </Person>
</People>

Listing 3: 结果集返回了/People 的内容

假如打算检索类型化的列中的<People> 元素的内容,我需要修改XQuery的表达式。如Listing 4

SELECT Info_typed.query(
  'declare namespace ns="urn:ClientInfoNamespace";
  /ns:People') AS People_typed
FROM ClientInfo;

Listing 4: 使用query(``) 来检索类型化的XML列,然后你运行这个语句,就会得到结果如Listing5

<People xmlns="urn:ClientInfoNamespace">
  <Person id="1234">
    <FirstName>John</FirstName>
    <LastName>Doe</LastName>
  </Person>
  <Person id="5678">
    <FirstName>Jane</FirstName>
    <LastName>Doe</LastName>
  </Person>
</People>

Listing 5: 展示结果

如上,我们发现两种结果是很接近的,唯一的区别就是类型化的列里面包含了涉及的命名空间。

如果我们打算获得子下一级,子元素的内容,我们需要修改表达式,通过添加/Person 到路径名称中,如下:

SELECT 
  Info_untyped.query(
    '/People/Person') AS People_untyped,
  Info_typed.query(
    'declare namespace ns="urn:ClientInfoNamespace";
    /ns:People/ns:Person') AS People_typed
FROM ClientInfo;

Listing 6: 检索 <Person> 元素

<Person id="1234">
  <FirstName>John</FirstName>
  <LastName>Doe</LastName>
</Person>
<Person id="5678">
  <FirstName>Jane</FirstName>
  <LastName>Doe</LastName>
</Person>

Listing 7: 这个结果集是非类型化数据的结果

<ns:Person xmlns:ns="urn:ClientInfoNamespace" id="1234">
  <ns:FirstName>John</ns:FirstName>
  <ns:LastName>Doe</ns:LastName>
</ns:Person>
<ns:Person xmlns:ns="urn:ClientInfoNamespace" id="5678">
  <ns:FirstName>Jane</ns:FirstName>
  <ns:LastName>Doe</ns:LastName>
</ns:Person>

Listing 8: 这个结果集是类型化数据的结果

如果我们打算去得到指定的<Person>下面的某一个元素,需要加入涉及的id属性。下面对比类型和非类型的两种情况下指定元素属性时如何获取。

SELECT 
  Info_untyped.query(
    '/People/Person[@id=1234]') AS People_untyped,
  Info_typed.query(
    'declare namespace ns="urn:ClientInfoNamespace";
    /ns:People/ns:Person[@id=5678]') AS People_typed
FROM ClientInfo;

Listing 9: 检索数据,指定元素

前面的没有变化,按照元素来添加表达式,然后用中括号,在中括号内添加了@id的值,结果如下

<Person id="1234">
  <FirstName>John</FirstName>
  <LastName>Doe</LastName>
</Person>

Listing 10: id为1234非类型化数据结果返回值。

对于类型化的列,我使用的id为5678.注意,这次不再需要在属性名称前加上命名空间的前缀了,只需要在元素名字前引用就足够了。

<ns:Person xmlns:ns="urn:ClientInfoNamespace" id="5678">
  <ns:FirstName>Jane</ns:FirstName>
  <ns:LastName>Doe</ns:LastName>
</ns:Person>

Listing 11: id为5678的数据结果

更进一步的展示结果,向下一级

SELECT 
  Info_untyped.query(
    '/People/Person[@id=1234]/FirstName') AS People_untyped,
  Info_typed.query(
    'declare namespace ns="urn:ClientInfoNamespace";
    /ns:People/ns:Person[@id=5678]/ns:FirstName') AS People_typed
FROM ClientInfo;

结果

<FirstName>John</FirstName>

<ns:FirstName xmlns:ns="urn:ClientInfoNamespace">Jane</ns:FirstName>

Listing 14: 名字的结果的展示

当然还可以通过数字索引的方式展示:

SELECT 
  Info_untyped.query(
    '/People/Person[1]/FirstName') AS People_untyped,
  Info_typed.query(
    'declare namespace ns="urn:ClientInfoNamespace";
    /ns:People/ns:Person[2]/ns:FirstName') AS People_typed
FROM ClientInfo;

Listing 15: 使用数字索引来引用元素下的结果

XQuery入门

XML索引

由于XML数据类型最大可存储2GB的数据,因此需要创建XML索引来优化查询性能。

XML的value()方法

就如同query()方法一样简便,很多时候当你想去检索一个特定的元素或属性的时候,而不是获取XML的元素,那就可以使用value()了。这种方法只会返回一个特定的值,不作为数据类型。因此一定要传递两个参数XQuery表达式和T-SQL数据类型。下面看语法:

db``_object``.value('``xquery_exp``', '``sql_type``')

SELECT 
  Info_untyped.value(
    '(/People/Person[1]/FirstName)[1]', 
    'varchar(20)') AS Name_untyped,
  Info_typed.value(
    'declare namespace ns="urn:ClientInfoNamespace";
    (/ns:People/ns:Person[2]/ns:FirstName)[1]',
    'varchar(20)') AS Name_typed
FROM ClientInfo;

Listing 16: 检索<FirstName> 的值

在Listing16中,我指定了[1]在Xquery表达式的后面,所以结果集将只返回第一个人的名字。

Name_untyped         Name_typed
-------------------- --------------------
John                 Jane

Listing 17: <FirstName>的两个结果

当然,我们也可以检索每个实例的id的属性值,并且指定Int类型返回。

SELECT 
  Info_untyped.value(
    '(/People/Person/@id)[1]', 
    'int') AS Name_untyped,
  Info_typed.value(
    'declare namespace ns="urn:ClientInfoNamespace";
    (/ns:People/ns:Person/@id)[2]',
    'int') AS Name_typed
FROM ClientInfo;

Listing 19: 检索两个实例的id属性值

Name_untyped         Name_typed
-------------------- --------------------
1234                 5678

Listing 20: 返回两个id的属性

除了在表达式中定义你的XQuery表达式,你也能聚合的功能来进一步定义你的查询和操作数据。例如,count()功能,我们来获取每个列中<Person> 元素的个数。

SELECT 
  Info_untyped.value(
    'count(/People/Person)', 
    'int') AS Number_untyped,
  Info_typed.value(
    'declare namespace ns="urn:ClientInfoNamespace";
    count(/ns:People/ns:Person)',
    'int') AS Number_typed
FROM ClientInfo;

Listing 21: 使用count功能来检索元素个数

结果如下:

Number_untyped Number_typed
-------------- ------------
2              2

Listing 22: 每列数据中<Person> 元素的数量

另外一个常用的功能是concat(``), 它可以连接两个或多个XML元素下的数据。你可以指定你想连接的每一个部分。示例:

SELECT 
  Info_untyped.value(
    'concat((/People/Person/FirstName)[2], " ", 
      (/People/Person/LastName)[2])', 
    'varchar(25)') AS FullName
FROM ClientInfo;

Listing 23: 使用concat(``)来连接数值

FullName
-------------------------
Jane Doe

Listing 24: 连接后的返回值

名和姓被连接起来,组成一个单一的值。都来自于同一个<Person> 下,当然也可以来自不同。

XPath2.0简介

主XML索引

主XML索引对XML列中XML实例内的所有标记,值和路径进行索引。创建主XML索引时,相应XML列所在的表必须对该表的主键创建了聚集索引。

总结

 

我们基本上了解了XML在SQLServer 中的简单应用,从定义到使用方法。也看到了query()检索子集,也能使用value()检索独立的元素属性的值。当然除此之外还有向exist(``) andnodes() 这样方法,配合语法都以应用,这部分就不再展开讲了,大同小异。有不明白的可以私聊。更多使用方法还请访问MSDN来获取(搜索XQuery language reference)。

XQuery简介

辅助XML索引

为了增强主XML索引的性能,可以创建辅助XML索引。只有创建了主XML索引后才能创建辅助XML索引。辅助XML索引分3种:PATH,VALUES和PROPERTY辅助XML索引。

XQuery的优点

创建索引

为表中某个列创建索引,要求该列是XML数据类型。

ALTER TABLE Student
ADD xml_test XML;--对Student表添加一个XML数据类型字段xml_test
--对Student表的xml_test字段创建主XML索引,命名为学生信息表
CREATE PRIMARY XML INDEX 学生信息表
ON Student(xml_test)
GO
--对Student表的xml_test字段创建PATH辅助XML索引,记得写上主索引名
CREATE XML INDEX 辅助学生信息表
ON Student(xml_test)
USING XML INDEX 学生信息表 FOR PATH
GO

注:辅助索引的命名不能与主索引相同。

XQuery的应用领域

修改和删除索引(ALTER INDEX 和 DROP INDEX)
ALTER INDEX ALL ON Student--重建所有索引
REBUILD WITH(FILLFACTOR=80,SORT_IN_TEMPDB=ON,STATISTICS_NORECOMPUTE=ON);
--删除索引
DROP INDEX 学生信息表 ON Student
GO

注:删除主索引,与其相关的所有辅助索引也会被删除。因此上面语句中删除学生信息表索引后,辅助学生信息表索引也被删除了。

在服务器端使用XQuery的优点

OPENXML函数

OPENXML是一个行集函数,用于检索XML文档。在试用OPENXML函数之前,一定要先用系统存储过程sp_xml_preparedocument分析文档,该存储过程在分析完XML文档后会返回一个句柄,使用OPENXML检索文档时要将该句柄作为参数传给OPENXML。
示例15

--定义两个变量@Student和@StudentInfo
DECLARE @Student int
DECLARE @StudentInfo xml
--使用SET为@StudentInfo赋值
SET @StudentInfo='
<row>
<姓名>祝红涛</姓名>
<班级编号>2019382910</班级编号>
<成绩>89</成绩>
<籍贯>沈阳</籍贯>
</row>
'
--使用系统存储过程sp_xml_preparedocument分析由@Student变量表示的XML文档,将分析得到的句柄赋值给@Student变量
EXEC sp_xml_preparedocument @Student OUTPUT,@StudentInfo
--在SELECT语句中使用OPENXML函数返回行集中的指定数据
SELECT * FROM OPENXML(@Student,'/row',2)
WITH(
姓名 varchar(8),
班级编号 varchar(10),
成绩 int,
籍贯 varchar(20)
);

结果如图所示
图片 25
在上述语句中,sp_xml_preparedocument存储过程语句用了2个参数,其中@Student是一个int型变量,该存储过程会将句柄存储在@Student变量中作为结果数据,@StudentInfo是一个XML类型的变量,存储了将要进行分析的XML文档。
OPENXML函数的语句中,使用了3个参数,其中@Student代表已经经过sp_xml_preparedocument存储过程分析的文档的句柄,’/row’使用XPath模式提供了一个路径,代表要返回XML文档中该路径下的数据行,2是一个可选数据参数,表示将这些数据行以元素为中心映射。

当使用XML Schemas时如何执行XQuery

XQuery表达式的结构

XPath 2.0表达式

FLWOR语句

For

Where

order by

return

FLWOR表达式vs. XPath表达式

XQuery的操作

数学运算符

比较运算符

普通比较运算符

数值比较运算符

节点比较运算符

节点顺序比较运算符

逻辑操作符

if-then-else语句

使用XQuery构造XML

XQuery构造器 vs. FOR XML语句

XQuery内置函数

数据访问

字符串的处理

聚集函数

上下文函数

关系类型表达式

类型声明表达式

如for语句中的xs:TYPE

类型检查表达式

xs:TYPE实例

类型转换函数

隐式类型转换

显式类型转换

值类型构造器

cast as xs:TYPE ?操作符

访问关系性的列和变量

不支持的特性和工作中的解决方案

最佳实践和指导方针

XML数据的修改

插入操作

删除操作符

Update操作符

XQuery应用场景

场景1:性能评价系统

场景2:病例系统

场景3:资产管理系统

结论

导言

XML是被用来作为一种文档格式而发展起来的。然而,XML所具有的其它特征,比如可扩展性、支持国际标准、表示结构化和半结构化数据的能力,以及人和机器对其简单的可读性,使得它成为一种广泛应用的、平台无关的数据表示格式。由于XML获得了广泛的认可,因此很多用户都用XML来解决复杂的商业问题,例如那些涉及到数据集成的问题。有许多案例都推荐将信息直接存储到XML文档,这比将信息先存到数据表中然后再将这些信息组成XML消息要有效的多。要查看更多关于这些案例的信息,可以查阅“微软SQLserver2005 XML最佳实践”白皮书中相关文档。XML在存储文档和半结构化数据表示方面的应用已经让XML发展成为一种可以在服务器端存储简单数据管理的数据存储格式。

 

可是这种发展也导致了一个问题-从XML数据中提取出来的信息要作为BLOBs类型存储到关系型数据库中,需要一种查询语言来提取XML所表达的信息,并使其符合关系型数据库中的要求。Microsoft  SQL Server  2000提供了OpenXML,它可以被用来查询,从被设计时,就满足了从XML数据映射到关系型数据格式的要求,但它并没有完全支持XML数据模型(见表1)。关系数据模型和XML数据模型在很多方面都不一样。下表简单列举了两种数据模型的主要区别。

 

表1   关系型数据模型与XML数据模型之间的区别

图片 26

 

 

不断增加处理越来越多样化的结构数据的需求和数据间隐含约束的必要性是扩展关系型数据模型以支持XML文档存储的最重要的两个原因。另外,SQL语言在处理半结构化或者标记信息时的局限性也促使了XQuery语言的发展。XQuery语言在设计的时候已经考虑到XML数据的特性和处理XML数据的相关问题。

SQL Server 2005通过内置XML数据类型支持XML数据的本地化存储。XQuery 1.0版本是经World Wide Web Consortium (W3C) XML查询工作组定义,基于XML数据的公式化查询语言。XQuery,像SQL一样,是一种声明性的查询语言,就如同我们在下面的文章中将会看到的一样,能通过基本的SQL和XPath知识来轻松地理解它。

本文基于XQuery 1.0在SQL Server 2005中的实践,同时也基于XQuery 1.0 2004年的工作草图。本文的第一部分提出了新的XML数据类型的总述以及它的相关特点,接下来的部分,分别地介绍XQuery的多样操作,XQuery的内置函数,关系型表达式,以及SQL Server 2005不支持的部分。最后,介绍最近的最佳应用和指导,XML数据的修正以及XQuery的应用事例的信息。

引用:

SQL Server 2005中的XML数据类型

SQL Server 2005引入的新XML数据类型使得用户具有在数据库中存储XML文档和段落的能力。一个XML数据类型可以用来创建列,用来创建存储过程或者存储函数中的参数,或用来创建变量。另外,用户可以关联一个XML类型的列和一个XML Schema集来创建一个新的类型化的XML列。集合中的XML Schema被用来验证和类型化XML实例。

 

类型化vs.非类型化的XML数据类型

XML数据类型与XML schema集相关联,为XML实例增加了Schema的强制性约束。如果XML数据被关联到一个XML Schema集合,它就被称为类型化的XML。否则,就叫做非类型化的XML。

 

SQL Server 2005中XML数据类型实现了ISO SQL-2003标准化XML数据类型。它不仅能够存储结构良好的XML1.0文档,也能存储根节点为文本的所谓的XML内容段落,也能存储包含任意数目根元素的内容。针对具有良好格式数据的检查已经完成,这些检查不必把XML数据类型绑定到XML Schemas。那些没有良好格式的数据不能被检查。

 

当Schema是不可知的时候,非类型化的XML就很有用。当Schema可知,但它的变化非常快以至于很难保持的时候,或者当存在多个Schema,最后的绑定取决于外部的需求时,非类型化的XML也很有用。另外,当XML Schema中包含数据库引擎不支持的XML Schema结构时,非类型化的XML也很有用。在这些情况下,你可以使用在公共语言运行时(CLR)用户自定义功能中的System.XML验证器来提供有效性验证。

 

如果在XML Schemas集中,你有XML Schemas来描述你的XML数据,你能够通过关联XML Schema集和XML列用来提供类型化的XML数据。XML Schema被用来验证数据的有效性;在编译查询或者数据编辑语句期间执行比非类型化XML更加精确的类型检查;或者被用来优化存储和查询的处理效率。

 

类型化的列,参数和变量能够存储XML文档(Document)或者内容段落(Content),在声明的时候,你可以通过开关指定你存储的类型(文档或者内容,默认的是内容)。另外,你必须同时提供一个XML Schema集。如果每个XML实例只有一个根元素,那么指定为文档类型,否则指定为内容类型。在静态类型推断期间,XQuery编译器使用文档(Document)标志信息来推断单个的根元素。

引用:

XML数据类型的方法

XML数据类型支持五种方法来操作XML实例。XML数据类型的方法描述如下:

query() 方法携带一个对若干个XML节点求值的XQuery表达式,允许用户查询一个XML文档中的段落。这个方法的返回值一个非类型化XML文件类型的值。

 

value() 方法是用来从一个XML文档数据值中提取关系型数值。这个方法携带一个用来识别单个XML节点的XQuery表达式并返回期望得到的SQL类型。XML节点的返回值被转换为指定的SQL类型。

 

exist()方法允许用户在XML文档中执行查询以确认一个XQuery表达式的结果是否为空。当XQuery表达式返回一个非空的结果时,这个方法的返回值为1;当表达式返回空时,方法返回值为0;当XML实例本身为NULL时,就返回NULL值。

 

使用XML数据类型的nodes()方法可以较容易的把一个XML文档分解为关系型数据。nodes()方法接受一个XQuery表达式,并返回一个行集(Rowset),行集中的每一行都描述一个由查询表达式所标识出来的上下文节点。XML数据类型的其他方法,如query(), value(),exist(),和 nodes(),都能调用nodes()方法返回的上下文节点。

modify()方法能用来对一个XML文档的内容进行修改。它支持XML DML语句,从而实现在一个XML实例中插入、更新或者删除一个或多个节点。当它遇到一个NULL值时,它会报错。

详细内容,查阅“微软SQLserver2005 XML最佳实践”白皮书。

XQuery入门

XQuery是一种用于XML查询的新语言,支持基于XPath2.0的数据浏览和采集。本章节为我们初步展示了XQuery语言各方面的内容,比如XQuery和XPath之间的关系,XQuery的优点,XQuery的应用领域,XQuery中XML Schema的规则等等。

 

XPath2.0简介

XPath1.0,是由W3C工作组定义,用于在单个XML文档中定位节点的语言。XPath1.0使用基于路径的规则来标识XML文档中的节点。同时它定义了XSLT 1.0和XPointer的核心规则。XPath 1.0有处理字符串、布尔值和浮点数的内置函数。它定义了根据设置的过滤标准来过滤节点的语法。XPath 1.0正在升级为XPath 2.0以支持更多的系统类型,提供更多的功能。XQuery 1.0基于对XPath 2.0,增加了排序、重装、构造功能,而且实现了XPath2.0未能实现的数据浏览和过滤方面的性能。

 

XQuery简介

XQuery是一个可以定义、类型化、函数化的语言,是XML查询组专为从XML格式中查询数据而设计的语言。XQuery具有与XML标准系列中XPath 2.0和XSLT 2.0一样的数据模型和XML Schema类型系统。设计XQuery用于处理非类型化XML文档(不包括关联数据的schema),类型化XML schema,或者两者的混合体。如同上文提到的,XQuery 1.0基本上是XPath2.0的扩展集。XQuery 1.0除了拥有XPath2.0的特点外,它还拥有下面的性能:

•        在FLWOR语句中增加了order by语句,它可以对文档数据进行重新排序。

•        在FLWOR语句中增加了let语句,它能够指定表达式的结果以实现更多的应用(SQL Server 2005中不支持)。

•        在查询语句的嵌缀部分,可以指定静态的上下文节点(比如命名空间的绑定前缀namespace prefix bindings)。

•        提供构造新节点的功能。

•        允许用户自定义函数(SQL Server 2005中不支持)。

•        能够创建modules/libraries(SQL Server 2005中不支持)。

XQuery的优点

•        当前的SQL和XPath知识是很容易学习的。

•        相比XSLT的查询语句,XQuery查询语句代码更简洁。

•        当XML数据是类型化的,那么XQuery是一个强类型语言,它能够通过避免非法的类型转换以及确认类型是否可以在查询操作中使用,来提高查询语句的执行效率。

•        XQuery能当作弱类型语言使用,为非类型化数据提供更强的功能。SQL Server 2005提供了同时支持强类型和弱类型两种关系的静态类型。

•        因为XQuery执行查询需要的代码比XSLT少,所以它的执行效率也高。

•        XQuery正在成为W3C工作组的推荐语言,同时它也将会被主流的数据库提供商所支持。

在本文中,关于在编写XQuery1.0语言时需要特别注意的地方:

•        XQuery规范是基于当前开发环境进行阐述,将来可能会发生变化。而SQL Server 2005是W3C工作草图所实现的稳定部分,不会发生变化。

 

XQuery的应用领域

一般,XQuery的应用领域分类如下:

•        查询和分析数据:XQuery在查询大容量数据时表现出色,而且能够过滤、分类、排序以及转换需要的信息。典型的XML文档查询的应用包括描述半结构化信息,定义name-value包,分析日志,处理日志以及监控应用的日志来查找潜在的应用错误和安全方面的问题等等。

•        XQuery的集成应用:当团队开始摒弃自己私有的集成应用方法,而开始采用标准的以集成应用为基础的方法时候,满足把单个应用中内部定义使用的数据转换为标准的可以格式化转换的数据的需求就成为头等重要的问题。因为XQuery能够构造并转换XML数据,所以XQuery就满足了这个需求。在集成应用领域,一个典型的XQuery应用是把本地使用的XML数据库/关系型数据资源的词汇表,翻译为另外一个应用者的本地XML数据库/关系型格式数据语言。

 

在服务器端使用XQuery的优点

对比起在客户端处理XML过程,在服务器端使用XQuery来处理XML过程要具备更多的优点。其中一些优点可以总结如下:

•        减少网络负载:在服务器端处理XML数据,只把结果传递到客户端,减少了网络负载。

•        更加安全:只有当使用客户端XML进程时才把客户端需要的数据传递到客户端,避免在网络上传输完整数据而带来的风险。

•        更易维护:在服务器段处理XML能使得浏览器独立于客户端代码,这能够更容易的维护客户端。

•        性能的改进:在服务器端使用XQuery写的查询语句可以使用SQL查询器进行优化。这样优化处理的性能要高于在客户端重新获得数据并进行数据过滤。此外,还可以通过为XML数据类型的列创建索引来得到更强大的性能。

 

当使用XML Schemas时如何执行XQuery

关联一个XML数据类型的XML schema集能被以下的关系引擎使用:

•        在插入操作中来实例化XML。

•        在修改操作中来实例化XML。

•        在进行最早的静态类型错误检查和改进查询性能时,XML schema中的类型信息被用来确定最佳的查询计划和避免很多运行时的检错。

•        XML schema中描述的类型信息被SQL Server用来优化存储。

引用:

XQuery表达式的结构

SQL Server 2005中的一个XQuery表达式包括两个部分—前缀(prolog)和主体(body)。前缀能逐个声明包含的命名空间。命名空间的声明可以通过映射前缀和命名空间的URI,使你能够用前缀来替代查询体中的命名空间的URI。通过默认声明命名空间(declare default namespace)的声明,你不用绑定元素名称的默认命名空间就可以引用元素的名称。

 

XQuery表达式的主体包含了定义查询结果的查询表达式。比如,它可以是一个FLWOR表达式(参见本文章节的“FLWOR语句”),一个XPath 2.0 表达式(参见本文章节的“XPath 2.0表达式”),或者另外一个XQuery表达式比如一个构造或算术表达式。

 

实例:在XQuery头中声明默认的命名空间

下面是从所有职员中查找一个JobCandidateID等于3的应聘者。查询中只定义了一个默认命名空间,而没有使用任何一个命名空间前缀。

SELECT Resume.query('

        declare default namespace  "";

        /Resume/Employment

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

实例:使用“WITH XMLNAMESPACES”语句声明命名空间

SQL Server同样支持 SQL-2003的标准扩展,允许用户在SQL的每一个SQL查询要素上绑定XML命名空间,这样就可以避免重复声明同样的XML数据类型的方法。下面的查询显示了前面查询实例修改后的版本。这个查询使用WITH XMLNAMESPACES 语句声明了一个命名空间。

WITH XMLNAMESPACES( '' AS  "RES")

SELECT Resume.query('

        /RES:Resume/RES:Employment

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

XPath 2.0表达式

XQuery使用XPath2.0表达式查找一个文档中的节点,在一个文档中移动节点或者在文档间移动节点位置。定义移动路径的XPath是一个彼此分离的步骤组成的有序队列。每一个步骤包含一个axis,一个node test和多个步骤判断。

 

Axis说明了移动的方向,和上下文节点的关系。SQL Server2005中支持的axes是child, descendant, parent, attribute, self 以及descendant-or-self。

 

一个node test说明了步骤选择的这些节点所必需满足的条件。节点的条件可以基于节点名称或者节点类型来说明。

 

步骤判断可以用动作(predicates)或者重新引用(dereference)。一个动作就充当一个在相等框架下定义的一个节点队列中的节点过滤器;一个重新引用反映出一个节点队列中各节点的属性以及元素是否与参照节点的一致。作为重新引用的输入,该节点队列必须包含IDREF或者IDREFS类型的元素或者属性。重新引用可以产生一个新队列,其各节点ID类型的属性值都匹配取自输入队列中元素和属性的IDREF值。

 

XPath表达式的步骤是可以关联求值的。每个步骤执行时都为下一步设置了赋值的上下文项。Path表达式中的一个上下文项就是一个节点,它被选择作为XPath表达式中每个步骤执行的返回值。根据前一步所获得的上下文节点能够关联求得当前的步骤。XPath表达式执行完所有步骤的返回结果就将是一个根据path表达式排列的文档中节点的有序队列。

 

下面的表达式用AdventureWorks数据库中的表[HumanResources].[JobCandidate]来举例说明了path表达式的概念。下面的path表达式选择了address类型节点中值为Home的节点。

//child::ns:Addr.Type[.="Home"]/parent::node()

Path表达式:

•        child 是axis的定义。

•        :: 是 axis 的分隔符。

•        ns 是命名空间前缀。

•        Addr.Type 是 node test。

•        [.=”Home”] 是一个指向上下文节点的动词表达式。

XQuery同样支持缩写语法来说明axis。下面的表格列举了axis以及相应的缩写语法。

表 2  axes缩写语法

图片 27

 

 

示例:从历史职业中选择工作单位的名称

下面所示的XPath表达式选择了Emp.OrgName文本类型的,同时也是Resume/Employment子节点的节点。在这里,text()用来选择Emp.OrgName元素文本类型的子节点:

/Resume/Employment/Emp.OrgName/text()

引用:

FLWOR语句

FLWOR语句组成了XQuery表达式的主体,它与SQL的SELECT语句很相似。FLWOR(发音同“flower”)是FOR, LET, WHERE, ORDER BY, RETURN的缩写。XQuery的FLWOR表达式可以进行重复声明、变量绑定、过滤、排序以及返回结果的操作。SQL Server 2005中支持FOR, WHERE, ORDER BY和 RETURN:

For

FLWOR表达式中的for语句支持用户定义一个变量来遍历某个输入序列。该输入序列可以使用XPath表达式、原子值序列、分隔符序列或结构化函数。因此,这里的for语句与SQL SELECT FROM语句类似,但与编程语言中的“for”语句不同。

 

绑定变量同样可以使用for语句声明。

 

示例:使用for语句从简历中检索所有的家庭地址

下面的查询得出了JobCandidateID等于3的应聘者的address节点值等于Home的元素。

SELECT Resume.query('

        declare namespace RES="";

        for $A in /RES:Resume/RES:Address/RES:Addr.Type[.="Home"]/..

        return 

        $A 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

Where 

FLWOR表达式中使用Where语句可以筛选一个迭代的结果。

 

示例:使用where语句选择所有的家庭地址

下面的查询得出了JobCandidateID等于3的应聘者的address节点值等于Home的元素。

SELECT Resume.query('

        declare namespace RES="";

        for $A in /RES:Resume/RES:Address

        where $A/RES:Addr.Type[.="Home"]

        return 

        $A 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

order by

Order by关键字可以对返回结果集进行排序。Order by关键字可以使用一个排序表达式,这个表达式必须返回一个原子值。一般,你可以进行升序或者降序排列。默认的排序顺序是升序。

 

示例:使用order by语句对查询出来的历史职业进行升序排序

下面的查询对JobCandidateID等于3的应聘者所从事过的职业根据其工作时间进行了升序排序。

SELECT Resume.query('

        declare namespace RES="";

        for $EMP in /RES:Resume/RES:Employment

        order by $EMP/RES:Emp.StartDate

        return 

        $EMP 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

return

Return语句,和SQL中的SELECT语句类似,能够指定查询的结果。你可以在return语句中使用任何一个有效的XQuery表达式。你同样也可以通过在return部分中说明元素的构造、属性等来构造XML结构。

 

示例:使用return语句选择历史职业

下面的查询得出了JobCandidateID等于3的应聘者所从事过的所有职业的开始日期,结束日期,工作单位名称,工作职位。

SELECT Resume.query('

        declare namespace RES="";

        for $EMP in /RES:Resume/RES:Employment

        order by $EMP/RES:Emp.StartDate

        return

          <Employment>

                { $EMP/RES:Emp.StartDate }

                { $EMP/RES:Emp.EndDate }

                { $EMP/RES:Emp.OrgName }

                { $EMP/RES:Emp.JobTitle }

          </Employment>

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

目前在SQL Server 2005中,XQuery还不支持let语句。这方面更多内容可参见本文章节“不支持的特性和工作中的解决方案”。

 

FLWOR表达式vs. XPath表达式

当计划进行的查询在for变量和for语句体之间包含一个JOIN操作时,序列可以用XPath表达式表达,但会导致执行效率低,这个时候应该使用FLWOR语句来定义该序列。只有当下面列举条件中的一个或者多个得到满足时,才适合使用FLWOR表达式。

•        如果想对一个作为某表达式返回结果的序列值进行迭代,你可以通过在for语句中绑定一个继承结果集值的变量来实现。实例都是由在for语句范围内并且保持复制的新元素构成。

•        当你要对for语句的结果序列进行过滤,而过滤是基于一个谓词且该谓词还无法使用简单的XPath表达式进行说明时,使用where语句就能够实现对结果集的过滤。示例如下:

DECLARE @result xml

SET @result = '<Result />'

SELECT @Result.query('

for $i in (1, 2, 3), $j in (3, 4, 5)

where $i < $j

return sum($i + $j)

') as Result

•        如果你想基于一个简短表达式对结果集进行排序,那么可以使用order by语句实现。

•        当你要使用for语句的返回结果来定义返回结果集的类型时,使用return语句可以实现。

在所有其他案例中,推荐使用XPath表达式。

 

XQuery的操作

作为一种功能性语言,在SQL Server2005中支持XQuery的多种数据类型的函数和操作,可分类如下:

•        数学运算

•        比较运算

•        逻辑运算 

表 3 SQL Server2005支持的运算符

图片 28

 

 

数学运算符

SQL Server 2005支持五个数学运算符,分别是+、b、*、div和 mod。目前,还不支持idiv。

 

示例:转换表store中选定的信息的值

本示例中,假定数据库AdventureWorks中有表[Sales].[Store],下面的查询以日圆形式返回CustomerID等于3的仓库的年销售额和年收入,以平方米形式返回仓库的存储面积。

SELECT Demographics.query('

        declare namespace ST="";

        for $S in /ST:StoreSurvey

        return

          <StoreDetails

             SalesInYen ="{ $S/ST:AnnualSales*106.8100  }"

             RevenueInYen = "{ $S/ST:AnnualRevenue*106.8100  }"

             StoreAreaInSqMeters = "{ $S/ST:SquareFeet*0.0929  }">

          </StoreDetails>

') as Result

FROM [Sales].[Store]

WHERE CustomerID = 3

 

比较运算符

SQL Server 2005支持四种比较操作符—普通比较运算符、数值比较运算符、节点比较运算符和节点顺序比较运算符。

 

普通比较运算符

普通比较运算符可以进行原子值、序列或者两者的比较。普通比较运算符是=、 !=、<、>、<=和>=。普通比较必须是可以量化的,意思就是说任何比较的结果都是现实存在的。

 

示例:选择address类型节点值不等于Home的元素

下面的查询得出了JobCandidateID等于3的应聘者的所有address类型节点值不等于Home的元素:

SELECT Resume.query('

        declare namespace RES="";

        for $A in /RES:Resume/RES:Address

        where $A/RES:Addr.Type[.!="Home"]

        return 

        $A 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

数值比较运算符

数值比较运算符可以进行原子值的比较。SQL Server 2005种支持的数值运算符是eq、ne、lt、gt、le和ge。目前XQuery还未能与其2004年7月份的设计书所设计的一样实现对非类型化的原子值的比较。在XQuery说明书中,非类型化原子值是被定义为能替代字符串类型的新类型。这么设计是因为我们考虑到,实现普通比较运算符和数值比较运算符结合,要比仅仅能够比较数值要重要的多。

 

示例:选择GPA超过3.5的教育背景

下面的查询得出了JobCandidateID等于2的应聘者的所有GPA超过3.5的教育背景。

SELECT Resume.query('

        declare namespace RES="";

        for $ED in /RES:Resume/RES:Education

        where xs:decimal($ED/RES:Edu.GPA) gt 3.5 

        return 

        $ED 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 2

 

节点比较运算符

你可以使用节点比较运算符来确定2个节点是否代表同一类节点。节点比较运算符是二元操作符,每个操作元都是node类型。

 

示例:比较确定两个address节点的类型

下面查询比较了2个address节点,确定它们在XML文档中是否代表同一类节点。

SELECT Resume.query('

        declare namespace RES="";

        if ( (/RES:Resume/RES:Address)[1] is (//RES:Address)[1] )

        then

                <Result>Nodes are equal</Result> 

        else

                <Result>Nodes are not equal</Result> 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

引用:

节点顺序比较运算符

你可以使用节点顺序比较运算符来确定一个XML文档中两个节点的顺序。SQL Server 2005中支持的节点顺序比较运算符是>>和<<,两者都是二元操作符。>>操作符当左边操作元在XML文档中位于右边操作元的前面时,返回true;<<操作符当左边操作元在文档中位于右边操作元的后面时,返回true。

示例:比较两个address节点的顺序

下面的查询比较了JobCandidateID等于3的应聘者的两个address节点的顺序。

SELECT Resume.query('

        declare namespace RES="";

        if ( (/RES:Resume/RES:Address/RES:Addr.Type[.="Home"])[1] << (/RES:Resume/RES:Address/RES:Addr.Type[.="Permanent"])[1] )

        then

                <Result>Home address precedes Permanent address</Result> 

        else

                <Result>Home address follows Permanent address</Result> 

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

 

逻辑操作符

SQL Server 2005中支持的XQuery逻辑操作符是and和or。使用任何由这两个操作符组成的逻辑表达式的返回值都是true或者false。

 

示例:使用and操作符来创建一个逻辑表达式

下面的query返回了所有已经获得工商专业学士学位的应聘者。

SELECT Resume.query('

        declare namespace RES="";

        /RES:Resume/RES:Education[RES:Edu.Level="Bachelor" and RES:Edu.Major="Business"]

') as Result

FROM [HumanResources].[JobCandidate]

WHERE JobCandidateID = 3

上一篇:没有了
下一篇:没有了
友情链接: 网站地图
Copyright © 2015-2019 http://www.zen-40.com. mgm美高梅有限公司 版权所有