首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 图书频道 > 计算机与网络 > 程序设计 >

XML数据管理:概念与技术

2010-02-24 
基本信息·出版社:清华大学出版社 ·页码:312 页 ·出版日期:2009年10月 ·ISBN:730220957X/9787302209577 ·条形码:9787302209577 ·版本:第1版 · ...
商家名称 信用等级 购买信息 订购本书
XML数据管理:概念与技术 去商家看看
XML数据管理:概念与技术 去商家看看

 XML数据管理:概念与技术


基本信息·出版社:清华大学出版社
·页码:312 页
·出版日期:2009年10月
·ISBN:730220957X/9787302209577
·条形码:9787302209577
·版本:第1版
·装帧:平装
·开本:16
·正文语种:中文
·丛书名:中国计算机学会学术著作丛书

内容简介 《XML数据管理:概念与技术》从数据库系统实现的角度,依据作者多年的研究成果全面系统地介绍了Native XML数据库系统相关技术。内容涵盖了XML数据库存储管理技术(包括存储、编码、索引等方法);XML查询处理与优化技术(包括XML查询代数、结构查询处理、整体查询处理、近似查询处理、查询优化等),以及XML数据管理新技术(包括XML/Update处理、访问控制、关键字查询等);最后介绍典型XML数据库系统和基准测试。
《XML数据管理:概念与技术》主要面向高年级本科生、研究生和研究工作者,它对学习者是很好的教材,对专业人士是很好的参考资料。
媒体推荐 本书介绍采用纯XML数据库管理系统的优点及系统实现的相关算法、技术和实践经验,目的明确,言之有物,反映了作者多年来的理论研究和系统实现的深厚基础。作者及其研究团队并不仅仅满足于研究,还设计和开发了一个纯XML数据库管理系统orientX,连续八年推出了六个后续版本,在国内外均产生了很好的影响,这是一个很优秀的成果。
  ——周龙骧研究员(中国科学院数学所)
孟小峰教授是国内较早从事XML数据管理技术的专家,对该领域具有深入的了解,他编著的这本《XML数据管理:概念与技术》从存储管理、查询处理、关键字检索、访问控制等多个角度,对XML数据管理的关键技术进行了全面的论述,是我看到的第一本系统反映XML数据管理领域最新技术发展的书籍。
  ——施伯乐教授(复旦大学)
作者从2000年始,在已故香港科技大学陆宏钧教授的指导下,开展了纯XML数据管理的研究,取得一系列高水平研究成果,并在国内率先开发了具有自主知识产权的XML数据库原型系统orientX本书基于作者多年在XML数据管理系统方面的研究积累,从数据库系统实现的角度,全面系统地介绍了纯XML数据库系统相关技术。
  ——周立柱教授(清华大学)
本书全面系统地介绍了XML数据管理技术的理论、技术和方法,反映了XML数据管理研究领域的新成果,为从事XML数据管理技术研究和XML数据管理系统开发的科技工作者提供了一部良好参考书。本书还提供了翔实的参考文献和文献导读信息,并附有大量习题,使得本书不但可以供科技工作者使用,也可以作为大专院校的教材。
  ——李建中教授(哈尔滨工业大学)
本书是作者对多年来在纯XML数据库管理系统方面的研究和开发经验的总结,全面系统地介绍了纯XML数据库系统的基本理论和实现技术。本书在内容和形式上做了很多新的探索,概念定义准确严谨、分析总结恰当,内容的组织结构循序渐进、编排合理,易于读者对XML数据管理枝术的学习与理解。……总之,本书是一本具有很高理论水平和实用价值的学术专著,……对于推动我国XML技术的研究和开发以及高层次XML人才的培养具有重要的意义。
  ——于戈教授(东北大学)
编辑推荐 《XML数据管理:概念与技术》:中国计算机学会学术著作丛书
目录
第1章 绪论
1.1 引言
1.2 什么是XML
1.3 XML数据
1.3.1 半结构化数据
1.3.2 XML数据的特点
1.4 XML数据库
1.5 XML数据库查询语言
1.6 XML数据库系统
1.6.1 体系结构
1.6.2 功能模块
1.7 XML数据库系统实现技术
1.7.1 存储方法
1.7.2 编码方法
1.7.3 索引技术
1.7.4 查询代数
1.7.5 查询处理
1.7.6 查询优化
1.7.7 XML数据更新
1.7.8 访问控制
1.7.9 基准测试
1.8 XML数据库技术发展
1.8.1 XML近似查询处理
1.8.2 XML关键字查询
1.8.3 XML异构数据集成
1.8.4 分布XML处理
1.8.5 图数据
1.9 总结
习题
参考文献

第2章 XML基础知识
2.1 引言
2.2 DTD
2.3 Schema
2.4 XPath查询语言
2.4.1 XPath简介
2.4.2 XPath轴
2.5 XQuery查询语言
2.5.1 XQuery简介
2.5.2 XQuery表达式
2.5.3 XQuery语法
2.6 XQuery/Update
2.7 SAX和DOM
2.7.1 SAX
2.7.2 DOM
2.8 总结
习题
参考文献

第3章 XML数据存储
3.1 引言
3.2 存储方法分类
3.2.1 存储粒度
3.2.2 存储顺序
3.3 多粒度存储方法
3.4 支持更新的存储方法
3.4.1 子树存储
3.4.2 支持更新的索引
3.4.3 存储的更新算法
3.5 总结
习题
参考文献

第4章 XML编码
4.1 引言
4.2 区域编码
4.2.1 基本的区域编码
4.2.2 扩展的区域编码
4.3 前缀编码
4.3.1 基本的前缀编码
4.3.2 扩展的前缀编码
4.4 是分树编码
4.4.1 基本的k分树编码
4.4.2 扩展的k分树编码
4.5 基于空间预留的编码更新
4.5.1 预留策略
4.5.2 编码空间预留
4.5.3 编码更新
4.6 支持动态更新的编码方法
4.6.1 浮点数编码
4.6.2 OrdPath编码
4.6.3 素数编码
4.6.4 位字符串编码
4.6.5 向量编码
4.7 总结
习题
参考文献

第5章 XML数据索引
5.1 引言
5.2 经典路径索引
5.2.1 DataGui
5.2.2 1-Index
5.2.3 A(k)-Index
5.2.4 D(k)-Index
5.2.5 M(k)-Index
5.3 基于模式的路径索引
5.3.1 索引结构
5.3.2 基于SUPEX索引的查询处理算法
5.4 扁平结构路径索引
5.4.1 索引结构
5.4.2 基于F-Index的过滤算法
5.5 基于序列的索引
5.5.1 索引结构
5.5.2 基于序列化索引的匹配算法
5.6 总结
习题
参考文献

第6章 XML查询代数
6.1 引言
6.2 XML代数基本思想
6.2.1 记录和操作对象
6.2.2 基本代数操作符
6.3 XML查询代数OrientXA
6.3.1 基本概念
6.3.2 代数操作符
6.3.3 查询处理的优化
6.4 XQuery/Update的代数处理
6.5 总结
习题
参考文献

第7章 XML查询处理——基本处理方法
7.1 引言
7.2 XML查询处理概述
7.2 一基本概念
7.2.2 查询处理方法分类
7.3 二元结构连接
7.3.1 MPMGJN连接算法
7.3.2 Stack一Tree连接算法
7.4 目标结点为导向的XML路径查询处理
7.4.1 基本概念
7.4.2 路径查询的分解计算
7.5 基于区域划分的XML结构连接
7.5.1 基本概念
7.5.2 基于区域划分的结构连接算法
7.6 总结
习题
参考文献

第8章 XML查询处理——整体匹配
8.1 引言
8.2 基本整体匹配算法——TwigStack
8.2.1 整体匹配的基本思想
8.2.2 TwigStack算法
8.3 基于扩展解决方案的整体匹配算法
8.3.1 问题的提出
8.3.2 扩展解决方案
8.3.3 改进的整体匹配策略
8.4 复杂Twig查询匹配
8.4.1 问题的提出
8.4.2 元素的缓存
8.4.3 基于层次缓冲区的整体连接算法
8.5 总结
习题
参考文献

第9章 XML查询优化
9.1 引言
9.2 XML查询优化的主要问题
9.3 查询树简化
9.3.1 基本概念
9.3.2 冗余结点判断规则
……
第10章 XML数据更新处理
第11章 XML近似查询处理
第12章 XML关键字查询
第13章 XML访问控制
第14章 XML数据库管理系统
参考文献汇总
词汇索引
后记
……
序言 进入新世纪以来,数据库技术面临一场变革,即在原有关系数据库技术成熟之后,新的数据库技术在哪里?一个重要的趋势是具有灵活的半结构化特性的XML数据的出现。XML作为一种数据存储和交换格式,在互联网络环境中扮演着极其重要的角色,它已经成为数据交换事实上的标准,在电子商务、电子政务、金融、出版、科学数据与各种资源的数字化等方面得到越来越广泛和深入的应用。可以想象,在不久的将来,XML数据的规模将可能达到或者超过各种关系数据库中的数据规模,从而成为继关系数据之后新的主流数据形式。
如何有效管理XML数据自然成为寻找突破口的数据库界的热点研究问题。但在2000年研究之初,学界和工业界在技术选择上有过一些争论。主流工作认为应当以现有关系数据库为基础,试图建立XML数据与关系数据的映射关系,从而可以利用已有的关系数据库系统管理XML数据。这显然是受数据库技术历史沿革的影响。因为历史上人们要替代关系数据库系统的多次努力均告失败,尤以演绎数据库、面向对象数据库为代表。最终的结果是被关系数据库所“同化”。但代价是关系数据库这架马车负重累累,越跑越慢了。
显然,上述方法沿用了这一惯性思维,但其致命弱点是不言而喻的,即在将XML一数据映射为关系数据的同时,XML数据中某些属性值的缺失和重复。
文摘 插图:


第1章 绪论
1.1 引言
随着信息技术的迅猛发展,人们可以通过互联网从世界各地接收和发送信息,而信息交换过程中的一个突出问题就是数据格式的异构性、,这将极大地阻碍对信息进行有效的使用。XML的出现正是针对这一问题而提出的解决方案。随着计算机和网络技术的不断发展,XML技术的应用也将不断扩展。该技术不仅可以用于银行之间进行数据交换、证券公司对其上市公司相关的数据进行统计、图书馆对其馆藏书目进行查询检索、企事业单位对其文件档案进行管理,还可用于电子商务、搜索引擎软件、自动智能翻译、文档发声软件等领域。XML技术在当前的互联网络和IT环境中扮演着越来越重要的角色,它事实上已经成为数据交换的标准、SOA架构的基石。Gartner预测,XML文件的使用率在2007年达到40%,在2008年将占据支配地位。IDC(国际数据公司)最近发布的一份报告显示,在500家受访企业的IT部门中,有29%的企业宣称正在大量使用XML存储库和数据库。XML的广泛应用使得高效的XML数据管理成为一种迫切的需求。
后记 XML数据以其灵活的半结构特征成为继关系数据之后政府、企业等各部门广泛采用的新的数据形式,自然也成为数据管理的研究热点。2000年初,普遍的做法是采用现有的关系数据库来管理XML数据,实践表明其效果和效率均不理想。我们认为XML数据管理应该从XML数据的本质特征出发,去探求高效支持其树形特征的方法,即纯XML数据管理方法。
早在2000年我们即开展了这一研究工作,并以构建纯XML数据库系统为目标,系统深入地研究了XML数据的存储、索引、编码、查询处理、查询优化、数据更新、访问控制、关键字查询以及近似查询等。2002年率先在国内开发完成了纯XML数据库系统Orientx,之后历经8年,先后共发布6个版本。Orientx被w3C收录XQuery实现列表,并被50多个国家超过20万用户访问,有超过1万用户下载使用,成为本领域的一项代表性成果。9年下来,有此收获,颇感欣慰。因为我们看到自己的研究不止停留在纸面上,而是有系统可以真正立起来。计算机界研究的成果要有“壳”有“仁”,想必这就是李德毅院士最近提到的学者“坚果仁”。
抚今追昔,饮水思源!是数据库界前辈萨师煊教授、我的导师王珊教授带我进入这一研究领域,并有机会参与我国第一个大型国产数据库系统COBASE(国家“八五”、“九五”科技攻关计划,1991-1998)、基于曙光并行机的并行数据库系统PBase(国家“863”计划,1996-1998)、中文自然语言查询系统N(:hiql(国家自然基金重点项目,1996-2000)、嵌入式移动数据库系统“小金灵”等系统的开发,以上经历使我对数据库系统的内核技术有了系统深入的了解,从而奠定了扎实的基础。
2000年之后我将研究目标定位在创新数据管理的研究上,针对数据库技术与Web计算和移动计算交叉结合所产生的挑战性问题开展研究,包括Web数据管理、XML数据管理和移动数据管理,并创立网络与移动数据管理实验室(WAMDM)。依托“中国计算机学会学术著作丛书”出版了《移动数据管理:概念与技术》,本书《XML数据管理:概念与技术》是其姊妹篇,目前正着手总结出版《web数据管理:概念与技术》,算是对我们近十年研究工作的一个总结,也希望对广大同行有所裨益。
多年来,周龙骧教授、罗晓沛教授、施伯乐教授、何新贵院士、唐世渭教授、马应章教授、唐常杰教授、周立柱教授、杨冬青教授、李建中教授、李天柱教授、陆宏钧教授等一直是我科研生涯中的良师,是他们的关怀与鼓励、理解与支持,才使我一步步迈人科学研究的殿堂,在此表示崇高的敬意和谢意!
热点排行