分享

网格体系结构与语义网格体系结构初探

 funson 2007-03-28

网格体系结构与语义网格体系结构初探

摘要

网格作为人们的一种理想,从计算机产生以来人们一直追求着。随着各种科学计算的需求,网格的呼声越来越高。网格计算从数据网格发展到信息网格,并对知识网格的认识越来越明确。网格的迷人之处,除了它有着跟电力网格同样特质的应用前景之外,更多的是在于它的许多不确定性,以及技术与理论上的争议。本文通过对网格的发展演化过程的研读,几种常见的网格体系结构,着重对OGSA和语义网格进行了阐述。

关键字 网格计算 沙漏模型 OGSA  语义网格

 

The Elementary Research of Grid Architecture and The Semantic Grid Architecture

 

Abstract:

       As our dream, we pursue for its attractiveness since the computer was invented. Along with the increasing requirements of all kinds of scientific computing, grid’s development becomes more and more important. Meanwhile, Grid computing evolves from data grid to information

Grid, and scientists and engineers get to know Knowledge grid. The charm of Grid, except for the future application like electronic grid, lies more on the uncertainty, discusses over technology and theory. This article tries to describe the general grid architectures, and pays more attention to OGSA and the Semantic Grid.

 

KeywordsGrid computing  the hourglass model OGSA the semantic grid

 

1引言

 

网格技术起源于20世纪90年代初又美国政府资助的分布式超级计算(Distributed Supercomputing)项目I-WAY.1993年开始,高性能计算技术和互连网技术进一步融合,酝酿产生了继因特网、Web之后的第三大技术浪潮。[1]

网格,过去,总把它想得像电力网一样,插上插头就能源源不断地获得计算能力。现在,网格早已远远超出了计算的范畴。除了计算网格外,数据网格、仪器网格、虚拟现实网格、服务网格、信息网格、知识网格等,将网格应用扩展到方方面面。在1994年秋季举办的COMDEX大会上,比尔·盖茨曾经预言,2005年将实现信息随手可得的目标[2]。事实证实了比尔·盖茨的预言。而网格的应用该怎么进行,以及如何进入这个新兴且积聚潜力的领域,特别是语义网格,正是本文的重点。

在第2部分,文中讲述网格的基本概念,并对当前处于热点的语义网格详细介绍。第3部分,讲述几种目前常见的网格体系结构。第4部分则讲述对现在和将来网格研究与应用都有重要影响的五层沙漏模型。第5部分,文中从设计原则、基本思想以及语义网格几个方面着重介绍网格体系结构。第6部分,总结全文。

 

2 网格

 

2.1 网格定义

网格计算研究的先导Ian Foster给网格下的定义是:网格计算是动态多机构虚拟组织中的一个协调的共享资源和解决问题的过程[3]。中科院计算所网格研究组给计算网格下的定义是:计算网格是一种分布式计算基础设施(Infrastructure),用来实现在动态的、跨组织域的虚拟组织(VO)内实现协同的资源共享和问题求解[4]。关于网格计算与计算网格两个完全不同的概念,各自的定义在本质上都投影到VO,资源共享,协同性和异构性四个方面。

2.2 网格特征

计算网格的特征为一个异构性、动态性的环境,有跨多管理域的多样的和动态的资源共享关系,满足要求的QoS,与传统的分布式和并行系统的区别:松散耦合、异构和动态的环境,跨多个管理域[4]

2.3 语义网格

这里提到语义网格,是因为语义网格是当前研究的一个热点,同时本人对这方面很感兴趣。首先要区分一下语义网(semantic web)与语义网格(semantic grid).

语义web,是当前web的一种扩展,其中信息有很好的语义定义,人与电脑能更好的合作。[5]基本思想一是想完成这样的梦想:实现web内容的自动化处理,这样在分布式环境下,人和电脑也可以共享、处理web数据[6]。简单地说,语义web,是一种智能网络,它不但能够理解人类的语言,还可以使人与电脑的交流跟人与人之间的交流一样轻松。语义网能使机器理解含语义的文档和数据。也就是说,语义web不但可以理解词语与概念,而且还可以理解它们之间的逻辑关系。

将语义Web应用于网格环境,就形成了语义网格。语义网格小组对语义网格进行了定义:语义网格就是对当前网格的一个扩展,其中对信息和服务进行了很好的定义,可以更好地让计算机和人们协同工作。实际上,语义网格通常都被看作是这样一种结果:将网格和语义Web技术组合在一起,以便提高集成和数据计算的能力。语义网格实际上有两种用途:用来发现处理数据的可用资源和对数据进行集成[7]

可见,语义web与语义网格,重要的区别是,它们各自的应用环境。语义网格:未来电子科学的基础设施一文指出:电子科学提供极有希望的前景,电脑与通信技术可以支持和增强科学研究过程。通过它科学家们以一种更有效的方式产生、分析、共享和讨论他们的见识、实验以及结果。潜在的提供这些设施的计算机基础设施也就是当前提到的网格。[8]

 

3常见的几种网格体系结构

 

1998年以来,国内外对网格体系结构进行了深入的研究,取得了一些成果[1]。一般认为,网格体系结构是关于如何建造网格的技术,包括对网格基本组成部分和各部分功能的定义及描述、网格各部分相互关系与集成方法的规定、网格有效运行机制的刻画。

常见的网格体系结构有4种:抽象层次结构、积木块结构、概念空间结构和混合模式结构。

3.1 抽象层次结构

在抽象层次结构中,最具代表性的是Ian Foster等人在1998年提出的五层沙漏结构模型。该结构是以协议为中心的,强调协议在网格资源共享和互操作中的地位。

3.2 积木块结构

积木块结构实际上是一种组件结构,它强调的是计算网格中不现的功能相对独立,又相互联系的关系。在积木式网格系统中,整个系统的各个部件采用积木式模块方式构建,具有很强的伸缩性,这也是作为模块结构的共同特点。

3.3 概念空间结构

计算网格存在着一系列的概念,如元数据、目录、资源、协议、实体和对象等,这些概念构成 了计算 网格的概念空间,根据这些概念之间的关系 形成 的网格体系结构,称为空间结构。与上面两种体系结构相比,概念空间体系结构的层次特征不够清晰,它强调的是各部分在概念上的关联。代理技术和面向对象技术是实现概念关联的主要方法。

3.4 混合模式结构

模式结构就是以上各种结构的有机组合。开放网格服务结构(OGSA)是种具有代表性的结构。这是在以IBM为代表的工业界的影响下,基于五层沙漏模型,在考虑到Web技术的发展与影响后,结合Web Services而提出的,是目前广泛结合和支持的一种混合体系结构。

 

4 五层沙漏模型

 

五层沙漏结构的主要特点是结构简单、层次清楚。它提供一些核心服务为基础用来构建高层的、特定领域的应用服务。

五层沙漏体系结构是以协议为中心的协议结构,自下而上分别为:构造层、连接层、资源层、汇集层和应用层。上层协议可调用下层协议的服务。网格内的全局应用都通过协议提供的服务来调用操作系统。该体系结构的各层功能定义如下:

第一层为构造层(Fabric):该层组件实现了基于底层特定资源的高层共享操作。它的功能是向上提供网格中可供共享的资源,它们是物理或逻辑实体,常用的资源包括处理能力、存储系统、目录、网格资源、分布式文件系统、分布式计算机池、计算机集群等。Toolkit中相应组件负责监测可用的软硬件资源的特性、当前负荷、状态等信息,并将其打包供上层协议调用。

第二层为连接层(Connectivity):该层定义了网格中网络处理的核心通信与认证协议。通信协议使构造层资源间的数据交换成为可能。认证协议基于通信服务提供了确认用户和资源身份的安全机制。在Toolkit中,相应组件采用基于公钥的网格安全基础协议(GSI)。在此协议中提供一次登录、委托授权、局域安全方案整合、基于用户的信任关系等功能。资源间的数据交换通过传输、路由及名字解析实现。

第三层为资源层(Resource):该层建立在连接层的通信和认证协议之上,定义了一些关于安全协商、使用共享功能计费、监控等方面的协议。它的作用是对单个资源实施控制,与可用资源进行安全握手、对资源做初始化、监测资源运行状况、统计与付费等有关的资源使用数据。在Toolkit中有一系列组件用来实现资源注册、资源分配和资源监视。

第四层为汇聚层(Collective):这层的作用是将资源层提交的受控资源汇聚在一起,供虚拟组织的应用程序共享、调用。为了对来自应用的共享进行管理和控制,汇聚层提供目录服务、资源分配、日程安排、资源代理、资源监测诊断、网格启动、负荷控制、账户管理等多种功能。

第五层为应用层(Applications):这层是网格用户的应用程序。应用程序通过各层的API调用相应的服务,再通过服务调用网格上的资源来完成任务。应用程序的开发涉及大量库函数,为便于网格应用程序的开发,需要构建支持网格计算的库函数。

                                   如图4.1 五层沙漏结构与internet协议的对比

随着网格计算研究的深入,人们越来越发现网格体系结构的重要。网格体系结构是关于如何建造网格的技术,包括对网格基本组成部分和各部分功能的定义和描述,网格各部分相互关系与集成方法的规定,网格有效运行机制的刻画。显然,网格体系结构是网格的骨架和灵魂,是网格最核心的技术,只有建立合理的网格体系结构,才能够设计和建造好网格,才能够使网格有效地发挥作用。

 

5 OGSA详解

 

5.1 设计原则与思想

OGSA最突出的思想就是以“服务”为中心。在OGSA框架中,将一切都抽象为服务,包括计算机、程序、数据、仪器设备等。这种观念,有利于通过统一的标准接口来管理和使用网格。Web Service[9]提供了一种基于服务的框架结构,但是,Web Service 面对的一般都是永久服务,而在网格应用环境中,大量的是临时性的短暂服务,比如一个计算任务的执行等。考虑到网格环境的具体特点,OGSA 在原来Web Service 服务概念的基础上,提出了“网格服务(Grid Service)”的概念,用于解决服务发现、动态服务创建、服务生命周期管理等与临时服务有关的问题。基于网格服务的概念,OGSA 将整个网格看作是“网格服务”的集合,但是这个集合不是一成不变的,是可以扩展的,这反映了网格的动态特性。网格服务通过定义接口来完成不同的功能,服务数据是关于网格服务实例的信息,因此网格服务可以简单地表示为“网格服务=接口/行为+服务数据”[1]。图5.1是对网格服务的简单描述。在目前OGSA的定义中,只有GridService接口是必需的,而其它的接口比如Notification SourceNotification SinkRegistryHandleMap等都是可选的。

                                  5.1 OGSA的网格服务示意图

    在目前,网格服务提供的接口还比较有限,如表格5.1所示,OGSA 还在不断的完善过程之中,下一步将考虑扩充管理、安全等等方面的内容。

   

OGSA 中,可以基于简单的基本的服务,形成更复杂、更高级、更抽象的服务。比如一个复杂的计算问题所需要的服务,包括网络、存储、数据查询、计算资源等各方面的服务,可以将这些基本的服务组织起来,形成一个高级的抽象服务,方便地为应用提供支持。图5.2是网格服务组成关系的示意图。一个高级的抽象服务可以由ABC 三个不同的服务组成,而AC 又分别是由其它的更具体的服务组成的,DEF 共同完成A服务的功能,而G H 完成C 服务的功能。

以网格服务为中心的模型具有如下好处[10]

1) 由于网格环境中所有的组件都是虚拟化的(virtualized),因此,通过提供一组相对统一的核心接口,所有的网格服务都基于这些接口实现,就可以很容易地构造出具有层次结构的、更高级别的服务,这些服务可以跨越不同的抽象层次,以一种统一的方式来看待。

2)虚拟化也使得将多个逻辑资源实例映射到相同的物理资源上成为可能,在对服务进行组合时不必考虑具体的实现,可以以底层资源组成为基础,在虚拟组织(Virtual Organization)中进行资源管理。通过网格服务的虚拟化,可以将通用的服务语义和行为,无缝地映射到本地平台的基础设施上。

5.2 OGSA复杂服务构成示例

5.2 语义网格的体系结构

    在最近的三年里,在思想上最重要的思想演化,至少在现在看来可能是网格基础设施内的语义web作用正确评价。这已经导致最初的三层网格结构的偏离[11].虽然这种模型很有价值,但它不能在网格基础设施上得以实现。最后,我们相信最近的一种体系结构,称为Goble [12],更好地阐述了不同层之间的交互关系。

    正如图5.3所反映的事实,在一定意义上,数字的,自动的网格世界必须满足用户所在的物理的,交互的世界。现今,在很多情况下,人们能通过一些设备实现这种交互:掌上电脑、可佩带的电脑、显示器,访问网格、或者虚拟现实。不论怎么说,网格与自然界,人类之间的主要问题,仍然存在。

5.3 语义网格体系结构

 

6 小结 

 

网格计算是一个正在迅速发展的研究领域,网格体系结构可以说是网格建设中的核心技术。不管是网格计算还是OGSA 还远不成熟,因此需要随着研究的深入不断发展。相信在大量基于OGSA的应用与开发展开后,OGSA会不断得到完善和提高,这也会直接推动网格计算的发展。

对语义网格来说,实现语义网格全景必然带来一系列的研究挑战[8]。以下10条,从最初的报告中修订而来,这些领域我们认为研究必须实现的,下面的排列没有特别要求。自动虚拟组织的形成与管理、服务协商与合同、数据安全、元数据与注解、内容处理与整理、知识技术、设计与分配、交互处理、协作和普算[8]

 

7 感谢

 

该文的完成,特别感谢http://www.的站长刘鹏,他提供了许多网格方面的资源,另外感谢张老师对网格技术的极力推荐。另外由于接触网格时间短促,理解不深,很多知识还不成体系,希望在以后进一步深入研究。

 

参考文献

[1] 桂小林, 网格技术导论,第1版,北京邮电大学出版社,2005.3.1

[2] 刘鹏, 网格不仅仅是计算,对网格应用的分析http://www.

[3] Ian Foster,Carl Kesselman,”网格计算,英文版第2版,机械工业出版社,2005.5.4

[4] 中科院计算所网格小组,数据网格简介

[5] Berners-LeeT Hendler J.and Lassin O. ”The Semantic web”, Scientific American,May,2001

[6] Angelo Gaeta, Francesco Oriciuoli MoMA Srl, Matteo Gaeta ,”Enabling Technologies for future learning scenarios: The Semantic Grid for Human Learning”

[7] IBM开发者网站

[8] David De Roure, Nicholas R. Jennings,Nigel R. Shadbolt,” The Semantic Grid: Past, Present, and Future”, PROCEEDINGS OF THE IEEE, VOL. 93, NO. 3, MARCH 2005

[9] Web Services 工作组, http://www./2002/ws/

[10] OGSA结构描述,http://www./ogsi-wg/drafts/ogsa_draft2.9_2002-06-22.pdf

http://www.Globus.org/ogsa/

[11] K.G.Jeffery, ”Knowledge, Information and Data”, CLRC Information Technology Dept., Sep.1999

[12] C.Goble, D.De Roure, ”The Semantic grid: Myth busting and bridge Building”, present at 16th Eur.Couf.Artificial Intelligence (ECAI-2004),Valencia, Spain, 2004.

 

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多