基于XML和本体的物联网数据交换标准体系研究
扫描二维码
随时随地手机看文章
摘要:针对当前物联网应用层中相关数据交换标准纷繁复杂,相关标准主体各行其是的问题,从XML(可扩展标记语言)和本体的角度出发,从互联网、语义网和物联网的关系入手,提出了建立物联网数据交换标准体系的思路,即标准应以XML为语法格式,以标准化的本体为语义共识;标准体系应以顶级本体为基础,以纵向的领域本体和横向的任务本体为支撑,建立起各种不同的应用本体标准。文章最后通过一个应用实例分析了所述标准体系发展的若干关键要点。
关键词:物联网;数据交换标准;可扩展标记语言;标准本体
0 引言
2009年被称为中国的物联网元年,这一年,温家宝总理在无锡视察时提出了“感知中国”战略。2010年的“两会”期间,物联网首次被写入政府工作报告中,被确定为国家要大力发展的战略性新兴产业。近年来,从中央到地方、从政府到企业,一饧物联网建设的热潮正在如火如荼地展开。然而,当前物联网的发展仍处于初级阶段,还面临着传感器技术不成熟、缺乏商业应用模式、信息安全和隐私等诸多问题与挑战,其中制约物联网发展的最大瓶颈,则是缺乏统一的技术标准,尤其是数据表达、交换和处理标准。因为传感器关键技术的突破、商业应用模式的推广等等,都只是物联网中“物”的问题,而数据交换标准则涉及物联网中“联”的问题。如果不能实现物与物之间畅通无阻的信息交换,就不能称之为真正的物联网。
1 物联网数据交换标准现状
物联网系统主要分为三个层面:感知层、传输层和应用层。感知层主要是对物体进行识别或数据采集;传输层是通过现有的通信网络将信息进行可靠传输;应用层则是对采集的数据进行智能处理或展示。在这三层体系中,感知层中基于物理、化学、生物等技术发明的传感器“标准”多已成为专利。而传输层的各种通信标准也已基本成熟,建立新的物联网通信标准难度较大,可行性较小。因此,物联网标准的关键和亟待统一的是关于应用层的标准,而其中尤以数据表达、交换和处理标准为核心。
目前,针对物联网应用层的数据交换标准主要有PML、EDDL、M2MXML、NGTP等。其中,PML是实体标注语言,它是EPC(产品电码)物联网中交换信息的共同语言,用来描述人及机器都可以使用的自然物体的描述标准。EDDL是电子设备描述语言,它可以描述现场设备中的数据,以用于工程、调试、监视运行和诊断。M2MXML是一种用于终端设备间的通信协议,它包含一个用于分析协议的、与语义无关的JavaAPI。NGTP是宝马公司推出的开放式Telematics协议架构平台,它使用统一、开放的接口来区分Telematics服务供应链的各个环节。此外,还有智能建筑领域的OB1X标准、公共安全与应急领域的CAP标准以及PCM(脉码调制)遥测技术的IRIG标准等。
可以看出,现有的物联网应用层的数据交换标准大多是针对某一特定领域或行业业务提出的,有一定的局限性,所以当前物联网缺少的是一个统一的物联网数据交换大集成应用标准(或标准体系)。欧盟有关机构正在进行数据交换标准“融合”的研究,目标是综合考虑相关领域已有的基于XML的数据交换标准,以便为那些在不同的标准中语义上具有等价性的数据元素(尽管他们可能有不同的名字)提供全球唯一的交叉引用方式和标识结构,从而提炼出一个基础的元数据标准,把这个标准作为物联网数据交换的核心,那么,对于不同的行业应用,就可以基于元数据扩展出相应的行业数据交换标准。
总体来说,物联网的标准化工作已经得到了业界的普遍重视,但对于应用层的标准化工作来说,还需要客观分析物联网标准的整体需求,从国际标准、国家标准、行业标准、地区标准等多个层次进行统筹设计;其次,还需要协调各个标准的推进策略,优化资源配置。
2 物联网数据交换标准体系的构建
2.1 构建物联网数据交换标准体系的基石
XML技术是为了克服HTML在互联网信息交换和表示方面的缺陷而设计的,本体论最初也是起源于哲学领域,随后在研究人工智能时被引入计算机领域。虽然两者的出现都不是为了解决物联网领域的数据交换标准问题,但它们却为这一问题的解决提供了必要的理论基础和技术手段。
2.1.1 物联网数据交换标准的语法基础——XML
XML(eXtensible Markup Language,可扩展标记语言)是W3C组织于1998年推出的一种用于数据描述的元标记语言标准。作为SGML(Stan dard Generalized Markup Language,标准通用标识语言)的一个简化子集,它结合了SGML丰富的功能和HTML的简单易用,同时具有可扩展性、自描述性、开放性、互操作性、可支持多国语言等特点,因而得到了广泛地支持与应用。
对于作为物联网数据交换标准的格式来说,XML具有以下显著优点:
(1)可定义行业或领域标记语言
XML可以用DTD或者Schema来定义,一份遵循DTD或者Schema定义的XML文档才是有效的。因此,XML可以针对不同的应用建立相关的标准语言,如化学标记语言(CML)、数学标记语言(MathML)、语音标识语言(VoiceXML)等,包括目前物联网中很多已经存在的标准都是基于XML定义的。
(2)具有结构化的通用数据格式
XML使用树形目录结构形式,可以自行定义文字标签并指定元素间的关系,同时它也是W3C公开的一种数据格式,没有版权的使用限制,因而十分适合作为小同应用程序之间的信息交换格式。
(3)可提供整套方案
XML拥有一整套技术体系,如可扩展样式表语言XSL、数据查询技术xQuery、文档对象模型DOM等等。
2.1.2 物联网数据交换标准的语义基础——本体
本体(Ontology)起源于哲学,被Neches等人引入计算机科学领域后,在人工智能、语义Web、软件工程、图书馆学以及信息架构等领域得到了广泛应用。关于本体最流行的定义是Gruber在1993年给出的,即“本体是概念模型的明确的规范说明”。Studer在对前人的定义进行概括后提出:本体的概念包括四个方面:
(1)概念模型:它是客观世界现象的抽象模型,其表示的含义独立于具体的环境状态;
(2)明确:所使用的概念及使用这些概念的约束都有明确的定义;
(3)形式化:本体的表示是形式化的,可以被计算机处理;
(4)共享:本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。
本体的目标是获取相关的领域知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。所以,本体是具有小同知识表示的Web应用系统之间进行数据或知识交换共享的基础结构。通过定义共享和公共的领域知识,本体可帮助机器之间或机器与人之间更加精确地交流,实现相互之间的语义交换,而不只是语法级的交互。
按照领域依赖程度,Guarino将本体划分为四类:第一类是顶级本体,用于描述通用的概念和概念之间的关系,如时间、空间、物质、对象、事件、动作等,顶级本体独立于特定的问题和领域,与具体的应用无关;第二类是领域本体,用于描述特殊领域(如教育或金融)中的概念,即陈述性知识;第三类是任务本体,用于描述特定任务或活动(如入学或取款)中的概念,即过程性知识;第四类是应用本体,应用本体可通过进一步特殊化领域本体和任务本体,将其用于描述既依赖于特定领域,又依赖于特定任务的概念,这些概念通常对应于领域个体执行特定活动时所扮演的角色(如学生入学或客户取款)。
2.2 构建物联网数据交换标准体系的思路
顾名思义,物联网就是物与物相连的网络,要想实现物与物之间畅通无阻的“交流”,就需要在语法上相同,在语义上互通。通俗的说,就是用相同的格式表达同一个意思。
XML在语法上的结构化信息表达能力和本体在语义上的透明性之间的优势互补为物联网数据交换标准的建立提供了很好的解决思路。
2.2. 1 从互联网向语义网、物联网发展
由于XML具有诸多的优点,因此,XML成为许多应用领域的首选信息表示格式。同样,XML也非常适合于物联网中的信息传输,同时,它还可使得各种物联网终端能够和当前的互联网实现很好的对接。因此,物联网的数据交换标准应该是一种基于XML的标记语言,而且,从目前已经存在的数据交换标准来看,也确实如此。然而,XML具有一定的语义局限性,它具有语义表达能力,却没有语义透明性,它允许用户在文档中加入任意的结构,而无需说明具体含义,但其缺乏数据表达式与相应概念之间的统一性。正因为如此,在XML2000会议上,Tim Berners-Lee提出了语义网的概念。语义网使用本体来描述一个专业领域知识中的重要概念以及概念之间的关系,以使得这些概念和联系在共享的范围内有着明确而唯一的定义,从而达成一种共识,这样,机器之间或人和机器之间就可以进行无障碍的交流。
语义网被称为下一代互联网,而物联网则是一种泛化的互联网,两者都将是互联网的发展方向,只是它们的出发角度不同,前者偏向于从技术角度出发,后者偏向于从应用角度出发。由于物联网具有自动识别、自动传输、自动处理等特点,因此,与当前的互联网相比,物联网更需要机器之间或人和机器之间实现语义级别的交互。
2.2. 2 基于本体分类构建物联网数据交换标准体系
本体从底层向上分为顶级本体、领域本体和任务本体以及应用本体,这些不同层次的本体可向我们提供这个世界的共性描述,而物联网正是要将世界连接起来。
首先,物联网所连接的各种物体都处在同一个世界中,它们都具有某些共同的特点,即人们对于这个世界的基本认识,如时空、物质、事件、行为等,所以,物联网数据交换标准体系的基础是顶级本体标准。其次,物联网各个垂直的应用领域都有特殊性。具体到每一个领域,都有可能、有必要发展一套依托于领域本体的标准。但是,很多类型的业务词汇和流程是可以跨越多个垂直应用领域而公用的,所以,还有必要发展起跨领域的物联网任务本体标准,即某个领域的本体标准可能构建于多个任务本体标准之上,而某个任务本体也有可能被多个领域本体所引用。最后,具体到每个企业、组织甚至个人,它们针对于自身的物品、行为、过程等,也可以建立起基于顶级本体、领域本体和任务本体的应用本体标准,以供其他个体在与自身发生信息交换时共享这些事先定义好的内容。
基于上述思路,物联网数据交换标准应以XML为语法格式、以标准化的本体为语义共识。按照本体的分类,物联网数据交换标准体系应以顶级本体为基础,以纵向的领域本体和横向的任务本体为支撑,建立起各种不同的应用本体标准,其整个物联网数据交换标准体系示意图如图1所示。
2.3 物联网数据交换标准体系的应用实例
XML使物联网中的节点可以采用相同的数据交换格式,而本体则可以使相关节点对交换的数据实现语义上的共识和推理。下面用一个具体的实例来说明XML和本体在物联网数据交换中所发挥的作用。
例如,某消费者家里的智能家居系统检测到冰箱里的苹果存量不足,那么,系统就会根据预先设定的程序自动向网上商店发出购买指令。这样,关于此次购买行为中的苹果描述信息如下:
由上可知,该公司生产的hongfushi苹果是fruit本体中apple类的一个子类,因此,它继承了apple类的所有属性。而智能家居系统要购买的苹果也是来自fruit本体中apple类,于是,基于XML和本体的数据交换标准就使得消费者的冰箱可以自动发出购买指令,零售商的系统也可以自动进行订单处珲,而不再需要重复地指定交易物品为水果中的苹果,从而实现智能处理。
本例中,智能家居系统描述的此次购买行为中的本体和苹果生产者的产品本体都是属于应用本体,两者均构建于领域本体fruit之上,fr uit本体对于消费者、生产商和零售商来说,便是一个本体标准,三者在购买的商品为水果中的苹果这一意思上要达成共识,而不会使零售商误解消费者要购买的是苹果牌手机或是其他商品。当完成一次交易之后,hongthshi苹果生产商的产品本体在消费者、生产商和零售商之间也成为了一个本体标准,如果下次消费者还想再购买该生产商的hongthshi苹果,便可以直接引用该本体。相关本体标准之间的引用关系如图2所示。
3 物联网数据交换标准发展的若干关键要点
建立物联网数据交换标准体系,只是搭好了一个框架,要想满足实际的应用需求,还应从技术和管理两方面进行完善和发展,包括标准构建的方法和原则、不同标准之间的转换以及组织管理等等。
3. 1 遵循确实可行准则和广泛可行准则
确实可行是指制定的标准要在技术上是正确的,在方案上是可行的,在叙述上是清楚的,并要尽量减少标准技术产生错误和歧义的可能性。广泛可行则是指标准要能够支持很大范围甚至是全球的应用,要可以解决很多行业的一般性需求,要能够使具备一定条件的公司、组织以及个人可以实现标准中的方案,并且这些方案和技术要是尽可能廉价甚至免费的。同时标准还应顾及环境、社会乃至一般公民的各种需要。只有这样的标准,才能推动各行业、各地区、各个国家以及全球的经济发展和技术进步。
3.2 设置标准转换接口
世界是多样的,因此,我们对于这个世界的理解也是不同的,这也是物联网中的数据语义不同的根源所在。虽然可以通过XML、本体等技术来构建一套物联网数据交换标准体系,并成立相关标准组织来进行管理,但这只能在一定程度上解决一定范围内的数据交换问题,而不可能也没必要建立一整套全面的数据交换标准,并要求所有参与者都要符合这个标准。所以,整个物联网数据交换标准体系应该是由少数几个顶级本体标准、大多数领域和任务的领域本体标准与任务本体标准,以及数量众多的应用本体标准组成。正因为如此,还需要在物联网的各个终端的必要位置上设置恰当的转换器或者接口,从而实现针对同一对象、应用或业务而语义不同的标准之间的转换。
3.3 成立标准管理组织
物联网数据交换标准体系的建立不是一蹴而就的,它是一个不断完善、不断发展的过程。一方面,人类足不断发展的,未来将会有我们今天难以想象和预测的许多物联网应用,这就需要对现有的标准体系进行不断的修改和补充。另一方面,物联网标准的制定要涉及许多利益相关方,大到国家利益、行业利益,小到企业利益、个人利益,都需要充分的协调和沟通。
因此,物联网数据交换标准体系的建立和发展,应成立国际、国家、行业等各个层面的标准组织并进行统一的管理。
4 结语
物联网数据交换标准的统一,从技术角度来说,关系到能否建立起基于此标准的配套运行环境和中间件业务框架,从而使用户能快速开发出垂直应用业务系统。从应用的角度来说,这关系到能否形成物联网经济的规模效应和成熟的商业模式,从而使整个物联网产业链和市场持续健康地发展。
在当前众多标准纷繁复杂的情况下,本文从XML和本体的角度出发,提出了建立物联网数据交换标准体系的思路。当然,这并不是要否定和抛弃现有的标准,而是要将业已存在的标准通过转换或映射纳入到整个体系之中,并进行统一的管理和规范,从而促进整个物联网行业的发展。