数据标准化在电力物联网综合业务平台的应用
扫描二维码
随时随地手机看文章
引言
智能电网与物联网作为具有重要战略意义的高新技术和新兴产业,已引起世界各国的高度重视,我国政府不仅将物联网、智能电网上升为国家战略,而且在产业政策、重大科技项目支持、示范工程建设等方面进行了全面部署。电力物联网融合了通信、信息、传感、自动化等技术,在电力生产、输送、消费、管理各环节,广泛部署具有一定感知能力、计算能力和执行能力的各种智能感知设备,采用基于IP的标准协议,通过电力信息通信网络,实现信息安全可靠传输、协同处理、统一服务及应用集成,从而实现电网运行及企业管理全过程的全景全息感知、互联互通及无缝整合。
虽然电力物联网已有不同程度的应用,包括变电站、输电线路、用电信息采集、能效管理等,但是由于感知层标准化待完善、各应用系统的通信方式及规约不统一以及应用数据分散,导致感知层设备接入困难,通信能力以及可靠性达不到电力物联网的要求,以致于上述应用都是不同形态的应用,从而构建物联网综合业务平台的想法应运而生。
通过上述业务系统的知识积累和特定的业务解决方案,基于“统一规划、统一标准、统一组织、统一实施”的原则构造平台,封装业务逻辑,建立数据标准化模型,在感知层建立统一信息模型,具体包括统一标识、统一语义、统一数据表达格式等;网络层制定统一通信规约等;应用层实现数据存储管理及统一服务,最大限度实现知识复用,并且通过平台的自我完善、不断丰富和发展,平台可以构筑行业软件产品。
数据标准化使得数据的拥有者和使用者,对数据有着共同、一致和无歧义的理解;这个过程就需要对感知层和应用层的数据进行提取和抽象,发掘数据标准化的原则,参照电力物联网编码标准定义数据标准格式,达到平台的数据标准化格式传输的目的。
标准化不仅确保描述对象的一致性和准确性,还大大加强了其在系统间和环境间的实用性和共享性。
综上,物联网综合业务平台功能包括建立感知层的统一信息模型,通过统一通信规约向应用层提供统一服务,经过统一标准化,提升平台对外接口的一致性和数据传输的简便性,更加加大了平台的规范性,为未来拓展业务奠定基础。
1数据标准化
数据作为信息的载体,要分析数据中包含的主要信息及数据的主要特征。也就是说,要研究数据的数字特征。研究数据就是对数据进行采集、分类、录入、储存、统计分析、统计检验等一系列活动的统称。
数据元标准化是数据标准化的核心,是按一定的数据元设计规范对数据元的命名、定义、结构、特性和描述重新进行定义的过程。标准数据元设计的好坏直接关系到数据标准化的质量,关系到标准数据元的应用推广
数据元一般由三部分组成:对象类、特性和表示,关系如图1所示。
对象类:将数据和对数据的一系列特性和操作封装,形成对象,与客观实体有直接对应关系,一个对象类定义了具有相似性质的一组对象;通过对象以及对象之间的关系反应问题域中固有事物及其关系。
特性:是对象类所有成员共有的特征,它用来描述和区别对象,构成对象类的内涵。
表示:可包括值域、数据类型等。数据元包含数据元概念和表示两部分。一个数据元概念联合一个表示,就产生一个数据元。数据元和数据元概念间存在多对一的关系,多个数据元可以共享一个数据元概念。但是,数据元与表示之间的关系是一对一的关系,因为数据元中的特性有且仅有一个表示。
当一个特性和一个对象类建立关联时,就产生了一个数据元概念,是一对一的关系。
同实体关系类的数据模型相比,模型中的实体相当于数据元中的对象类,而实体的属性则相当于数据元中的特性和表示。
1.1数据元标准化方法
对于以现有数据库为主的领域中科学数据共享来说,数据元和属性提取的方法上亦采用“自下而上”的方法为主。
1.1.1数据元提取
数据元提取采用以下步骤:
首先是业务需求分析,包括流程分析、业务建模、收集相关数据,并确定数据需求。可以采用“自上而下”的方法,在业务流程和功能分析的基础上,通过建模分析,来确立关心'‘对象”。
其次是基本数据集设置,即确认数据需求确立的关心“对象”,通过对象类的特性以及相关表示的分析、归纳和整理,提出所需的数据元;将必需收集的数据按特性分成不同数据集,确定每个数据集中的数据项。
最后是数据元构建,即对抽象的数据元,可按对象类词、特性类词以及表示类词构建数据元。
1.1.2数据元规范;化描述
数据元的规范化描述是指按国际或国家标准对于所提取的数据元的属性进行描述,遵从的标准为GB/T18391.3-2001信息技术数据元的规范与标准化(第3部分):数据元的基本属性。但是,对于物联网的数据元的属性描述,需要遵从物联网的标准,比如IEC61850等,设备编码需要遵从EPC、GSI等。
1.2数据元标准化模型
数据元的标准化模型图如图2所示。对于全新领域来说,数据标准化适用的方法为概念层到应用层,该过程即是数据元提取的过程,由于对数据表示的理解是一致的,因此,可以进行有效的数据交换。
对于已建系统的领域来说,比较适用应用层到概念的标准化方法,数据创建者在对信息系统及相关资源的数据分析梳理的基础上,归纳整理出应用数据元,并根据实际应用,阐述数据元素在采集、分类、录入、储存、统计分析、统计检验等一系列活动中的约束条件;描述和定义各个属性所需要的属性约束要求,根据给定的命名和定义等形成应用数据元,然后再按照应用到概念的标准化方法得到数据元概念和值域。
通过数据元标准化模型可以保证数据元的质量和用户对应用的理解一致性,更深层次地推进了数据元标准化的进程。
2物联网综合业务平台标准化方法
物联网综合业务平台的架构图如图3所示。根据物联网的三层结构,也可将应用层进一步抽取出核心处理层、功能层和应用层。其中,核心处理层和功能层作为平台的内容;物联网感知层作为平台的数据源,通过整合综合接入网关,实现对各种类型感知装置数据信息的分类总结,强化通用性和易处理性,为平台的数据处理及大数据分析提供支撑;应用层作为平台的支撑层,通过平台提供的Webservice接口,获取整合分析后的各类终端数据。
由此可见,该平台有感知设备数据和业务数据两类数据,由于数据离不开数据对象和通信,因此平台的数据标准化包括设备标准化、语义标准化(数据标准化)以及数据交换标准化。
数据交换标准化:该平台可利用Webservice服务接口,采用XML的数据格式传输,各业务支撑系统共享数据资源,按需接入业务数据,从而为业务系统提供标准化调用服务。
设备标准化:针对目前传感器类型繁多的现状,建立统一数据模型、统一标识,平台统一管理。
语义标准化:该平台可根据感知设备类型不同、监测数据类型和监测项的不同,建立统一的数据模型和统一数据传输格式,解决因感知设备不同造成的互联互通难题。
2.1数据交换标准化
针对物联网应用层的数据交换标准主要有PML、EDDL、M2MXML、NGTP等。其中,PML是实体标注语言,它是EPC(产品电码)物联网中交换信息的共同语言,用来描述人及机器都可以使用的自然物体的描述标准。EDDL是电子设备描述语言,它可以描述现场设备中的数据,以用于工程、调试、监视运行和诊断。M2MXML是一种用于终端设备间的通信协议,它包含一个用于分析协议的、与语义无关的JavaAPI。NGTP是宝马公司推出的开放式Telematics协议架构平台,它使用统一、开放的接口来区分Telematics服务供应链的各个环节。此外,还有智能建筑领域的OBIX标准、公共安全与应急领域的CAP标准以及PCM(脉码调制)遥测技术的IRIG标准等。
综上所述,现有数据交换标准多数是针对某一特定领域或行业提出的,有一定局限性,当前缺少的是一个统一的物联网数据交换大集成应用标准(或标准体系)。欧盟有关机构正在进行数据交换标准融合的研究,目标是综合考虑相关领域已有的基于XML的数据交换标准,以便为那些在不同的标准中语义上具有等价性。
XML是一种元数据,是Internet环境中跨平台的、依赖于内容的技术,也是当今处理分布式结构信息的有效工具;它是用来描述数据的,侧重描述什么是数据,如何存放数据,用户可以自定义标记,是一种支持多种应用环境、跨平台、跨空间的,与软、硬件无关的处理信息的工具。XML将成为最普遍的数据操纵和数据传输的工具,很适合网络传输。它具有如下特点:
(1)XML可用于交换数据,使得可以在不兼容的系统之间交换数据。将数据统一标准化转换成XML格式会大大减少交换数据时的复杂度,还可以使这些数据能在不同的程序之间读取、共享。
(2)XML提供了一种与软件和硬件无关的共享数据的方法,因为XML是以纯文本格式存储的。
(3)XML可以用于创建新的语言。比如XML是WML语言的母亲,WML是用于标识运行于手持设备上的Internet程序的工具,它就采用了XML的标准。
(4)XML可以在本地进行个性化计算和处理,这样既减轻了服务端的负担,还可以根据不同的用户要求进行相应的处理。
(5)XML支持局部更新,减少了数据传量。
综上,我们选用XML作为数据的传输格式,定义数据基本格式,统一标准,开发灵活性强、升级方便的应用软件。
2.2设备标准化
通过分析业务需求,利用“自上而下”的方法归纳平台研究对象,可以抽象地分为两类:监测对象和被监测对象。 平台统称为设备对象;监测对象是测量被监测对象的,是一 种所属关系,通过这关系将两种对象进行关联。对象结构如 图4所示。
2.2.1设备编码标准化
编码是按一定规则对设备赋予易于计算机和人识别、处
理的代码。
参照DL510《全国电网名称代码》、DL/T 495—2012《电 力行业单位类别代码》、DL/T511《电站设备备品配件分类与编 码导则》以及DL/T700《电力物资编码》等标准,平台设备编 码设计可以基于分级分类细化原则进行。其结构如表1所列。
表1基于分级分类的细化结构 |
|
代码分类 |
长度 |
网省代码 |
2位 |
地市代码 |
2位 |
单位代码 |
2位 |
类别编码 |
2位 |
大类编码 |
2位 |
小类编码 |
2位 |
附加编码 |
2位 |
数量编码 |
2位 |
代码号可参照上述标准规定进行代号。比如某网省地市
公司变电站有监测变压器的温度传感器2个,则可标识为图5 所示的规则图。
2.2.2设备语义标准化
根据抽象出的设备对象,定义设备语义标准化结构如下:
<device>
<deviceId> 设备标识 </ deviceId >
<deviceName> 设备名称
</ deviceName >
<deviceType> 设备类型
</ deviceType >
<parentDevice> <parentDeviceId> 设备标识
</ parentDeviceId >
<parentDeviceName> 设备名称
</ parentDeviceName >
<parentDeviceType> 设备类型
</ parentDeviceType > </parentDevice>
<other>
设备的其他基础信息
</other>
</ device >
<!—设备基本结构
<?xml version= v1.0vencodings" UTF-8” >
平台通过抽象,将监测对象和被监测对象建立统一数据 模型,实现设备的格式标准化,方便平台的统一管理。
2.3数据语义标准化
语义标准化是对监测设备监测的数据和平台经过一系列 整合处理后的数据进行的标准化。
监测设备的作用只是将数据采集并发送出去,没有进行 数据转化,提供更深层次的数据价值,所以平台通过自定义 配置等对原始数据进行挖掘处理和分析,获取更有意义的数 据并提供给应用层。
由此抽象的数据对象可作为数据对象和数据报警对象, 对应数据的状态和对象结构如图6所示。
此时,定义数据传输的结构有别于对象结构,因为对象 注重整体,数据传输注重个体,在XML数据结构中,将对 象信息打散,描述数据信息更有利于数据语义的标准化。
根据传感器类型,可以将数据概括为报警类、数值类、信号量类。平台为了区分这些数据并不增加 XML 传输格式的复杂度,平台采用分开处理模式,对各类数据进行相应标准化处理,具体如表 2 所列。
3结语
本文通过借鉴数据标准化方法和数据结构模型,分析了 业务流程和平台关心对象、特性和可能表示的前提下所需的 数据元和属性,并对平台对象进行统一建模和统一数据格式, 以使得数据的使用者和拥有者对数据的理解无歧义。
20211023_61741f2090462__数据标准化在电力物联网综合业务平台的应用