无线传感器网络数据融合技术与展望
扫描二维码
随时随地手机看文章
引 言
无线传感器网络是计算、通信和传感器技术相结合的产物。数量众多的传感器节点采集观测区域的热、光、声音、速度以及图像等信号,在无线传感器网络中通过无线信道通信实现信息共享与合作处理,从而将监控到的温度、物种、气候变化、压力、方向、速度等传递给用户[1]。
无线传感器网络是信息感知和采集领域的一场深刻变革, 目前已在国防、交通、医疗、反恐、环境监控以及自然灾害预防等领域投入应用[2],今后凭借其得天独厚的优势必将给人类的生产和生活带来深远影响。
无线传感器网络与传统的Ad-hoc 网络差别明显,主要表现在以数据为中心;节点数量众多、密度大;节点能量、计算、存储等能力受限 ;节点可靠性差 ;数据冗余度高;采用多对一通信模式等。
1 无线传感器网络中的数据特征
无线传感器网络中的数据常含有大量冗余信息,即使采用专业的数据分析方法也难以解释数据的含义。受所部署地理位置的影响,无线传感器网络中的数据常常还包含噪声, 很难将其和 真正的 数据分开。此外,除非将无线传感器网络中的数据与时间和位置信息关联,否则无意义。
相对于传统数据而言,无线传感器网络中的数据具有其独有的特征,主要表现在三个方面。
1.1 数据流特征
无线传感器网络中的数据自动生成,以多路、连续、时变的方式传输 [3],随着时间的推移而增加,且数据总量可能非常庞大。这些数据具有显式的时间戳或者隐式的到达时间,是形式按时间排序的数据流。
1.2 强时空相关性
无线传感器网络通常按照一定密度进行部署,以便使传感器覆盖整个监测区域。因此,大部分无线传感器网络中各节点间的读数会表现出时间和空间上的相关性。这种强时空相关性使得某一时刻某个传感器节点的读数不仅对下一时刻观测到的读数具有高度预测指示性,还对附近节点的读数具有指示性。利用强时空相关性可以估计丢失或损坏的数据、监测偏值、提高传感器数据的质量、进行数据抑制、减少网络中的数据传输,从而降低能耗。但强时空相关性也会带来大量的冗余数据。
1.3 噪声
无线传感器网络中传感器的设计目标是低功耗和低成本。但会导致传感器的精度受限,加之传感器通常部署在严酷的环境中,会受到潜在的环境干扰。因此,传感器数据通常含有错误(由传感器功能引起)和噪声(由其他环境干扰引起),在把它们存储到数据库之前,应先对其进行清理。
2 无线传感器网络中数据融合的意义
数据融合是一种多源数据处理技术,在无线传感器网络中数据融合的核心理念就是收集数据时,基于传感器节点的软硬件技术对所采集数据做进一步处理,删除冗余信息,为节点所需传输的数据 瘦身 ,同时处理多个不同节点的数据, 使汇聚节点能够收集到比单个节点更加有效、更能满足用户需求的数据信息,从而实现提高资源利用率、延长网络寿命的目的。数据融合对无线传感器网络具有十分重要的意义,主要体现在三个方面。
2.1 节约通信带宽和能量
通过数据融合可以在网内对冗余数据进行处理,即删除冗余信息,使要传输的数据在可以满足应用所需的前提下尽可能的少。由于传感器节点传输数据消耗的能量高于计算所消耗能量几个数量级,因此在网内数据融合过程中消耗一定的计算资源来节约通信带宽,不但可以提高传输效率,还可以通过降低节点的能量消耗延长整个无线传感器网络的生命周期。
2.2 提高信息准确度
通过数据融合技术对监测同一对象的多个传感器节点所采集的数据进行综合,可以使最终获得的数据精度和可信度处于一个较高的水平。因为比邻传感器节点几乎监测同一区域, 其所获数据差异性较小。如果个别节点出现数据错误或误差较大,可以通过网内数据融合将其过滤掉。
2.3 提高数据收集效率
通过数据融合可以减少需要传输的数据量,从而有效减轻网络中的数据堵塞,减少传输过程中的数据冲突和碰撞, 也使数据传输延迟处于较低水平,从而提高整个网络无线信道的利用率。
3 数据融合过程
无线传感器网络的数据融合过程包括预处理、数据挖掘和后处理。图 1 所示为从原始数据提取信息的全过程。
3.1 数据预处理
无线传感器网络中的节点数据通常包含噪声、偏值和丢 失值。如图 2 所示,引起这些数据质量问题的原因包括传感 器内部误差 ;传感器部署所处的严酷环境 ;无线传输过程中 数据的损毁和丢失。数据预处理包括数据清理、丢失值恢复、 网内整合以及偏值检测、数据压缩、维数压缩和数据预测等。
3.1.1 数据清理
目前已有多种方法用于传感器数据清理,包括贝叶斯理 论、神经网络、小波、卡尔曼滤波和加权移动平均。由于计算 能力有限,无线传感器网络很难实现贝叶斯理论、神经网络和 小波方法。卡尔曼滤波和加权移动平均两种方法相对可行。
Zhuang 等人提出了一种基于传感器数据清理的智能加权移动平均方法[4]。该方法包括以下三个步骤:
(1) 通过预测范围找出重要数值 ;
(2) 通过对单一传感器节点进行节点测试和邻居测试来增加重要数值的置信度;
(3) 在汇聚节点执行加权移动平均算法。
这种方法采用卡尔曼滤波和线性回归进行范围预测。在预测范围内的值被称为 重要值 ,并在第二步中计算其置信度。最后,在汇聚节点结合时间平均和空间平均进行移动加权平均。
3.1.2 丢失值恢复
对于解决网络数据丢失的问题,传统的方法是在接收方向发送方发送一个重传请求之前,等待一个预定义的时间周期,或者发送方没有收到来自接收方的确认,则自动重传数据包。使用这种方法主要有两个缺点,即增加传感器功耗,增加由查询产生的结果延迟。因此,在处理传感器数据丢失的现有研究中,重点是使用与丢失的传感器数据有关的传感器中的可用数据来估计或恢复丢失的数据。
目前已经提出了多种估计方法,如最大期望算法、关联 规则算法和信任传播算法。最大期望算法是一种使完整数据 似然性收敛到局部极大值的通用方法,即观测的数据和丢失 的数据似然性。“E”步计算节点丢失值的期望或可能性 p(Y|X, θ),其中 X 表示观测的数据,Y 表示丢失值,θ 表示统计模型 参数。根据丢失值的期望,“M”步计算使完整数据似然性最 大的期望值为 θ。
3.1.3 网内数据整合
大量冗余数据可能会放缓或混淆知识发现过程。冗余数据的网内整合可以减少整个无线传感器网络的数据流,从而使用最少的资源提取最具代表性的数据,这样可以有效降低功耗。因此,传感器数据预处理研究的一个分支是关注WSN 的传感器数据压缩。
最简单的情况是,当原始数据大于预定义的阈值时,求出原始数据的平均值并记录该平均值。如下所列为结构化查询语言SQL 中的平均整合查询语句,AVG 为传感器采集的平均温度值。如果该平均值大于阈值,则通过 Having AVG , 发送平均值,采样周期为 30 s。
SELECT AVG(temperature),FROM Sensors
WHERE floor=6
HAVING AVG(tempreature)> threshold
SAMPLE PERIOD 30s
Akcan 和Brönnimann 提出了一种加权网内采样算法来获得确定性更小、更典型的样本而非原始冗余数据 [5]。与随机采样相比,加权采样的优势在于它可以保证每个节点的数据都有相同的机会归属最终样本,而独立于其网络来源。
Santini 和Römer 提出的基于预测数据压缩的策略不是有选择的对网络节点进行采样,而是将预测方法部署在传感器和汇聚节点[6]。这样,传感器只需发送偏离预期值的数据。具体方法如下:
在汇聚节点和传感器节点运用预测模型 G来获得下一时刻传感器读数的估计值 Xt+1=G(Xt)。
在传感器节点,如果|Xt+1- Xt+1|>ε,就向汇聚节点发送实际传感器读数。其中,Xt+1为下一时刻传感器的实际读数,ε 为容忍误差。
汇聚节点使用传感器读数的估计值。
3.2 传感器数据挖掘
无线传感器网络中的数据挖掘是将传统的数据挖掘算法,如主分量分析(Principal Component Analysis,PCA)、神经网络、贝叶斯网络、回归分析和聚类方法等应用到无线传感器网络,避免原始数据的直接传输,减少传输中的数据量。Catterall等首次将SOM 神经网络引入无线传感器网络的网内数据处理中[7],Kulakov等对此做了进一步研究[8],提出了两种神经网络数据挖掘结构:
1)簇头收集各传感器节点的数据, 然后执行 Fuzzy ART算法进行分类;
2)各传感器节点执行 FuzzyART算法对自己收集的数据分类,将初步结果传送到簇头。
回归分析是无线传感器网络中的一种网内数据处理框架。通过将数据投影成低纬表示,可以精确表示原始数据的结构, 同时有效减少网内的数据量。具体方法是使用线性回归来完成投影,即数据用函数的带权线性组合来近似。Wu 等将贝叶斯网络引入无线传感器网络的网内数据处理 [9],在目标追踪和数据推断等方面取得了比较好的结果。
无线传感器数据挖掘主要致力于分布式网内数据挖掘。大多数研究人员提出将层次化网络拓扑结构用于传感器数据挖掘。Bontempi 等提出了一种用于传感器数据挖掘的二层结构[10],而这是一种传感器数据挖掘的自适应模块化结构,如图 3所示。
底层由用虚线表示的汇聚节点构成,完成用黑点表示的相邻传感器节点的聚合。汇聚后的信号被送到上一层进行数据挖掘。在这里要完成的感知任务有分类、回归和预测等。该结构在WSN 拓扑中引入了汇聚节点层,每个汇聚节点都作为一些传感器节点的簇头。
3.3 传感器数据后处理
数据后处理包括模式评估、模型评估、数据可视化和表示等。通过这一步可以把传感器数据挖掘的结果和特定应用进行关联。数据可视化可以基于计算机图形、统计方法或基于用户交互技术。
4结 语
随着廉价且强大的传感器、通信系统和信息技术实用性的不断提升,在一些主流领域,无线传感器网络数据融合技术已日渐成熟,能够提供已被苛刻应用所验证一致、强大的方法和算法库,通过挖掘其内在潜能,进行新产品的研究和开发就具备了良好的基础,开发周期将会大大缩短,涉及的风险也会随之降低。
未来无线传感器网络数据融合技术必将大显身手,特别是在要将物理或技术方面的传感器数据与定量的上下文信息进行融合的领域。如将通信与分布式数据融合体系紧密联系在一起的融合驱动通信,将可用的量化非传感器信息与传感器数据通过上下文数据集成进行融合从而形成综合数据库,将联想推理、合理的协商妥协、专家知识和态势评估等融入无线传感器网络数据融合的人工辅助系统,为了应付跨区域复杂地形以及 非对称 对手的网络中心作战以及利用无线电台、电视或移动电话基站等潜在发射站对目标进行照射,形成无处不在的被动监视网络。