面向物联网的多媒体数据库检索技术应用研究
扫描二维码
随时随地手机看文章
引言
伴随着信息高速公路的兴起,多媒体正在深入我们的生活,物联网时代也离我们越来越近。在对文字、图形、图像、视频及声音等多种媒体信息进行综合处理时,传统的信息检索已经不能满足人们的需求,信息的查找和检索要求也越来越高。
1面向物联网的多媒体数据库特点
多媒体数据库是多媒体技术与数据库技术相结合而产生的一种新型数据库,是指数据库中的信息不仅涉及各种数字、字符等格式化的表达形式,而且还包括多媒体的非格式化的表达形媒体数据的存储、读取、检索等功能的数据库系统。多媒体数据库继承了传统数据库的一些优点,但数据管理要涉及到更复杂的处理。与此同时,继计算机、互联网之后,物联网带来了信息技术的第三次革命,经过综合分析,物联网环境下的多媒体数据与传统的数据相比,往往具有一些独立的特性。
1.1数据的非结构化
声音、图像、影视等数据基本上都是二进制串。这些数据从其本身看不出任何结构,因此称为非结构化数据。各种媒体的数字化存储形式称为多媒体数据。因为这些数据往往通过传感器输入计算机,又称传感器数据。媒体数据如果不另加一些描述和解释,一般很难利用对数据的描述和解释。这些特征使得传统的关系型DBMS难以有效地管理这些类型的数据,从而促使我们去研究、引入新型的DBMS系统。
1.2实时,性和快速更新
物联网技术是基于各种感知技术的应用。其上部署了多种类型传感器,不同类型的传感器捕获的数据内容和数据格式各不相同。由于每个传感器都是一个信息源,采集信息在一定频率的周期性环境下,传感器获得的多媒体数据也不断更新,具有实时性。
1.3数据量大且维度高
物联网是一种建立在互联网上的泛在网络。物联网技术的重要核心仍在互联网,通过各种有线和无线网络与互联网融合,将物体的信息实时准确地传递出去叫多媒体数据量一般都很庞大。虽然采取了数据压缩技术,但压缩后的数据量还是很大。在物联网上的传感器定时采集的信息需要通过网络传输,所以,这样的海量数据对多媒体数据库的存储及检索提出了更高的要求,同时还要考虑海量数据传输标准的统一。
2面向物联网的多媒体数据库检索
多媒体数据包括文字、图像、视频、音频等不同格式的信息内容。随着互联网的发展,传统的基于结构化的关系数据库检索方式并不适合非结构化的多媒体数据的检索,人们对多媒体数据的检索提出了新的要求。基于内容的检索就是从媒体数据中提取出特定的信息线索,然后根据这些线索从大量存储在数据库中的媒体中进行查找,检索出具有相似特征的媒体数据来。它可以在更深层次更有效地利用存储的多媒体信息。
基于内容的检索是一个逐步求精的过程[3]:第一是从媒体内容中提取信息线索。基于内容的检索直接对图像、视频、音频内容进行分析,抽取特征和语义,利用这些内容特征进行索引,并进行检索。第二是相似性匹配,就是将查询特征与特征库中的资料按照一定的匹配算法进行形似匹配,把满足一定相似性的一组候选结果按相似度大小排列放回给用户。第三是特征调整。对于系统返回的查询结果,用户可选择满意结果,或从中选择一个示例,经特征调整形成新的查询。第四,逐步缩小检索范围,直到用户满意。其具体过程如图1所示。
2.1基于内容的图像检索技术
基于内容的图像检索技术是指利用一定的算法提取图库中图像的颜色、纹理、形状等特征进行检索。用户提供一个样例图像,系统提取样例图像的特征,然后跟数据库中的所有图像的特征进行比较,并将与样例特征相似的图像返回给用户。
2.2基于内容的视频检索技术
视频主要由镜头组成,镜头由一系列连续的帧组成,帧是一幅静态的图像,是组成视频的最小单位。基于内容的视频检索的关键步骤是视频的分割,分割完成后,也就确定了每个镜头的开始和结束位置。每个镜头中的一系列帧的差异很小,可以从中选择出关键帧来描述镜头的关键图像,对该镜头的检索可以转换为对该关键帧的检索。由于视频中的关键帧就是一副静态的图像,因此,可以使用类似图像检索的方法进行检索。
2.3基于内容的音频检索技术
基于内容的音频检索可以提取音频数据中的特征信息,对不同音频进行特征匹配,从而达到检索的目的。一般以韵律、和音、旋律以及音调、响度、音色等感知特征进行特征值检索,根据查询索引和数据库中音频索引之间的相似性,来对音频片段进行检索。除实际发声词汇外,包含在语音中的其他信息,如发音者的身份和情绪都有助于语音索弓I和检索。
3面向物联网的多媒体数据检索策略
针对多媒体数据的特点,分析物联网环境中信息检索遇到的问题,一方面可以考虑提高服务器的处理能力、扩充服务器的存储容量,另一方面,则可以考虑优化查询策略以提高检索速度。优化策略可以从三个方面来考虑。
3.1临时表缓冲策略
对数据表操作时,传统的方法是直接对表进行关系运算,然后从中选择满足要求的结果集。而采用临时表的做法,则虐先对大数据表进行查询,将满足条件的数据预先读取到临时表中,然后将对源数据表的访问转换为对临时表的访问。将操作的数据集预先读取到临时表中会给系统带来额外的开销。但是,在一般情况下,临时表中的数据集要远小于源数据表中的数据集,因此,在对于海量数据进行连续操作或者频繁访问时,采用此策略可提高系统的总体性能。
3.2数据的降维处理策略
人们在物联网世界获得的数据量正以指数形式快速增长,为了减轻系统检索的负荷,可以对数据进行降维处理。结合具体业务需求,在尽可能多的保留初始数据的前提下,将数据的维数降到一个合理的大小,再将降维处理后的数据送入信息处理系统,这对海量数据的检索是行之有效的。降维算法主要分为线性降维算法和非线性降维算法。降维的实质就是寻找投影变换,即从高维空间到低维空间的变换。同时,降维处理也是一些智能算法的必要步骤,该策略对物联网数据检索中的智能处理是很有帮助的。
3.3情景感知的语义检索策略
物联网是通过射频识别、红外感应器、全球定位系统、激光扫描器等信息传感设备,把任何物品与互联网连接起来,进行数据交换。基于感应网络,可以从大规模的海量数据中获取用户的位置数据、邻接数据、通信数据和行为数据等,并对如此海量的移动数据进行实时挖掘,推导出蕴含在数据中的规律,感知用户的情景环境,发现用户的行为模式,将最能满足用户需求的结果提交给用户,以实现用户所得即所需,从而有效提高物联网信息检索的质量。
4结语
随着物联网技术的应用发展,人们对此环境下多媒体数据库的检索需求也越来越迫切。“数据灾难”成为急需解决的问题。利用云计算、模式识别等各种智能技术,可以从传感器获得的海量信息中检索、加工处理出有意义的数据。随着理论研究和时间探索的不断深入,面向物联网的检索技术一定会更加完善,充满智能的物联网多媒体数据库的应用也将逐步推向各个行业和领域。
20211018_616c5a5d90edf__面向物联网的多媒体数据库检索技术应用研究