藏文信息隐藏技术综述

时间：2021-12-23 18:12:43

关键字： ZigBee技术无线DCS STM32W108单片机现场控制站

手机看文章

扫描二维码
随时随地手机看文章

[导读]摘要：随着众多藏文网站的开发和使用，越来越多的藏文信息在网上得以传播和交流。西藏的互联网中，藏文信息的比重和其所带来的影响也越来越大。由于历史和地缘因素，西藏文化一直是国内外学者、军事和安全机构的研究内容，从中外藏学研究的如火如荼就可见一斑。自西方国家19世纪末开始出版藏文书籍至20世纪80年代''西藏问题”国际化，国外对西藏的历史、政治、经济、宗教、文化教育以及藏文字的研究均渐成规模，但是以藏文为传输内容的信息隐藏技术在国内外的研究还为数不多。本文就藏文信息隐藏技术的研究状况、研究目标、研究内容和需解决的关键问题进行了概括性分析与综述。

引言

安全、有效的信息传输对国家安全、社会稳定和人民安居乐业至关重要。网络和多媒体技术的发展，使得信息传输的速度和数量正以惊人的增量发展。然而，信息传输的便利在方便人们的同时也给信息安全带来了隐患，同时也为基于数字载体的秘密信息传输提供了广阔的研究空间。目前，基于载体的秘密信息传输是信息安全领域的一个方兴未艾的研究热点。而基于载体预处理的藏文信息隐藏技术将为信息安全领域提供一些新的数字信息共享和传输理念，特别是藏文的预处理规律、在数字信息中的隐藏规律等，将有助于涉藏秘密通信技术的发展，并可以对民用和商用领域中涉及到藏文内容的传输、共享、存储和提取的通信过程起到安全保护、版权保护及完整性认证的作用，并对国家涉藏领域的网络舆情监控、国内外涉藏敏感信息标注和情感色彩认知起着至关重要的作用。

在藏文信息隐藏技术方面，目前主要涉及的技术有关键字识别、字符识别和提取、韵律认知、语义角色标注、文本资源挖掘和语料抽取等，并以此为基础进行置乱优化。

1国内外信息隐藏技术研究现状

信息隐藏一直是信息安全领域中保障隐秘信息安全传输和数字信息版权的重要手段，也是近年来国内外学者研究的热点之一。最新的一届ACM信息隐藏和多媒体安全会议ACM IH&MMSec,13 Workshop)的主要研究内容有信息隐藏算法、多媒体水印和认证、载体运算域的数字信号处理等。其中，信息隐藏算法的设计首先依赖于载体的选择和预处理；关于多媒体水印和认证的研究则将信息隐藏和数字水印的载体范围从数字图像等常见载体拓展到了包括三维模型在内的新型载体上;载体运算域的数字信号处理涉及到了载体预处理时所用的具体方法，如空间域或变换域等。2013年IEEE图像处理国际会议(IEEE ICIP 2013)的主要研究内容包括图像、音视频和3-D等多媒体的信息隐藏算法和多媒体特征提取和分析等, 这两类研究内容均与载体的选取和预处理有关。最新一届信息隐藏国际会议(IH2012)的主要研究内容包括多媒体安全和其他载体的信息隐藏。我国的第十一届全国信息隐藏暨多媒体安全学术大会(CIHW2013)中关于信息隐藏算法的研究内容也主要集中在非常规载体的分析和预处理上。

藏文作为信息隐藏领域一种新的信息格式，对其研究主要局限于藏文操作系统、藏文信息技术标准、藏文信息处理等几个方面，具体内容集中在藏文编码字符集、术语集、拼音辅助集等的建立。

基于载体的秘密通信技术是20世纪90年代中期发展起来的跨领域的学科，而载体的预处理技术一直是其研究的主要方向。对隐藏载体进行预处理，生成信息隐藏嵌入区域是信息隐藏算法中最重要的研究内容之一。从上述国内外各学术会议中关于信息隐藏的参会论文和研讨情况看，各类载体固有特性的研究对预处理技术有着重要的意义，且数字图像依然是主要的一类载体，而三维模型将是未来主要研究的一类非常规载体。下面就对数字图像和三维模型两类载体的预处理技术的研究现状进行阐述。

1.1数字图像预处理技术研究综述

基于数字图像的信息隐藏技术是信息隐藏学科中重要的

技术分支，是目前应用最广、覆盖范围最大的信息隐藏技术手段。在基于数字图像的信息隐藏技术研究中，信息隐藏区域的生成是关系算法性能的重要因素。信息隐藏区域的生成方法主要包括空间域生成法、变换域生成法以及空间域和变换域联合的生成方法。

空间域算法：作为空间域算法中出现最早、操作最简单且应用最广泛的算法，基于位平面分解理论的LSB算法可以直接替换的方式隐藏较大的数据量，刘红翼等提出的一种 LSB算法具有容量大、运算量小的特点；刘文彬等提出的 LSB隐写替换的消息定位方法则可以对此类算法进行检测；而IH2012的论文中，有学者运用假设检验理论和含秘载体的奇偶感知特性可有效地检测LSB算法所隐藏的隐秘信息，这些研究为藏文信息隐藏中涉及到关于此类算法的抗检测性研究提供了新的待改进方向。张焱等提出的像素值排序和赵彦涛等提出的直方图修改等空间域算法在沿用LSB直接替换的隐藏理念的同时，还提升了鲁棒性，因此也被广泛用于数字图像载体预处理;随后，杨春芳等提出了针对此类算法的检测方法，这也为针对此类算法抗检测性改进的研究提供了重要依据。此外，上述同类算法中的载体子区域划分思想、内容自适应思想等也对本项目基于载体结构特性建立空间匹配模型的机制提供了方法学上的有力支持。

变换域算法：不同于空间域算法直接对载体的空间特性进行修改，变换域预处理方法以修改载体的频率参数来隐藏信息，因此算法的鲁棒性比空间域算法好。在此基础上, 唐燕等又对隐秘信息的检测和恢复进行了研究和改进，实现了几乎无需原始参量的半盲提取。尽管变换域算法不具备空间域算法容量大、运算量小和易操作等优势，但是变换域中的多小波理论因其同时具有对称性、短支撑性、二阶消失矩和正交性等特性成为了信号处理中有明显优势且较常用的方法，在前期研究中利用多小波方法将数字图像载体分块后作为嵌入区域，提高了算法的鲁棒性和不可见性阳，这种方法为在藏文信息隐藏研究中建立基于区域能量的阶梯性分布机制提供了一种研究手段。

混合域算法：较单独运用一种空间域或变换域生成隐藏区域并设计信息隐藏算法来看，基于空间域与变换域联合的信息隐藏算法可以兼有多种算法的性能优势。在基于空间域和变换域联合的信息隐藏算法中，空间域的作用体现在数据嵌入的具体操作方面，因为隐藏的实质就是在当前环境下的空间分量上进行数据修改，利用边缘像素值差分(Edged Pixel Value Differencing，EPVD)将载体换算为若干个像素块，以最大斜角的数据修改作为信息隐藏的具体方法;利用湿纸码和基于LSBM的双层隐写来对载体进行加1嵌入或减1嵌入;另外，国内外许多学者利用调色板理论进行数据嵌入。而变换域在载体预处理中的主要作用是生成满足特定需要的信息隐藏环境(区域)，主要包括变换后的系数分布以及n阶分量子图等。如对RSV颜色空间的V分量做DCT变换，分块后作为嵌入区域;利用视觉显著点技术确定跟踪窗(Regions of Interest，ROI)，在 ROI 的 DCT 系数上嵌入隐藏信息，并指定某个ROI边缘地图脆弱性标识，嵌入到DWT 变换后的含密图像中;前期研究中，研究人员利用自适应颜色迁移理论中la B域对颜色的控制力，消除了 RGB颜色分量的强相关性，并结合GHM能量分区隐藏信息，在不可见性、嵌入信息量和鲁棒性方面均具有较好的表现。

1.2三维模型预处理技术研究综述

潘志庚等将基于三维模型的信息隐藏预处理方法主要分为空间域算法和变换域算法。这也这为藏文信息隐藏研究提供了新的思路和方法。

空间域算法：空间域算法通常具有易嵌入和盲提取的特点，如直接置换载体的几何信息来隐藏数据是三维模型载体信息隐藏最原始、最直接的方法四。为改进此类算法的鲁棒性, 引入仿射不变量是有效的措施，如利用具有连续解析性的仿射不变量优化需要置换的顶点、将稳态锚点通过三角垂心编码解析为聚类元素从而嵌入隐秘信息。此外，基于主元分析的算法也有助于改善空间域算法的鲁棒性，例如可根据主元分析(Primary Component Analysis，PCA)来确定模型的关键位置作为鲁棒区域，并用网格分割法改进鲁棒性和不可见性刼。这类算法也为藏文信息隐藏从载体结构特性进行解析和预处理提供了理论依据。改进型的空间域算法多针对鲁棒性或容量性有所提升，如基于连续解析性的体积矩的盲算法，改善了之前算法对连通性攻击的鲁棒性;通过重排顶点和面片在网格文件中的表示信息，利用表示域内的信息进行嵌入使算法具有良好的不可见性和大容量性，但对相似变换以外的攻击不具有鲁棒性。

变换域算法：三维模型预处理的变换域方法大多利用频谱分析将模型信息参数化，对参数进行少量修改后以隐藏信息，其中，基于小波变换的算法可以对规则和非规则网格模型进行小波域参量修改以嵌入较多信息网。理论上，变换域算法比空间域算法鲁棒性强，但由于三维模型顶点的天然无序性和不规则性，对其进行频谱分析难度大，导致变换域算法实用性目前较低，因此空间域算法依然是比变换域算法更有实用价值的研究方向

2藏文信息隐藏技术研究现状

目前反映藏文信息处理技术最新进展的文献较少，综合以已有的研究成果及相关研究文献，藏文信息处理可划分为

藏语信息处理和藏字信息处理两个层次"3气藏语信息处理包括机器翻译、信息检索、信息提取、文本校对、文本生成、文本分类、自动摘要以及藏文字识别和语音识别的后处理等等;而藏字信息处理包括操作系统以及编码字符集、输入技术、字形描述与生成、存储、编辑、排版、字频统计和藏字属性库等。这些研究基础对藏文信息隐藏技术的发展至关重要，是基于载体预处理的藏文信息隐藏的主要技术来源。鉴于藏文的独特构造，以及藏文的特点，目前对藏文秘密信息的预处理技术一般指置乱和加密算法的选择,而置乱使信息变得杂乱无章难以辨认，可以起到加密与改变信息嵌入特性的作用。可用于藏文信息隐藏的置乱算法主要有Arnold变换、幻方矩阵、 Gray码变换、混沌序列等方法。其中，Arnold变换算法简单且置乱效果显著，使有意义的数字图像变成像白噪声一样的无意义图像，实现了信息的初步加密和信息结构的调整，在嵌入信息为数字图像时可以很好的应用。幻方置乱的思想基于查表思想，基于数字图像的幻方置乱可降低幻方置乱阶数或以图像块进行置乱，实现置乱效果与系统开销的平衡岡。 Gray是一种具有反射特性和循环特性的单步自补码，它的循环、单步特性消除了随机取数时出现重大误差的可能，它的反射、自补特性使得求反非常方便。混沌的优势在于对初始条件的极端敏感和轨迹在整个空间上的遍历性。根据经典的Shannon置乱与扩散的要求，这些独特的特征使得混沌映射成为信息隐藏嵌入算法的优秀候选［4气上述传统的置乱算法一般用于正方形图像处理，而经过改进的Arnold算法可直接用于宽高不等的矩形图像而不必进行正方形扩展，这也将是藏文信息隐藏技术所采用的主要置乱方法之一。

3藏文信息隐藏技术的研究目标、研究内容和要解决的问题

3.1研究目标

面向藏文安全通信的高性能信息隐藏算法是目前藏文信息隐藏技术的主要目标，包括提出性能出色的、适合藏文通信要求的信息隐藏算法；提出一种具有普适性的高性能信息隐藏嵌入区域生成原则和嵌入规则：

基于数字图像的藏文信息隐藏算法：提出至少两种基于数字图像的藏文信息隐藏算法，算法将同时满足面向藏文安全的信息隐藏应用所要求的高不可见性(PSNR > 34.90 dB)、强鲁棒性(抗击大约69%以下的JPEG2000压缩、35%以下的剪切及常见滤波与加噪)、大容量性(基于彩色图像的信息隐藏信息嵌入率> 18%)以及高感知篡改性(检测隐藏数据是否被篡改能力> 95%)。

基于三维模型的藏文信息隐藏算法：提出至少一种基于三维模型的藏文信息隐藏算法。算法将同时满足面向藏文安全的信息隐藏应用所要求的高不可见性(RSNR > 69.94 dB、 En > 70%)、应对一般攻击的强鲁棒性(抗击大约0.10%随机加噪、50-times Laplacian平滑、50%均匀重网格化以及均匀简化等)、大容量性(相对理想的RSNR，嵌入率> 29%)以及低复杂度(根据载体模型几何信息量而变化)。

普适性信息隐藏嵌入区域生成原则和嵌入规则：利用载体图像能量和复杂度特性，提出基于能量性和复杂度的藏文信息隐藏区域生成原则和嵌入规则，将适应于所有对数字图像处理后有能量区别的图像处理方法，指导设计者利用能量与鲁棒性、复杂度与不可见性的对应关系，研究出同时满足不可见性和鲁棒性的信息隐藏算法。

3.2研究内容

藏文信息隐藏区域生成原则与规则研究：数字图像信息隐藏技术的研究核心集中在隐藏区域和嵌入规则的设计上, 藏文信息隐藏算法的设计方法和思路就是在选定藏文信息隐藏区域以及制定好信息隐藏规则后，按照一定的顺序将两者进行合理的组织，所以研究藏文信息隐藏区域生成原则以及信息隐藏规则是重点。

基于数字图像的藏文信息隐藏算法研究：隐藏算法是基于数字图像的信息隐藏技术的研究核心，需按照嵌入域进行划分，对基于空间域和基于变换域的信息隐藏算法分别进行研究，提出单独基于空间域、单独基于变换域以及两者联合应用的数字图像信息隐藏算法。

基于三维模型的藏文信息隐藏算法研究：首先对三维模型的结构特性和能量特性进行研究，再根据载体模型的特性找出对应的预处理方法。在研究基于空间域和基于变换域的信息隐藏算法的基础上，提出改进型的三维模型信息隐藏算法。主要用于提升载体有效嵌入容量和降低载体视觉失真度。

载体与藏文秘密信息的一致化方法研究:基于上述研究基础，生成结构和能量差异化子区域，再将藏文秘密信息按照拼音属性进行解析生成信息序列。再利用优化算法使得预处理后的载体信息和藏文秘密信息的解析编码获得最大一致化，从而提高算法性能。

3.3需解决的关键问题

综合已有的研究，在藏文信息隐藏技术方面，目前需要解决的问题有以下几个方面：

(1)信息隐藏区域与嵌入规则设计：在具有什么性质的区域内应用什么样的规则进行藏文信息隐藏才可以解决“不可见性与鲁棒性的对立、容量性与抗分析性的对立”问题，是藏文信息隐藏研究领域的关键技术之一。需找出隐藏区域的性质与信息隐藏性能的关系，提出面向藏文信息传输的信息隐藏区域选择的原则与方法；给出在具有具体性质的嵌入区域中的藏

文信息隐藏嵌入规则的制定原理和方法；提出大量的藏文信息数据转换思想与方法，以提供形式多样的信息隐藏嵌入规则。

数字图像载体预处理方法：①多小波理论在载体预处理中的应用。对于数字图像经过多小波变换后所具有的特殊性质，找出多小波变换后数字图像所具有的能量特性与基于数字图像信息隐藏算法性能之间所遵循的规律已有学者进行研究。②颜色空间的性能分析与应用选取。RGB、CMYK、 laB、YUV以及HSx颜色空间，应用方法以及应用各有优劣势。该技术的应用难点在于为颜色空间在藏文信息隐藏的应用提出完备的应用方案，因为这些颜色空间在藏文信息隐藏技术中的应用目前非常少，应用优劣还处于实验验证阶段，没有理论验证的支持。

三维网格模型载体预处理方法：骨架抽取和内切球解析技术在藏文信息隐藏算法中的应用。这种方法不涉及顶点数量及坐标的改变和拓扑关系的修改。难点在于寻找一个理想的仿射不变量作为辅助参数以弥补算法对缩放攻击的脆弱性。

藏文的置乱与遗传优化算法：有的藏文字处理系统把藏文看成是由30个辅音、4个元音、3个上加字、5个下加字共42个藏文字符组成的，而有的则认为由其他数量的字符组成。基于对藏文中加字对发音的影响规律的研究，利用字符与二进制码的解析规则和置乱与优化技术对信息置乱，达到隐藏信息与载体信息的最大匹配度也是一个技术难点。

4藏文信息隐藏技术研究的新方法

(1)利用载体图像能量和复杂度特性，提出基于能量性和复杂度的藏文信息隐藏区域生成原则和嵌入规则。高能量与强鲁棒、高复杂度与高不可见性的对应关系，从根本上解决藏文信息隐藏算法中不可见性和鲁棒性的对立问题，为面向藏文通信安全的信息隐藏算法的设计给出一种普适性方法。

( 2)根据数字图像信息隐藏嵌入区域的生成原则和嵌入规则，提出新的、高性能的数字图像的藏文信息隐藏算法。算法利用laB等颜色空间转换以及多小波对载体图像进行的处理，生成具有不同能量特性的嵌入区域，从频率域上满足藏文信息隐藏的应用要求；通过对载体图像进行颜色迁移、矢量解析以及环形处理，从数字图像的空间结构上满足藏文信息隐藏的应用要求。

(3)提出满足三维模型结构特性和能量特性的藏文信息隐藏算法。算法利用局部高度理论和均值偏移理论对载体模型进行预处理，生成具有不同能量特性的嵌入区域，从频域上满足信息隐藏的应用要求；通过对载体图像进行骨架抽取、内切球解析，从空间结构上满足藏文信息隐藏的应用要求。

20211223_61c44b7fa72b6__藏文信息隐藏技术综述