藏文信息隐藏技术综述
扫描二维码
随时随地手机看文章
引言
安全、有效的信息传输对国家安全、社会稳定和人民安 居乐业至关重要。网络和多媒体技术的发展,使得信息传输的 速度和数量正以惊人的增量发展。然而,信息传输的便利在方 便人们的同时也给信息安全带来了隐患,同时也为基于数字载 体的秘密信息传输提供了广阔的研究空间。目前,基于载体的 秘密信息传输是信息安全领域的一个方兴未艾的研究热点。而 基于载体预处理的藏文信息隐藏技术将为信息安全领域提供 一些新的数字信息共享和传输理念,特别是藏文的预处理规 律、在数字信息中的隐藏规律等,将有助于涉藏秘密通信技 术的发展,并可以对民用和商用领域中涉及到藏文内容的传输、 共享、存储和提取的通信过程起到安全保护、版权保护及完 整性认证的作用,并对国家涉藏领域的网络舆情监控、国内外 涉藏敏感信息标注和情感色彩认知起着至关重要的作用。
在藏文信息隐藏技术方面,目前主要涉及的技术有关键 字识别、字符识别和提取、韵律认知、语义角色标注、文本资 源挖掘和语料抽取等,并以此为基础进行置乱优化。
1国内外信息隐藏技术研究现状
信息隐藏一直是信息安全领域中保障隐秘信息安全传输 和数字信息版权的重要手段,也是近年来国内外学者研究的 热点之一。最新的一届ACM信息隐藏和多媒体安全会议ACM IH&MMSec,13 Workshop)的主要研究内容有信息隐藏算法、 多媒体水印和认证、载体运算域的数字信号处理等。其中,信息隐藏算法的设计首先依赖于载体的选择和预处理;关于多 媒体水印和认证的研究则将信息隐藏和数字水印的载体范围 从数字图像等常见载体拓展到了包括三维模型在内的新型载体 上;载体运算域的数字信号处理涉及到了载体预处理时所用的 具体方法,如空间域或变换域等。2013年IEEE图像处理国 际会议(IEEE ICIP 2013)的主要研究内容包括图像、音视频 和3-D等多媒体的信息隐藏算法和多媒体特征提取和分析等, 这两类研究内容均与载体的选取和预处理有关。最新一届信 息隐藏国际会议(IH2012)的主要研究内容包括多媒体安全和 其他载体的信息隐藏。我国的第十一届全国信息隐藏暨多媒体 安全学术大会(CIHW2013)中关于信息隐藏算法的研究内容 也主要集中在非常规载体的分析和预处理上。
藏文作为信息隐藏领域一种新的信息格式,对其研究主 要局限于藏文操作系统、藏文信息技术标准、藏文信息处理等 几个方面,具体内容集中在藏文编码字符集、术语集、拼 音辅助集等的建立。
基于载体的秘密通信技术是20世纪90年代中期发展起 来的跨领域的学科,而载体的预处理技术一直是其研究的主 要方向。对隐藏载体进行预处理,生成信息隐藏嵌入区域是 信息隐藏算法中最重要的研究内容之一。从上述国内外各学术 会议中关于信息隐藏的参会论文和研讨情况看,各类载体固有 特性的研究对预处理技术有着重要的意义,且数字图像依然 是主要的一类载体,而三维模型将是未来主要研究的一类非 常规载体。下面就对数字图像和三维模型两类载体的预处理 技术的研究现状进行阐述。
1.1数字图像预处理技术研究综述
基于数字图像的信息隐藏技术是信息隐藏学科中重要的
技术分支,是目前应用最广、覆盖范围最大的信息隐藏技术手 段。在基于数字图像的信息隐藏技术研究中,信息隐藏区域的 生成是关系算法性能的重要因素。信息隐藏区域的生成方法 主要包括空间域生成法、变换域生成法以及空间域和变换域 联合的生成方法。
空间域算法:作为空间域算法中出现最早、操作最简单 且应用最广泛的算法,基于位平面分解理论的LSB算法可 以直接替换的方式隐藏较大的数据量,刘红翼等提出的一种 LSB算法具有容量大、运算量小的特点;刘文彬等提出的 LSB隐写替换的消息定位方法则可以对此类算法进行检测; 而IH2012的论文中,有学者运用假设检验理论和含秘载体的 奇偶感知特性可有效地检测LSB算法所隐藏的隐秘信息, 这些研究为藏文信息隐藏中涉及到关于此类算法的抗检测性 研究提供了新的待改进方向。张焱等提出的像素值排序和赵 彦涛等提出的直方图修改等空间域算法在沿用LSB直接替换 的隐藏理念的同时,还提升了鲁棒性,因此也被广泛用于数字 图像载体预处理;随后,杨春芳等提出了针对此类算法的 检测方法,这也为针对此类算法抗检测性改进的研究提供 了重要依据。此外,上述同类算法中的载体子区域划分思想、 内容自适应思想等也对本项目基于载体结构特性建立空间匹 配模型的机制提供了方法学上的有力支持。
变换域算法:不同于空间域算法直接对载体的空间特性 进行修改,变换域预处理方法以修改载体的频率参数来隐藏 信息,因此算法的鲁棒性比空间域算法好。在此基础上, 唐燕等又对隐秘信息的检测和恢复进行了研究和改进,实现 了几乎无需原始参量的半盲提取。尽管变换域算法不具备 空间域算法容量大、运算量小和易操作等优势,但是变换域 中的多小波理论因其同时具有对称性、短支撑性、二阶消失 矩和正交性等特性成为了信号处理中有明显优势且较常用的方 法,在前期研究中利用多小波方法将数字图像载体分块后作 为嵌入区域,提高了算法的鲁棒性和不可见性阳,这种方 法为在藏文信息隐藏研究中建立基于区域能量的阶梯性分布 机制提供了一种研究手段。
混合域算法:较单独运用一种空间域或变换域生成隐藏 区域并设计信息隐藏算法来看,基于空间域与变换域联合的 信息隐藏算法可以兼有多种算法的性能优势。在基于空间域和 变换域联合的信息隐藏算法中,空间域的作用体现在数据嵌 入的具体操作方面,因为隐藏的实质就是在当前环境下的空 间分量上进行数据修改,利用边缘像素值差分(Edged Pixel Value Differencing,EPVD)将载体换算为若干个像素块,以 最大斜角的数据修改作为信息隐藏的具体方法;利用湿纸 码和基于LSBM的双层隐写来对载体进行加1嵌入或减1嵌 入;另外,国内外许多学者利用调色板理论进行数据嵌入。而变换域在载体预处理中的主要作用是生成满足特定 需要的信息隐藏环境(区域),主要包括变换后的系数分布以 及n阶分量子图等。如对RSV颜色空间的V分量做DCT变 换,分块后作为嵌入区域;利用视觉显著点技术确定跟踪 窗(Regions of Interest,ROI),在 ROI 的 DCT 系数上嵌入隐 藏信息,并指定某个ROI边缘地图脆弱性标识,嵌入到DWT 变换后的含密图像中;前期研究中,研究人员利用自适应 颜色迁移理论中la B域对颜色的控制力,消除了 RGB颜色分 量的强相关性,并结合GHM能量分区隐藏信息,在不可见性、 嵌入信息量和鲁棒性方面均具有较好的表现。
1.2三维模型预处理技术研究综述
潘志庚等将基于三维模型的信息隐藏预处理方法主要分 为空间域算法和变换域算法。这也这为藏文信息隐藏研究 提供了新的思路和方法。
空间域算法:空间域算法通常具有易嵌入和盲提取的特 点,如直接置换载体的几何信息来隐藏数据是三维模型载体 信息隐藏最原始、最直接的方法四。为改进此类算法的鲁棒性, 引入仿射不变量是有效的措施,如利用具有连续解析性的仿 射不变量优化需要置换的顶点、将稳态锚点通过三角垂心 编码解析为聚类元素从而嵌入隐秘信息。此外,基于主元 分析的算法也有助于改善空间域算法的鲁棒性,例如可根据 主元分析(Primary Component Analysis,PCA)来确定模型 的关键位置作为鲁棒区域,并用网格分割法改进鲁棒性和不 可见性刼。这类算法也为藏文信息隐藏从载体结构特性进 行解析和预处理提供了理论依据。改进型的空间域算法多针 对鲁棒性或容量性有所提升,如基于连续解析性的体积矩的 盲算法,改善了之前算法对连通性攻击的鲁棒性;通过重 排顶点和面片在网格文件中的表示信息,利用表示域内的信息 进行嵌入使算法具有良好的不可见性和大容量性,但对相 似变换以外的攻击不具有鲁棒性。
变换域算法:三维模型预处理的变换域方法大多利用频 谱分析将模型信息参数化,对参数进行少量修改后以隐藏 信息,其中,基于小波变换的算法可以对规则和非规则网格模 型进行小波域参量修改以嵌入较多信息网。理论上,变换域 算法比空间域算法鲁棒性强,但由于三维模型顶点的天然无 序性和不规则性,对其进行频谱分析难度大,导致变换域算 法实用性目前较低,因此空间域算法依然是比变换域算法更有 实用价值的研究方向
2藏文信息隐藏技术研究现状
目前反映藏文信息处理技术最新进展的文献较少,综合 以已有的研究成果及相关研究文献,藏文信息处理可划分为
藏语信息处理和藏字信息处理两个层次"3气藏语信息处理 包括机器翻译、信息检索、信息提取、文本校对、文本生成、 文本分类、自动摘要以及藏文字识别和语音识别的后处理等 等;而藏字信息处理包括操作系统以及编码字符集、输入技术、 字形描述与生成、存储、编辑、排版、字频统计和藏字属性库等。 这些研究基础对藏文信息隐藏技术的发展至关重要,是基于 载体预处理的藏文信息隐藏的主要技术来源。鉴于藏文的独 特构造,以及藏文的特点,目前对藏文秘密信息的预处理技 术一般指置乱和加密算法的选择,而置乱使信息变得杂乱 无章难以辨认,可以起到加密与改变信息嵌入特性的作用。可 用于藏文信息隐藏的置乱算法主要有Arnold变换、幻方矩阵、 Gray码变换、混沌序列等方法。其中,Arnold变换算法简 单且置乱效果显著,使有意义的数字图像变成像白噪声一样 的无意义图像,实现了信息的初步加密和信息结构的调整,在 嵌入信息为数字图像时可以很好的应用。幻方置乱的思想 基于查表思想,基于数字图像的幻方置乱可降低幻方置乱阶 数或以图像块进行置乱,实现置乱效果与系统开销的平衡岡。 Gray是一种具有反射特性和循环特性的单步自补码,它的循 环、单步特性消除了随机取数时出现重大误差的可能,它的 反射、自补特性使得求反非常方便。混沌的优势在于对初 始条件的极端敏感和轨迹在整个空间上的遍历性。根据经典 的Shannon置乱与扩散的要求,这些独特的特征使得混沌映 射成为信息隐藏嵌入算法的优秀候选[4气上述传统的置乱算 法一般用于正方形图像处理,而经过改进的Arnold算法可直 接用于宽高不等的矩形图像而不必进行正方形扩展,这也 将是藏文信息隐藏技术所采用的主要置乱方法之一。
3藏文信息隐藏技术的研究目标、研究内容和要解决的问题
3.1研究目标
面向藏文安全通信的高性能信息隐藏算法是目前藏文信 息隐藏技术的主要目标,包括提出性能出色的、适合藏文通信 要求的信息隐藏算法;提出一种具有普适性的高性能信息隐 藏嵌入区域生成原则和嵌入规则:
基于数字图像的藏文信息隐藏算法:提出至少两种基 于数字图像的藏文信息隐藏算法,算法将同时满足面向藏文 安全的信息隐藏应用所要求的高不可见性(PSNR > 34.90 dB)、 强鲁棒性(抗击大约69%以下的JPEG2000压缩、35%以下 的剪切及常见滤波与加噪)、大容量性(基于彩色图像的信息 隐藏信息嵌入率> 18%)以及高感知篡改性(检测隐藏数据是 否被篡改能力> 95%)。
基于三维模型的藏文信息隐藏算法:提出至少一种基 于三维模型的藏文信息隐藏算法。算法将同时满足面向藏文 安全的信息隐藏应用所要求的高不可见性(RSNR > 69.94 dB、 En > 70%)、应对一般攻击的强鲁棒性(抗击大约0.10%随机 加噪、50-times Laplacian平滑、50%均匀重网格化以及均匀 简化等)、大容量性(相对理想的RSNR,嵌入率> 29%)以及 低复杂度(根据载体模型几何信息量而变化)。
普适性信息隐藏嵌入区域生成原则和嵌入规则:利 用载体图像能量和复杂度特性,提出基于能量性和复杂度的 藏文信息隐藏区域生成原则和嵌入规则,将适应于所有对数 字图像处理后有能量区别的图像处理方法,指导设计者利用 能量与鲁棒性、复杂度与不可见性的对应关系,研究出同时满 足不可见性和鲁棒性的信息隐藏算法。
3.2研究内容
藏文信息隐藏区域生成原则与规则研究:数字图像信 息隐藏技术的研究核心集中在隐藏区域和嵌入规则的设计上, 藏文信息隐藏算法的设计方法和思路就是在选定藏文信息隐 藏区域以及制定好信息隐藏规则后,按照一定的顺序将两者进 行合理的组织,所以研究藏文信息隐藏区域生成原则以及信息 隐藏规则是重点。
基于数字图像的藏文信息隐藏算法研究:隐藏算法 是基于数字图像的信息隐藏技术的研究核心,需按照嵌入域 进行划分,对基于空间域和基于变换域的信息隐藏算法分别进 行研究,提出单独基于空间域、单独基于变换域以及两者联 合应用的数字图像信息隐藏算法。
基于三维模型的藏文信息隐藏算法研究:首先对三 维模型的结构特性和能量特性进行研究,再根据载体模型的 特性找出对应的预处理方法。在研究基于空间域和基于变换 域的信息隐藏算法的基础上,提出改进型的三维模型信息隐 藏算法。主要用于提升载体有效嵌入容量和降低载体视觉失 真度。
载体与藏文秘密信息的一致化方法研究:基于上述研 究基础,生成结构和能量差异化子区域,再将藏文秘密信息 按照拼音属性进行解析生成信息序列。再利用优化算法使得 预处理后的载体信息和藏文秘密信息的解析编码获得最大一 致化,从而提高算法性能。
3.3需解决的关键问题
综合已有的研究,在藏文信息隐藏技术方面,目前需要 解决的问题有以下几个方面:
(1)信息隐藏区域与嵌入规则设计:在具有什么性质的区 域内应用什么样的规则进行藏文信息隐藏才可以解决“不可见 性与鲁棒性的对立、容量性与抗分析性的对立”问题,是藏文 信息隐藏研究领域的关键技术之一。需找出隐藏区域的性质与 信息隐藏性能的关系,提出面向藏文信息传输的信息隐藏区域 选择的原则与方法;给出在具有具体性质的嵌入区域中的藏
文信息隐藏嵌入规则的制定原理和方法;提出大量的藏文信 息数据转换思想与方法,以提供形式多样的信息隐藏嵌入规 则。
数字图像载体预处理方法:①多小波理论在载体预 处理中的应用。对于数字图像经过多小波变换后所具有的特 殊性质,找出多小波变换后数字图像所具有的能量特性与基 于数字图像信息隐藏算法性能之间所遵循的规律已有学者进 行研究。②颜色空间的性能分析与应用选取。RGB、CMYK、 laB、YUV以及HSx颜色空间,应用方法以及应用各有优劣势。 该技术的应用难点在于为颜色空间在藏文信息隐藏的应用提出 完备的应用方案,因为这些颜色空间在藏文信息隐藏技术中的 应用目前非常少,应用优劣还处于实验验证阶段,没有理论验 证的支持。
三维网格模型载体预处理方法:骨架抽取和内切球 解析技术在藏文信息隐藏算法中的应用。这种方法不涉及顶 点数量及坐标的改变和拓扑关系的修改。难点在于寻找一个 理想的仿射不变量作为辅助参数以弥补算法对缩放攻击的脆 弱性。
藏文的置乱与遗传优化算法:有的藏文字处理系统 把藏文看成是由30个辅音、4个元音、3个上加字、5个下加 字共42个藏文字符组成的,而有的则认为由其他数量的字符 组成。基于对藏文中加字对发音的影响规律的研究,利用字 符与二进制码的解析规则和置乱与优化技术对信息置乱,达 到隐藏信息与载体信息的最大匹配度也是一个技术难点。
4藏文信息隐藏技术研究的新方法
(1)利用载体图像能量和复杂度特性,提出基于能量性 和复杂度的藏文信息隐藏区域生成原则和嵌入规则。高能量 与强鲁棒、高复杂度与高不可见性的对应关系,从根本上解决 藏文信息隐藏算法中不可见性和鲁棒性的对立问题,为面向藏 文通信安全的信息隐藏算法的设计给出一种普适性方法。
( 2)根据数字图像信息隐藏嵌入区域的生成原则和嵌入 规则,提出新的、高性能的数字图像的藏文信息隐藏算法。 算法利用laB等颜色空间转换以及多小波对载体图像进行的 处理,生成具有不同能量特性的嵌入区域,从频率域上满足 藏文信息隐藏的应用要求;通过对载体图像进行颜色迁移、 矢量解析以及环形处理,从数字图像的空间结构上满足藏文 信息隐藏的应用要求。
(3)提出满足三维模型结构特性和能量特性的藏文信息 隐藏算法。算法利用局部高度理论和均值偏移理论对载体模 型进行预处理,生成具有不同能量特性的嵌入区域,从频域 上满足信息隐藏的应用要求;通过对载体图像进行骨架抽取、 内切球解析,从空间结构上满足藏文信息隐藏的应用要求。
20211223_61c44b7fa72b6__藏文信息隐藏技术综述