自动机在文本嵌入链接图形存储策略中的应用
扫描二维码
随时随地手机看文章
引言
基于Web浏览器的操作平台是采用B/S结构实现的。但 在实际文字编版中,数学公式、化学符号、生物图本、音乐乐 谱等特殊非文本符号的存储嵌入极为困难。本文讨论采用编 码嵌入法链接原始图形对象的实现技术与方法,引入自动机 技术实现了编码在文本中的识别问题。
1自动机理论的发展与原理
自动机的结构理论是自动机抽象理论的进一步发展。结 构理论研究的重点是自动机的综合、由元自动机构造自动机以 及对输入和输出通道传递的元信号进行编码的方法。
由于设计新型电子计算机的迫切需要,数字自动机的结 构理论得到迅速的发展。通用电子数字计算机可以看作更广 泛的数字自动机中的一类。数字自动机的结构理论涉及布尔代 数、命题演算、谓词演算和信息论的有关问题。数字自动机的 结构理论与数字自动机的综合问题直接相关,包括抽象综合、 组合综合、结构综合、部件综合和可靠性综合。1938年C.E.香 农就用布尔代数解决继电网络的组合综合,后来用于电子计算 机逻辑网络的综合。20世纪40年代苏联学者B.H.舍斯塔科 夫解决了数字自动机的结构综合和部件综合问题。到50年代 S.C.克林和E.F.穆尔解决了抽象综合问题,后来D.D.奥芬卡 姆夫和F.霍恩又进一步发展了抽象综合。J.von诺伊曼解决了 可靠性综合问题。到60年代苏联学者B.M.格罗什科夫把抽 象综合和结构综合结合起来,使结构理论的表达形式适合于 解决任何数字自动机的综合问题,建立了数字自动机综合的 一般数学理论。
由元自动机构造自动机的方法主要有两类:第一类“级 联方法”,即用串联、并联和混联方法把若干台元自动机联成 一台自动机,它具有树状、星状、网状等多种拓扑结构。级联 方法的逆问题是级联分解问题,自动机的级联分解与大系统 的分解等价。有限自动机的级联分解问题与有限自动机的半群 结构有关,可以根据半群的结构理论和群的整除性理论解决。 已经证明有限自动机级联分解定理。第二类“邻域连接方法”, 现已发展成为细胞自动机理论,在一致结构的大规模集成电 路和并行计算机中得到广泛应用。
2解决方案
以试题为例。系统中试题全部采用文本方式存储,试题 中的公式、图形等元素用特殊的编码代替。例如:
“计算姬广伽"+。脚的值:()”
我们存储为:
“计算 @A010001 的值:()”
其中“@A010001”表示图形X"巴/伽)/(1+ e')dt在数 据库中的编码值,A01表示学科编码,0001为该图形编号。
3数据模型
数据存储结构如图1所示:
图1数据存储结构E-R图
4算法模型
在试题读取时,采用状态机实现如图2所示。
图2中0状态向屏幕输出;1状态进入图形识别状态;2 状态识别学科门类头字符;3状态开始选取学科门类;4状态 读取链接文件并显示在屏幕上。
图2嵌入式内容识别状态图
5程序算法描述
算法如下:
Char s[]=” 5.计算:@A010001 的值:()
Int i=0 ;
Char f[8];
各状态算法如表1所列。
6结语
综上所述,利用有限自动机,简化了实现过程,解决了 图形(化学符号、生物图本、音乐乐谱等)在网页上的显示问题。 算法简化了分析过程,实现了 JSP语言应用的技术难题,也为 我们解决相关难题提供了新的思路,应用前景良好。