高可靠并行星载计算机软件容错技术研究
扫描二维码
随时随地手机看文章
引言
星载计算机的研究方向是高性能、重量轻和体积小并具 有低功耗和信息自主容错功能,这种高可靠的计算机软件容错 技术方向的研究。本文针对星载计算机软件容错技术与系统的 可靠性的关键技术做简单的概括。
1传统的计算机软件容错技术
传统的计算机软件容错技术需要具有多样性的冗余解决 计算机软件本身发生的故障问题,技术的核心是完成某功能 而可能的多种方法,这些方法如果同时能够实现,对实现的 这些功能开始同样的输入,输出时使用表决的机制进行判断, 输出的正确性或者是可以接受的结果,这就能达成容错的根 本目的。
多样性的技术,多版本的支持一般来说会采用比较简单 的方法,但同时,也会为软件系统增加负载,负载会使任务响 应速度变慢,花费很大的代价解决故障,最后得出的容错效 果却并不理想,尤其对高可靠并行星载计算机系统,并不能 提出更好的环境适应性。
2星载计算机概述
星载计算机具有重量轻、造价低、研制时间短和体积小 灵活发射的优点。同时,由于星载计算机的体积和重量都有 严格的数据要求,星载计算机系统就需要具有强大的集成功 能。由于并行星载计算机的运行空间的特殊性,宇宙空间具 有一定的辐射问题,使星载计算机系统发生故障,发生故障后, 如果不能及时修复,会损坏元器件,使星载计算机系统发生 瘫痪。
要克服宇宙空间的恶劣环境,提高星载计算机使用的高 可靠性,要注意三个方面的问题。第一、星载计算机多采用抗 辐射元器件;第二、星载计算机可进行外置的屏蔽措施;第 三、星载计算机注意应用容错技术实现对系统的改善。其中 第一和第二点实现起来造价高,并不符合星载计算机“快、省、 好”的基本原则。而应用第三种方法,既可以解决星载计算 机在恶劣环境下容易出故障的问题,又可以使星载计算机软件 的应用系统提高使用的高可靠性。星载计算机的系统灵活性 高,应用冗余的计算机结构容错技术使星载计算机实现稳定 可靠的运行。下面为大家介绍一种星载计算机软件容错技术, 分析其高可靠性。
3建立星载计算机的高可靠性
星载计算机 CPU-A 由 CPU-a、b、c、d 组成。CPU-a、b、 c加电同时运行,三者输出结果应该一致,如果不一致就要转 入程序进行诊断工作,CPU的哪里出现故障,切除该组件继 续运行,再次检查重构,三组变成两组时继续运行,如果输 出结果仍然不一致,系统不能有效判断,则将b组与c组也 进行切除处理,启用备用d组,由此系统结构可以得出结论,a、 b、c三组中,只要有两组正常工作,星载计算机CPU-A就可 以保持正常的工作,所以要构成三选二的系统,而d组则与其 它a、b、c三组形成了备份系统,保持d组正常状态,星载计 算机CPU-A就可以保证正常的工作状态。d组作为冗余的部 分与a、b、c三组之间形成并行的结构,图1所示为星载计算 机CPU-A的可靠性示意图。
星载计算机软件系统CPU-A组与CPU-B组共同工作,互为冗余的备份。当CPU-B组出现故障时,CPU-A组就可 以替代CPU-B组工作,同样的在CPU-A组发生故障的时 候,CPU-B也可以替代CPU-A进行正常的工作。CPU-A组与 CPU-B组是并行相联的结构。总线SSB适配器看起来发生故 障单点,由于内部存在的冗余系统,所以具有十分强大的可靠 性,可以将整体与其它部件的构成看成是串联的结构。
计算CPU-A是由CPU-a、b、c三组构成的三选二软件 系统,通过三选二的软件系统进行计算,为了方便计算,可 以设定CPU-a、b、c、d相同的可靠度,Ra=Rb=Rc=R质Ri,通 过公式的计算可以得出Rs=3Rt2-2Rt3, CPU-d组与其它三组具 有并联关系。即:
而系统具有的可靠性可以根据以下公式推算:
4星载计算机软件的容错方法
目前,我国星载计算机的容错方法有硬件冗余、EHW等。 所谓硬件冗余:例如备用替换与三模冗余等,都是采用静态 冗余实现的容错方法,多为显式的冗余。我国对星空探测的 智能技术水平取得飞速的发展,星载计算机的设计对航天器 智能与环境适应性都提出了更高的要求,提出新的智能容错 技术,EHW就是可进化的硬件容错技术。EHW容错技术作 为一种新兴的智能动态容错方法,利用进化的算法进行搜索, 实现基本思想的利用,满足计算机电路的预期功能进行可编 程器件配置。
EHW的容错技术是可以实现在线、实时的硬件改变进行 故障屏蔽工作,而且还具有十分强大的自主性与环境适应能力, 可以保持长期的无人操作情况下在复杂的星空环境进行星载 计算机软件容错操作。世界各国的研究机构都在做EHW的 容错方法研究,以英国和日本的研究更早,研究更深入。而 美国已把EHW容错方法设为重点的研究项目应用在航天技术 领域。目前EHW容错技术的研究工作只是处于初级阶段,但 每年国际都有EHW的国际学术会议进行广泛的交流,我国空 间技术研究所等多家单位也在对EHW进行进一步的研究。
5高可靠并行星载计算机软件容错技术结构
EHW容错技术应用的进化算法作为群体算法,使EHW 容错技术的结构原理也同为群体并行结构。图2所示就是容 错并行进化的结构框图。
图2中,每个可编程的器件都可以实现星载计算机多个 可编程器件的进化使用,进化的结果是配置在一个器件上的 使用,保证一台计算机的工作,而编程器的进化有具体的计 算方法。
计算单元做为初期的种群,而种群的大小可以设定为N。 将种群中每条染色体进行编码工作,映射在可编程的器件上得 现配置的数据结论,将N条配置的数据下载于N个可编程器 件里。运算单元会产生M路的激励信号,将信号输入到可编 程器件中,通过电路读取进行评价,如果评价值能够满足电 路的应用,进化就可以顺利完成,如果不能满足电路就要转入 下一个步骤。这个步骤即为下一代种群的结构,实现EHW容 错群体概念,这是一种十分高效的并行星载计算机容错方法, 但这种结构仅可以作为EHW容错技术原理结构存在,实际的 应用还是要体现在冗余度过大和硬利实际利用率过低等问题 产生的成本太高,计算机硬件复杂造成的不实用。
并行结构的冗余度要比传统的多模冗余大,与传统多模 冗余容错比较,并不具有太大的优势,使并行结构的实用性不 强。
通过上面的分析可以得出结论,容错技术大大提高了我 国星载计算机软件容错技术的可靠度,规定时间内,可靠度 能够达到设计要求,由此证明,容错技术是保证提高星载计 算机软件高可靠度重要途径
6结语
本文通过介绍高可靠并行星载计算机软件容错技术,提 出了星载计算机的高可靠度并行等特点,又提出了星载计算机 的容错方法,通过EHW容错方法的并行结构分析,提高了星 载计算机软件容错技术可靠度的实行,是适用星载计算机容 错设计的结论。
20211121_619a059529558__高可靠并行星载计算机软件容错技术研究