软交换性能测试技术
扫描二维码
随时随地手机看文章
软交换作为NGN/VoIP网络中的核心设备,具有接口丰富、协议复杂、性能要求高等特点,因此也成为设备制造商和运营商进行实验室测试或网络验收测试的关注焦点。软交换一般处于网络的中心位置,与PSTN互通需要SIGTRAN接口,与中继媒体网关互通需要H.248控制接口,与IP终端互通需要sip/H.323/mgcp/H.248接口,与其他软交换互通需要sip/sip-I/sip-T/BICC接口。这其中的任何一个接口出现问题,都将成为制约系统性能的瓶颈,严重的时候甚至造成NGN/VoIP网络瘫痪。因此,软交换性能的高低,成为运营商考察NGN系统好坏与否的关键指标。
基于上述原因,如何在一个复杂的网络环境中,有效地验证软交换设备的各个接口功能的性能及稳定性,成为NGN/VoIP测试领域一个重要的研究课题。思博伦通信长期关注于通信领域的测试技术,凭借强大的研发团队和多年的现网测试经验,为客户提供完善的软交换系统测试方案,成为运营商和设备商NGN 领域测试的必然选择。
2 软交换常见测试方法
软交换作为一个复杂的核心控制设备,可供选择的测试方法也多种多样。常见的测试方法按不同分类方式,有以下几种:
●按组网方式分:单节点全包围测试、多个网元互通测试、端到端系统测试
●按测试的功能分:C4汇接局功能测试,C5本地端局功能测试
●按测试指标分:峰值压力测试,最大同时会话能力测试,稳定性测试,长时间通话测试,过载保护测试,CDR准确性测试。
下面我们对这些不同的测试方法进行详细介绍。
2.1 单节点全包围测试
单节点全包围测试一般用于验证单个设备是否存在性能瓶颈。通过测试仪表仿真该节点周围的所有接口,模拟出该设备周围的所有网络环境,从而杜绝其他设备对测试环境造成的影响,精确验证被测设备的性能。
图1所示是一个对软交换做全包围测试的例子。仪表通过Sigtran(M2UA或者M3UA)协议仿真信令网关,通过H.248协议仿真中继网关,通过sip/H3.23/H.248/MGCP等协议仿真IP Phone,然后模拟从PSTN往IP网络侧的大量语音呼叫,实现对中间软交换设备的性能测试。
图1 软交换全包围示意图
2.2 多个网元互通测试
这种测试一般用于在一定的、可控的环境内,对由多个节点组成的有限系统做性能测试,用于发现各个网元之间的互通问题,确定在互操作过程中是否有新的性能问题引入。
例如,运营商在部署VoIP网络时,有可能会采用A厂家的软交换和B厂家的接入网关设备,如何确认这两家的设备在一起互通时没有性能上的问题?这时可以采用仪表仿真接入网关下面的模拟线终端,往网关和软交换侧发起呼叫,再由软交换将呼叫路由回网关再到终端。通过这种方式,由仪表发起成千上万的呼叫经过接入网关和软交换,可以有效地验证这两种设备在互通的时候有没有性能和稳定性问题。
2.3 端到端系统测试
端到端系统测试一般用于对一个完整的系统进行功能及性能验证,或针对运营网络的分布式测试。如图2所示,一般将仪表部署于系统或网络中的不同分支节点,仿真系统中涉及的各种不同终端,然后不同终端之间发起大量的呼叫进行测试。通过这种方式,不仅可以验证系统性能,甚至可以对网络端到端的时延、网络传输质量进行测试。
图2 端到端系统测试示意图
2.4 C4汇接局功能测试
软交换作为NGN网络中的控制设备,既有汇接局的功能,也有做本地端局的功能。当软交换作为汇接局使用时,一般是用于汇接PSTN或者长途过来的语音话务,或者用于汇接其他局过来的话务,因此测试汇接局功能时,有以下几种组网方式:
●通过仪表的E1/STM-1接口仿真PSTN端局,通过传统的No.7信令发起从PSTN往VoIP侧的语音呼叫(见图3)。
图3 仿真PSTN端局测试软交换C4功能
●通过仪表的IP接口仿真信令网关+中继媒体网关,通过Sigtran协议发起从PSTN往VoIP网络的语音呼叫(见图4)。
图4 仿真SG+TG测试软交换C4功能
●通过仪表仿真另外一个软交换实现的汇接局,通过sip-T/BICC协议发起从一个汇接局到另外一个汇接局的语音呼叫。
这3种方案中,第1种方案在测试软交换的同时,可以验证SG和TG的性能。而第2和第3种方案,因为直接通过IP接口仿真流量,可以实现非常高的性能,另外可以省去大量的E1或者STM-1线路连接的麻烦。
2.5 C5本地端局功能测试
当软交换作为NGN网络中的本地端局使用时,一般用于控制终端用户的话务接续,并提供各种补充业务。因此,测试端局功能时,需要仪表通过模拟接入网关下的用户或者IP终端用户,实现本地话务的仿真。图5所示,在实际测试时,可以根据情况,配置基于sip,H.323,Megaco或者MGCP各种协议的终端设备,实现同种协议终端之间或者不同协议之间大话务量的呼叫测试。
图5 仿真IP终端测试软交换C5功能
2.6 峰值压力测试
峰值压力测试一般用于验证被测设备在系统最高负荷的时候每秒能够处理呼叫的能力,往往通过BHCA或CPS两种指标来考察被测设备,即系统每小时或每秒处理呼叫的个数。实际测试时,一般通过仪表每秒钟产生一定的呼叫量来精确验证系统能力,通过更改呼叫保持时间和呼叫间隔时间来调整压力,测试时间一般超过1h,甚至达到24h或48h;呼损不能超过万分之一。
2.7 最大同时会话能力测试
最大同时会话能力测试一般用于测试被测设备在某一个特定时间能够同时保持的会话数目。相对于BHCA和CPS,最大会话保持数也是一项重要的指标。这种测试一般通过仪表仿真一定数目的呼叫,然后将呼叫保持时间设置的足够长,观察在一定的时间段内,这些同时保持的话务有没有掉话、异常中断等各种情况。体现在呼损数值上,不能超过万分之一。
2.8 稳定性测试
稳定性测试一般用于验证系统长时间稳定运行,无故障处理话务的能力。一般通过仪表仿真占系统一定负荷的话务量(如系统最大能处理CPS的80%),然后将每个呼叫的保持时间设置为现网平均呼叫保持时间(如2~3min),要求系统稳定运行至少24h,有时甚至超过48h以上,呼损率不能超过万分之一。
2.9 长时间通话测试
长时间通话测试一般用于验证系统处理超长时间通话的能力。这类测试一般不要求很高的性能,往往使用仪表仿真几十路的语音呼叫,将每一路的呼叫保持时间设置为至少24h以上,观察测试过程中有无掉话、异常中断、语音异常等现象。另外,还会观察软交换对于这种超长话单产生的精确程度、有无话单丢失、时长计费是否准确等现象。
2.10 过载保护测试
软交换一般都具有过载保护功能,当话务量超过最大负荷或者系统CPU负荷已经到达100%时,主动拒绝后续的呼叫,避免过量的呼叫占用系统资源造成系统瘫痪。过载保护测试用于验证软交换系统遇到突发话务流量超过系统最大负荷时,有效控制话务,避免系统瘫痪的能力。这类测试一般通过仪表逐级、逐量地仿真系统话务负荷,例如分别仿真占系统80%,100%,120%的话务量,要求系统在80%,100%负荷的时候呼损率不应超过万分之一,在120%话务量的时候,可以允许有大量的呼损,但是每秒钟成功接续的呼叫数应该维持在系统可以处理的最大CPS左右,另外不能有系统瘫痪、板卡重启、消息没有响应等现象发生。
2.11 CDR准确性测试
CDR准确性测试用于验证软交换系统在处理大量呼叫的同时,生成的话单的准确性。一般通过仪表仿真大量的呼叫,维持一段时间(例如几个小时以上)。然后在测试结束后,对比仪表统计给出的话单总数和软交换系统给出的话单总数,检查软交换有无掉话单的现象。一般要求话单差错率不能超过万分之一。
3 关键参数统计及性能测试结果分析
软交换设备因为其接口多、协议丰富、性能高等原因,成为NGN测试领域中最为复杂的一个被测设备,因此测试涉及的统计指标也多种多样。如何从复杂的测试数据中,过滤观察关键的测试参数、有效地分析性能测试结果的好坏、检查出系统存在的性能瓶颈等,将是本节中我们将要探讨的内容。
(1)BHCA/CPS/呼损率等关键指标的统计与分析
在软交换性能测试中,BHCA/CPS与呼损率是两个很重要的相互关联的指标。我们进行大量的测试就是为了找出在没有呼损或者呼损率小于规定值(如万分之一)的时候系统最大能支持的BHCA/CPS。一般使用2分法去精确查找出系统的无故障平衡点。这时候如果加上软交换系统的CPU和内存占有率的观察,则可以帮助测试人员更加方便地判断系统负荷是否已经到了瓶颈。一般随着仪表产生的BHCA/CPS的逐渐增高,系统在接近性能瓶颈的时候,往往伴随着 CPU占有率或者内存占有率的突然陡增,并接近最大值;如果这个时候呼损大量增加,则可以很确定地判断是由于系统负荷到了瓶颈造成大量呼损而并不是由于网络等其他原因。
(2)信令时延统计对于性能测试的重要性
信令时延是考察软交换系统对于信令消息处理快慢程度的一项指标,在查找系统无故障平衡点的时候,该指标的统计也是非常重要的一项考察内容。对于VoIP信令来讲,信令时延主要包括Response Time,Post Dial Delay,Call Setup Time,Tear Down Time几项具体的指标。
●Response Time
从终端发起呼叫建立请求消息到收到临时响应消息之间的时间间隔。以sip为例,一般是指Invite消息和100 Trying消息之间的时延。
●Post Dial Delay
从终端发起呼叫建立请求消息到收到振铃响应消息之间的间隔。如果是Sip信令,一般是指Invite消息和180 ringing消息之间的时延;如果是模拟线信令,一般是从摘机拨完号码到收到回铃音之间的时延。
●Call Setup Time
从终端发起呼叫建立请求消息到收到呼叫建立确认消息之间的间隔。Sip信令中一般是指Invite消息和200 OK消息之间的时延。
●Tear Down Time
从终端发起会话释放请求消息到收到对端拆线确认消息之间的间隔。Sip信令中一般是指Bye消息和200 OK消息之间的时延。
信令时延统计是用于判断和分析软交换性能的一个重要辅助手段。因为这些时延的统计指标往往代表着用户实际通话过程中的切身感受。例如,Post Dial Delay代表着用户拨完号码之后需要等多久听到回铃音,如果这些指标超过标准值,则意味着软交换的服务质量已经下降,此时就算系统能够正常建立呼叫,呼损率为零,但是其实当前负荷下的软交换性能已经不能满足实际运营的要求。
运营商和标准组织往往对于信令时延都有着相应的规范要求,比如中国规范要求轻载情况下Post Dial Delay要小于1s,重载情况下要小于2s。因此,在确定软交换系统无故障平衡点的同时,观察信令时延统计非常重要。
图6是一个软交换性能测试过程中CPS和PDD指标的统计示意图。我们可以看到,一开始在CPS比较小的时候,Post Dial Delay指标比较稳定。当CPS数值爬升到一定阶段时,Post Dial Delay开始明显上升。当CPS=200达到峰值时,PDD=3S。我们在测试的时候如果不综合考察各项指标,往往会简单认为该系统的最大CPS指标为 200。然而实际情况是,200 CPS时候的PDD指标已经达不到运营要求,因此实际、合理的系统最大CPS应该为PDD<2s时候的CPS值,即180 CPS左右。
图6 CPS和Post Dial Delay关系示意图
从这个例子我们也可以看到,综合考察各项重要指标对于性能测试分析的重要性。
(3)故障定位分析
当软交换测试碰到故障(如大量异常呼损、消息没有响应等问题)时,我们需要有效的手段来定位分析原因,究竟是软交换设备工作异常,还是承载网络不稳定造成消息丢失?这种情况下,我们可以采取几种辅助定位的手段来做进一步的分析。
●通过修改呼叫模型来分析故障原因
以上一节提到的CPS VS PDD的例子为例,当系统负荷增加,Post Dial Delay大幅增长的时候,我们可以适当降低话务量(例如减到原来的一半), 再观察Post Dial Delay的统计值是否随之大幅降低。如果有明显降低,说明消息响应缓慢确实是跟软交换设备的话务负荷有关系;如果该值没有明显降低,说明消息响应缓慢可能是跟网络有关系,例如网络传输时延过大造成消息响应缓慢。
●通过仪表提供的网络层参数的统计来观察网络情况的好坏
在仿真呼叫发送信令及语音的同时,Abacus可以测试并统计如下参数:丢包、时延、抖动、乱序,并且可以输出统计值对应不同时间段的图表。当测试碰到问题时,可以通过上述这些参数的统计,判断网络是否出现问题。例如,图7所示的One Way Delay的统计图可以看到,仪表统计到14:10和14:30的时候,分别出现One Way Delay大幅增长的情况,如果这时出现系统呼损的情况,我们就有理由相信系统的呼损很大可能是由于网络原因造成。还可以结合丢包、抖动、乱序等其他因素,综合判断是否问题是由于承载网性能不好引起的。
图7 Abacus仪表提供的One Way Delay VS time统计图
●利用仪表的抓包监控功能分析信令流程判断故障原因
Abacus仪表在仿真呼叫的同时,可以将有问题的呼叫过程中的信令全部记录下来。另外,思博伦公司还提供一款名为Clearsight的监控仪表,可以将流经IP网络的所有VoIP呼叫全部监控并记录下来。这样,结合Abacus,Clearsight以及软交换本身提供的信令日志功能,可以很方便地检查并对比仪表输出的消息日志和网络上捕捉到的消息日志以及软交换的消息日志,从而发现究竟错误消息或者消息丢失等故障是产生于哪一个节点。