高速公路流量检测数据的预处理方法研究
扫描二维码
随时随地手机看文章
李 阳
(长安大学,陕西 西安 710064)
引 言
交通流数据主要包括车流量、车速、车间距、车辆类型、道路占有率等信息,其一般采用车辆检测器检测,车辆检测器是高速公路交通监控系统中不可缺少的组成部分,在智能交通系统中占有重要的地位,其检测数据的有效利用能很大程度上提高交通监控系统的管理水平。但是,由于车检器的老化程度各有差异,受到路面交通状况、恶劣环境等因素的影响程度也不同,车检器也会存在不同程度的间歇性工作故障,流量检测数据也会有不同程度的缺失与错误,若直接将有质量问题的数据应用到交通流状态辨识及后续应用中,必将对应用结果带来不良影响,甚至直接影响科学决策的正确性 [1]。因此,为获得高效精益化的交通流数据,数据筛选与修补显得尤为重要。目前,错误数据的判别算法中的阈值方法、基于交通流机理的方法应用较为广泛,修补算法中加权平均法、BP 神经网络等方法也均有应用[2]。而本研究采用的阈值法与交通流理论相结合的数据筛选方法,与已有的方法相比筛选规则更加精细,筛选流程更加清晰有据,且数据修补算法较为简便易懂,便于实际运用[3]。本文通过设计科学合理的算法对高速公路车检器流量检测数据的质量给予评估,过滤掉错误的数据,并再此基础上将错误数据修补成较为真实的数据,为车检器检测数据在ITS 应用领域发挥更好与更大的效能提供基础[4]。
1 流量检测数据的筛选
车检器检测数据表现了高速公路的交通运行状态特征, 可提供总交通量、大中小分车型交通量、车辆占有率、速度等参数。其中,占有率、总交通量与速度间具有密切的联系(在交通流量较小的情况下,单位时间内通过检测器的车辆数较小,且由于车速较高,导致时间占有率比较低。随着交通量增加,单位时间内通过检测器的车辆数增加,而且车速有所降低,因此检测器被车辆占用的时间增加,时间占有率会显著增加。当出现交通拥挤时,通过检测器的交通量虽然可能降低, 但由于车速明显下降,使得时间占有率仍然处在一个较高的水平。)当检测数据中三者的关系符合其正常关系时,总交通量符合真实值,反之,则可认定其错误。然而,在判断总交通量正确的情况下,并不能反映出分车型流量的正误,如图 1 所示。当分车型流量与总流量之间有一条数据不符合实际情况,那么此条数据就为错误数据。
1.1 总交通量的筛选方法
利用占有率、交通量与速度之间的密切联系,把交通流三参数作为一个整体考虑,有利于更好地利用其内在的规律进行筛选。表 1 是交通流三参数九种不同情况取值的组合,通过对这些组合的分析,可以对交通流三参数做一个基本的判断,筛选出明显错误的数据[5,6],其中,v 代表车检器采集到的速度值,o 表示车检器采集到的占有率,q 表示车检器采集到的总流量。
通过上述研究可得,除了被认为数据错误的 5 种情况被直接过滤掉外,另外 4 种情况将进一步制定判别方法判断流量检测数据是否为真实值或错误值,本研究主要运用阈值法,阈值筛选是指交通量、速度和占有率不能超过一定的阈值。
针对交通量不为零的情况(情况 8 和情况 9,在交通低峰时期,车速快,车辆检测器有时会出现灵敏度不够的情况,占有率就会显示为零),可通过最大阈值法排除检测交通量数值超过道路通行能力的情况。道路通行能力是指道路上某一地点、某一车道或某断面处,单位时间内可能通过的最大的交通实体(车辆或行人)数,估算单车道的道路通行能力的公式为 [7]:
根据道路通行能力的估算,定义交通量的取值范围 q的合理范围为:0 ≤ q≤ C·T/60·f。其中:C为道路通行能力(veh/h); v 为小客车的行车速度(km/h);T为数据采集的时间间隔(min),一般为 5min;l0为车头最小间隔 ;lc为小客车的长度(km);la为车辆间的安全间距(km);f为修正系数,一般取 1.3~1.5。
针对交通量为零,占有率约为 1的情况,可通过前 5分钟和后 5 分钟的数据判断是否出现停车或拥堵状况,如果前后三项数据基本一致则正确,否则将此条数据视为错误数据。针对交通量和占有率均为 0 的情况,可能是因为凌晨流量较低,也可能是数据传输中断造成丢失。这里可以对不同天数同一时段的交通流量的数据进行比较,如果前后两天的流量接近 0,则数据为真实值 ;否则为错误数据。
1.2 分车型流量数据的筛选方法
将总流量有错误的数据过滤掉后,需要判断分车型流量数据是否有错误。当总流量为真值时,分车型流量的和与总流量相比相差过大也是不对的。分车型流量的筛选通过以下公式判断:
其中:qi 为分车型流量的值(i=1,2,3,分别表示大、中、小型车的检测流量值);Q 为总交通量 ;δ% 为设定误差,通常根据车检器的精度参数进行设定。
如果总交通量的值与分车型流量的和之间的相对误差在规定范围内,可视为数据为真实值 ;否则本条数据错误,需要过滤掉。
2流量检测数据的修补
将保留下来的车检器流量检测数据(包括小、中、大型车和总流量的检测数据)根据残缺度,还原成完整度为 1 的数值,作为车检器全天正常工作时检测到的数据。车检器一天中某缺失时段的总交通量的修补值根据对应缺失时段的前15 天的总交通量检测数据与后 15 天的总交通量检测数据计算
得出,公式如下:
其中:kn 为车检器第n 天缺失时段的总流量修补值。针对大、中、小、型车的检测数据的修补方法,与总流量数据的修补方法相同。
结 语
本研究利用阈值法和数理统计知识对车检器流量检测数据的错误数值的筛选提供了思路和依据,并将其修补为正确性高,完整率为 1 的检测数据。该方法的使用可以为高速公路管理部门提供质量更好的流量检测数据,使车检器数据发挥出更好的效能。