基于关联向量机的污水处理软测量模型研究
扫描二维码
随时随地手机看文章
引言
当前,污水排放量随着城市化推进和工农业发展而日益增加。我国近年兴建了大量的污水处理厂,来改善水资源环境,以免其进一步恶化。由于污水处理过程机理复杂,为建立良好的监测机制,保证良好的出水水质,必须及时监控污水处理过程中的水质参数。根据国家相关排放标准,总氮(TN)、总磷(TP)是衡量水质好坏的重要指标,但目前大部分检测由人工完成,存在难以在线测量、时间延迟长、无法实时监控调节等问题。而水质在线检测仪的技术尚不完善,存在检测精度不高、维护困难、设备昂贵等问题。为此,近年来兴起了软测量技术,能够代替硬件仪表进行实时测量,针对污水处理过程中难以测量或暂时不能测量的参数,通过建立某种数学模型,对其进行估计。国外在软测量技术研究方面十分活跃,在化工领域已经取得了可喜的研究成果,而在污水处理领域还处于基础研究阶段。
在污水处理水质指标的软测量研究中,国内外专家提出了多种智能建模方法,如神经网络、支持向量机等,其中以神经网络为建模工具的基于知识的方法研究最为活跃[3]。神经网络法采用经验风险最小化的原则,在样本有限的条件下,学习过程容易陷入过学习、维数灾难、局部最小等境地,而支持向量机的支持向量个数随着训练样本的增大而线性增大,导致在线检测时间更长:而且支持向量机的惩罚因子难以选择合适的值,设置不当容易引起过学习问题。关联向量机(RVM)基于贝叶斯框架构建,其泛化能力优于支持向量机,且其测试时间更短,更适用于在线检测。为此,本文提出引入关联向量机(RVM)这一软测量方法,建立水质中重要指标总氮(TN)和总磷(TP)的模型。
1污水处理工艺
一个典型的污水处理过程如图1所示,该污水处理过程又叫活性污泥法处理过程,它包括初沉池、曝气池和二沉池。初沉池用来除去废水中的可沉物和漂浮物:在曝气池中使污水中的有机污染物与活性污泥充分接触,并吸附和氧化分解有机污染物:二次沉淀池用以分离曝气池水中的活性污泥,并将池中的一部分沉淀污泥回流到曝气池,以供应曝气池赖以进行生化反应的微生物,剩余污泥作为固体废物排出做进一步处理。
2关联向量机
关联向量机是M.E.Tipping提出的跟支持向量机类似的稀疏概率模型,它是在贝叶斯框架下进行的,基于主动相关决策理论,在先验参数的结构中移除不相关的点,从而获得稀疏的模型。同支持向量机(sVM)相比,关联向量机具有以下优点:(1)避免主观设置误差参数:(2)所用的相关向量少于sVM:(3)核函数不用满足Mercer条件,有更大的选择范围。
式(3)表示权值的后验分布由均值μ和:所决定。为了估计权值模型,先要确定估计超函数a的最优值。根据贝叶斯框架,超函数的似然分布可以通过下式计算:
通过求解极大似然分布,可以得到超函数的最优值aMP和gMP。至此,建立了目标值t的模型。那么对于输入值x*,其相应输出的概率分布为:
3基于关联向量机的出水TN和TP预测模型和试验
污水处理过程是一个多变量、多目标、多层次、含海量信息的复杂系统,各种参数之间存在强烈的耦合和关联。在本研究中出水TN选择流量、进水浊度、悬浮物浓度SS及NH4+-N、曝气池氧D0、温度7、酸碱度pH、氧化还原电0RP、混合液悬浮固体浓度MLSS、N03--N及曝气池电导率k、出水悬浮物浓度SS及NH4+-N等13个参数;出水TP选择流量、进水浊度、悬浮物浓度SS及曝气池氧D0、温度7、酸碱度pH、氧化还原电0RP、混合液悬浮固体浓度MLSS、N03--N及曝气池电导率k、出水悬浮物浓度SS等11个参数。
本文采用广州市某污水厂采集的1000组数据进行软测量建模,选取250个样本,经过3g法则预处理后,剩余222个样本,选取200个样本,将其中前170个样本作为训练样本建立模型,后30个样本作为测试样本检验模型的泛化能力,对TN与TP的30个泛化样本的检测结果如图2所示。
从表1可以看出,对比神经网络和支持向量机的建模效果,关联向量机在各项性能上都有提升。基于关联向量机的出水TN模型预测误差平均值0.92,误差最大值2.11,RMSE=1.05;出水TP模型预测误差平均值0.15,误差最大值0.42,RMSE=0.19。其拟合精度高于神经网络和支持向量机建立的模型,体现出关联向量机在小样本情况下具有更好的泛化能力。
4结语
本文基于关联向量机建立了水质中重要指标总氮(TN)和总磷(TP)的模型,实验例证表明,在小样本情况下,基于关联向量机所建立的模型比神经网络和支持向量机建立的模型具有更好的泛化能力,对于进一步实现污水自动化的实时控制有一定的应用价值。