基于谱聚类的退役电池一致性评估方法研究
扫描二维码
随时随地手机看文章
引言
随着国内新能源汽车的迅速发展与普及,大批量新能源汽车上的动力电池将达到使用寿命,面临退役的问题[1]。若退役电池处理不当,其中的Ni、Co等重金属有害物质将污染环境,甚至通过溶解作用,进入并危害人体健康[2]。截至2022年底,我国伴随着新能源汽车报废的退役电池总量已达24.4 GW.h[3]。尽管这些退役电池不能继续应用在电动汽车上,但仍然可以梯次利用在其他领域,如电网侧储能、低速电动车及一些示范项目[4]。梯次利用不仅可以发挥电池的剩余价值,还可以降低动力电池的全生命周期成本,推动电动汽车产业链的健全和可持续发展[5]。
目前,已有大量学者在退役动力电池梯次利用领域开展研究,主要涉及梯次利用安全管理、筛选成组、实际应用和报废回收等[6]。在梯次利用筛选成组方面,文献[7]提出了一种快速测试方法,采用融合Canopy的K—means++聚类对电池进行分选;文献[8]通过分析动力电池的交流阻抗谱,提出基于EIS的电池分选策略,分选后的电池组容量衰减率低于常规方法分选出的电池组;文献[9]基于模糊理论构建了电池综合评价体系,并进行重组均衡实验,验证了该方法可行;文献[10]基于改进的DBSCAN聚类方法,对退役电池进行深度配组,有效提高了电池单体间的一致性。
尽管上述文献通过观察重组后电池的测试状况,验证了其在电池分选中的有效性,但在验证过程中仅考虑了部分参数如容量、电压,并没有测定完整的电池数据,且大多选用算法较为传统,仍存在局限性。
谱聚类是一种不需要假设数据形状、不简化实际问题的聚类算法,不受高维数据特征向量奇异性的影响[11]。考虑到退役电池的一致性分选对于梯次利用的重要意义,本文将对10节拆机18650型动力电池进行多次测试,提取相关特征参数作为数据,并视每组数据由一个电池单体产生。基于谱聚类算法和传统的K—means聚类算法对数据进行聚类,构建混淆矩阵评估并对比同一电池生成的多组数据聚成一类的有效性。
1基于机器学习的电池筛选算法
1.1 K—means算法
K—means聚类算法因其复杂度低,聚类效果较好,已成为目前流行的一种聚类算法。K—means的主要思想是不断更新各聚类中心而达到局部最优的效果。
K—means算法如表1所示[12]。
尽管K—means聚类算法简单、高效,但对于非凸形状数据聚类效果差,对于离群点较敏感。因此引入谱聚类算法,进行聚类对比。
1.2谱聚类算法
谱聚类本质上是一种基于图论的聚类算法,它将每个数据视为图G(V,E)中的点,并通过边的连接关系来刻画数据点之间的相似度[13]。任意两个点连接边的权重值与距离成反比,两点距离越近,权重值越高。
算法的核心思想是通过对数据图进行切割,使得切割后不同子图之间的连接边权重尽可能低,而子图内的连接边权重尽可能高,从而实现对数据的聚类分离。
对于退役电池数据,在进行一致性分选研究时,一般选取至少三个维度以上的特征参数,维度较高。回收的退役电池来源广泛,较大可能有某几组某一项数据与整体偏差较大,对聚类产生噪声干扰,影响聚类结果。而谱聚类能够有效处理非凸形状的聚类结构,具有较强鲁棒性,在处理高维数据和噪声数据方面具有一定的优势。
谱聚类算法如表2所示。
2实验及数据获取
2.1实验仪器及样本
实验基于搭建的MJS-SP250电池恒温测试柜的电池性能评估系统(图1),该系统包括核心设备MJS-SP250电池恒温测试柜、chroma数据采集器及其可用于获取、分析和处理实验数据的配套软件。恒温测试柜可以保证在充放电过程中电池的温度不会发生剧烈变化,从而影响数据的准确性或引发安全问题。chroma数据采集器采集频率为『=1次/s,可采集的数据有电压、电流、电量、总电量和温度等。
实验对象为10节乐金(LG)INR18650MH1退役电池。电池额定电压4.2 V,额定容量3 200 mAh。
2.2实验特征参数的选取
电池一次充放电实验的电压、电流变化如图2所示。由于各退役电池的初始状态如初始电压、电阻、容量等不尽相同[10],在对每块电池进行充放电前,需要对其进行放电实验直至放电截止电压。因此,充放电实验中有意义的数据范围从恒流充电开始到恒流放电结束。本文选用一次标准充放电过程中的恒压充电时间T(s)、半小时电压降U(V)、恒流放电至放电截止电压的放电容量Q(mAh)作为实验特征参数。
2.3实验数据的获取
根据2.2节中选定的三项特征参数,同时结合GB/T 42260—2022《磷酸铁锂电化学性能测试循环寿命测试方法》,制定的实验过程主要包括恒流充电、恒压充电、恒流放电及静置的步骤。具体实验流程如图3所示。
单次实验耗时约4.5 h,能够经历一次完整的电池充放电过程,所测得数据更全面。由于电池内部的化学反应,在静置过程中会出现电压的波动,因此在每次充电前对其进行放电能够保证每次测试的初始状态相同,即电池端电压为2.5 V。
由于电池数量受限,每节电池不循环地重复10次上述实验步骤,最终得到100组数据,将该100组数据视作100个电池单体产生的数据。同一电池单体任一时刻的充放电响应理论上是一致的[7],即由各电池产生的10组数据可视为一致性最好的梯次利用电池组。
本文将用所研究的谱聚类和主流聚类方法K—means聚类对实验数据进行聚类,并根据已知的聚类结果对算法的聚类效果进行评价。
3实验结果
本节主要比较本文研究的谱聚类算法和主流的K—means算法聚类结果的差异。在2.3节提到,考虑到实验数据是由10节电池各做10次实验获取的,在理论上各节电池10次实验数据的一致性是最强的,故预先设定两种算法的簇数k=10,构造混淆矩阵观察聚类的结果与实际结果的差异。
3.1谱聚类
3.1.1分类结果
由于电池数据的大小为10×10,将其编号00、01、…、99,其中尾数相同的表示同一节电池的不同实验数据。基于python的分类结果如图4、表3所示。
从整体上看三维散点图,数据分散,属非球形状。通过谱聚类的各簇大小比较均匀,聚类效果较理想。其中,电池编号#1和电池编号#8产生的10次数据均被完整地分别归类至簇8和簇5。基于图论的谱聚类通过特征向量的线性组合表示数据间相似性,有能力处理非球形数据。同时,尽管从图中可以看出有少许离群数据,但在特征向量分解下过滤了冗杂信息,导致离群数据也很好地适应了簇,并未单独成簇。下面通过混淆矩阵进一步检验其聚类效果。
3.1.2构建混淆矩阵
根据表3,可以先确定电池#1——类别8,电池#2——类别9,电池#3——类别3,电池#4——类别1,电池#5——类别4,电池#6——类别7,电池#7——类别6,电池#8——类别5,电池#9——类别2,再确定电池#0——类别0。
已经获得了每个数据的真实类别和谱聚类的“预测”类别,构建的混淆矩阵如图5所示,用于进一步分析。
3.1.3数据分析
对于一个混淆矩阵,常用精准度(P)、召回率(R)及F1—score(F)来评判聚类效果的好坏[14]。为计算上述指标,有以下4个定义:
True positive(Tp):把正样本成功预测为正。
True Negative(TN):把负样本成功预测为负。
False positive(Fp):把负样本错误地预测为正。False Negative(FN):把正样本错误地预测为负。精准度(P)计算公式:
对于图5的混淆矩阵,计算出的各类别相关指标如表4、图6所示。
为了综合分析谱聚类的聚类效果,采用Micro—average方法计算Micro—precise(MP)、Micro—Recall(MR)、Micro—F1score(MF):
3.2 K—means聚类
3.2.1分类结果
k—means的聚类结果三维散点图如图7所示。整体上看'有两簇(cluster 3和cluster 5)只包含单个数据点'聚类效果并不理想。
3.2.2构建混淆矩阵
按照3.2.1节对k—means聚类结果构建混淆矩阵'如图8所示。
主对角线零元素较多'非主对角元素数量多'该聚类效果欠佳。
3.2.3数据分析
通过k—means聚类计算出的MP=0.14'远差于谱聚类的结果。
数据样本的形状可能是凸形'也可能是非凸形状'谱聚类可以发现非凸形状的簇'而k—means聚类假设数据簇为凸形'因此在处理非凸形的数据样本时,K-means的聚类效果会比谱聚类差。除此之外,若数据样本中存在离群点,即噪声数据,K-means对噪声比较敏感,会大幅影响聚类效果,而谱聚类具有较好的鲁棒性,不易受影响。但是在处理大样本数据时,由于谱聚类的计算复杂度高于K-means聚类,其计算速度会慢于K-means聚类。
4结论
针对退役电池梯次利用的一致性分选问题,本文提供了一种新的解决方案,通过测试乐金(LG)INR18650MH1电池单次充放电实验的数据,基于谱聚类算法,对100个实验数据进行聚类,并通过外部指标构建混淆矩阵,验证了谱聚类在退役电池分选中的有效性、可行性。具体工作如下:
1)基于电池的充放电曲线,从静态和动态性能两方面考虑,选取了三项特征指标:放电容量、恒压充电时间和半小时电压降,作为后续分选的重要依据。
2)依据选取的三项特征指标设计实验,在保证采集到精确数据的同时,电池完成一轮充放电过程。考虑到电池在使用过程中不循环充放电,验未采用循环方式,而采用一次充放电实验,更加贴合实际情况。
3)基于谱聚类、k-means聚类算法和各样本中提取出的三项特征指标数据对退役电池进行分选,谱聚类的簇大小较为均匀,而k-means聚类的簇大小差距较大。由于已知真实的聚类结果,本文通过构建外部指标混淆矩阵来评价聚类效果。由混淆矩阵计算出谱聚类和k-means聚类的准确率分别为0.69、0.14,谱聚类的聚类结果更为准确,也贴近真实结果。这表明,谱聚类在小样本电池数据分选中更具优势。
本文所研究内容是基于簇数指定的情况,对于未指定具体分类情况的电池分选有待进一步探究。