中國儲能網訊:
摘 要 實車動力電池的健康狀態(tài)(state of health,SOH)評估存在數據質量差、工況不統(tǒng)一、數據利用率低等問題,本文面向階梯倍率充電工況構建多源特征提取及SOH估計模型。首先,通過數據清洗、切割、填充,獲取獨立的充電片段;其次,基于不同電流階段計算容量,實現(xiàn)原始數據利用率達96.9%,并與單獨限定SOC范圍計算容量的方法相比,誤差降低48.1%以上;然后,從當前工況、歷史累積兩個維度提取多個健康因子,對于當前工況特征值,通過灰色關聯(lián)度及干擾性隨機森林重要度分析雙重篩選。對于歷史累積特征值,利用Spearson相關性分析和核主成分分析方法(kernel principal component analysis,KPCA)降低信息冗余;最后,對門控循環(huán)單元網絡模型(gated recurrent unit,GRU)引入注意力機制和龍格庫塔優(yōu)化算法(Runge Kutta optimizer,RUN),建立RUN-GRU-attention模型,基于實車運行數據集與現(xiàn)有5種模型進行對比,實驗結果表明,無論是包含單階段還是多階段電流的測試樣本,優(yōu)化模型的估計精度更佳,誤差不高于0.0086,并且隨著充電循環(huán)次數增加表現(xiàn)出良好的誤差收斂性,可有效預測SOH波動趨勢。
關鍵詞 實車動力電池;階梯倍率充電;健康狀態(tài)估計;多源特征提取;龍格庫塔優(yōu)化算法;機器學習
隨著電動汽車的大規(guī)模普及,精準評估電池健康狀態(tài),對續(xù)航預測、確保運行安全、及時更換電池具有重要意義。目前對電池健康狀態(tài)的定義主要是基于容量或內阻,其估計方法大致分為直接法和間接法。其中直接法即通過實驗直接測量,并計算與標稱數值的比值,這種方法測試周期長、不支持實車場景在線估計。間接法又包含模型分析法、數據驅動分析法。其中,模型分析法分為三類:①經驗模型,基于SOC-OCV曲線、SOC估計多項式、優(yōu)化半經驗老化模型等方法估算電池健康狀態(tài);②等效電路模型,通過測量內阻或交流阻抗譜,基于最小二乘法、濾波器觀測器等算法建立等效電路模型用以描述電池系統(tǒng)特征;③電化學模型,通過量化內部電化學反應過程,根據活性物質消耗等信息估計電池SOH。模型分析法可解釋性強,但辨識求解過程復雜導致在線計算損耗大,并且信號異常或噪聲干擾會給估計結果帶來較大誤差。數據驅動法忽略電池內部變化,包含“提取特征-處理特征-建立評估模型”三大環(huán)節(jié),由于其泛化性強、計算簡單、適應在線的特點,逐漸成為評估SOH的廣泛研究方法。
在提取特征方面,陸楠等、Guo等基于直接參數法提取不同寬度區(qū)間電壓平均值、區(qū)間容量、電流/溫度時間積分值、電壓/電流曲線最大斜率等參數作為SOH特征值;陳吉清等基于微分參數法進行容量增量分析,提取IC曲線峰值、電壓位置、面積、斜率等共計8個特征值,又由于這類分析方法容易受噪聲影響,因此Schiffer等、Wang等通過S-G濾波、小波濾波、高斯濾波等方法對特征值進行加強處理;Richardson等基于行為參數法提取電壓、電流、溫度分布特征,打破傳統(tǒng)提取特征局限于恒流充放工況的限制。在特征處理方面,陳媛等、趙旭、Ma等采取Pearson或Sperman系數計算特征值與SOH之間的線性相關性。在模型評估方面,目前的主流模型有高斯回歸模型、支持向量機、神經網絡、決策樹等,近年來,不少學者利用智能算法或集成算法對模型進行參數優(yōu)化和性能改善。例如朱振宇等建立CNN-GRU、CNN-LSTM混合神經網絡用于估計電池SOH剩余壽命,對比基線模型,模型的精度顯著提高;Sun等提出基于耳廓狐算法(Fennec Fox)優(yōu)化混合極限學習機(HELM)的電池SOH估計模型,可在多工況和較少訓練樣本條件下保持較高估計精度;Javaid等提取放電數據特征,構建深度神經網絡模型(DNN),并基于遷移學習算法實現(xiàn)對其余電池的SOH快速估計。
然而,實車動力電池SOH評估仍然面臨以下問題:一是實車數據由于設備受限或運行噪聲干擾,普遍存在采樣頻率低、關鍵數據缺失或異常等現(xiàn)象;二是不同于實驗室在統(tǒng)一工況下測得的循環(huán)壽命實驗數據,實際充放電工況受駕駛員行為影響變得復雜,盡管采集的原始運行數據量龐大,但傳統(tǒng)基于限定荷電范圍內提取數據樣本的方法,在實車充放電起止荷電狀態(tài)隨機的條件下,提取到的統(tǒng)一工況片段數量較少,且未能充分考慮電流對容量的計算誤差;三是實車采樣頻率普遍在10 s及以上,數據稀疏問題導致容量增量等方法極易錯失特征峰值。同時,目前提取SOH特征值僅考慮當前工況狀態(tài),忽略挖掘歷史損傷累積特征信息。此外,僅通過線性相關性分析無法確保特征的典型性,并且采用過多的特征值建模可能存在信息冗余,導致模型估計精度降低。
鑒于此,本文提出一種適用于階梯倍率充電工況的實車動力電池健康因子提取和SOH估計方法。首先,通過數據預處理獲取較為統(tǒng)一、完整的充電片段;其次,兼顧樣本數目和數據質量,基于不同電流階段獲取容量樣本;然后,從當前工況、歷史累積兩個維度提取SOH健康因子,分別開展灰色關聯(lián)度、隨機森林雙重篩選及KPCA降維處理;最后,構建RUN-GRU-attention模型實現(xiàn)SOH估計,一方面設計實驗驗證本文容量計算方法的有效性;另一方面在單階段和多階段電流樣本集上,與現(xiàn)有5種模型對比,驗證了所提方法的適用性。
1 實車數據預處理
本文數據來源于廣東某批電動汽車實際運行數據,采樣時間為2022年1月—2023年2月,采集間隔為20 s,每輛車采集車輛、驅動電機、可充電儲能裝置三部分數據,包含數據時間、車速、車輛狀態(tài)、總電壓、總電流等24項數據類型。由于受到行駛工況不穩(wěn)定或噪聲干擾等問題影響,原始數據存在較多缺失和異常等問題,下面以1#車輛為例進行詳細的預處理說明。
1.1 異常數據清洗
異常數據包括車輛狀態(tài)匹配異常、時間匹配異常、數據重復或超限。清洗異常數據的步驟如下:①利用邏輯判別刪除重復或無效數據、糾正匹配錯誤數據;②利用四分箱型圖剔除超限值數據。最終修改并刪除異常數據721幀,剩余有效數據43489幀。
1.2 充電片段切割
由于行駛工況復雜,制動回收電量使得電流正負交替變化大,難以完整提取行駛片段。因此以充電數據為重點,將其切割成較為統(tǒng)一完整的工況片段,步驟如下:①篩選充電狀態(tài)(車輛狀態(tài)為熄火、充電狀態(tài)為充電、電流<0);②以6 min為閾值初次切割;③合并缺失時間較長的充電片段;④刪除采樣時間過短(<2 min)的片段。經處理,1#車輛的有效充電片段共328個。
1.3 缺失數據填充
數據在采集、傳輸、存儲過程中存在缺失現(xiàn)象,導致采樣周期不均勻,進而引起容量及特征值的計算誤差。缺失數據填充的步驟如下:①查詢缺失段落;②采用均值插補法進行數據補充。經查詢328個充電片段中存在1184段缺失數據,平均缺失時間小于5 min,填充后數據增加5939幀。圖1為第93次充電片段數據填補前后的電流、電壓數據。
圖1 充電片段數據填補前后電流、電壓對比
2 充電片段數據分析
2.1 充電深度分析
如圖2所示,充電深度受用戶行為影響表現(xiàn)較為隨機,起始SOC多分布在50%以下,終止SOC多分布在80%以上??梢钥闯鱿噍^循環(huán)老化實驗數據,實車工況非滿充滿放,甚至起止SOC都相差較大。
圖2 充電深度及起止SOC分布
2.2 充電模式分析
1#車輛模式可大致分為以下3種:恒流充電、遞減倍率充電、階梯倍率充電。其中,恒流及遞減倍率充電模式樣本總數占比僅4%。重點關注占比最多的階梯倍率充電模式,圖3(a)作出其電壓-電流-SOC數據分布,可以看出該車輛的4個階梯電流分別在110 A、97 A、46 A、14 A附近(后文簡稱“Ⅰ、Ⅱ、Ⅲ、Ⅳ”階段),4個階梯對應電壓范圍依次是326~357 V、357~368 V、368~379 V、379~380 V,對應的SOC范圍依次是0~67%、67%~80%、80%~97%、97%~100%。進一步對階梯電流類型進行統(tǒng)計,結果如圖3(b)所示,由于充電行為較為隨機,主要存在Ⅰ-Ⅱ-Ⅲ-Ⅳ、Ⅰ-Ⅱ-Ⅲ、Ⅰ-Ⅱ、Ⅰ、Ⅱ-Ⅲ、Ⅱ共6種充電模式,分別占比20.1%、40.6%、5.4%、12.5%、9.8%、8.5%,其余模式僅占3.1%。
圖3 階梯充電模式分析結果
在此基礎上,篩選其中深度充電片段(充電深度≥80%),作出其電流-SOC數據分布,如圖4所示。從圖中可以看出存在3種異常電流分布情況:一是低荷電狀態(tài)的電流波動(SOC低于40%);二是倍率突變的電流波動;三是數據填補產生誤差,即缺失數據片段剛好位于電流突變處,人為預處理產生異常電流,第三種情況可以通過優(yōu)化數據填補邏輯來避免,第一、二種電流波動會給容量計算帶來誤差。
圖4 深度充電工況下電流-SOC分布
3 實車動力電池SOH定義與樣本篩選
3.1 實車動力電池容量計算方法
利用式(1)計算實車電池容量:
式中,Q為當前充電最大容量;Δt為前后兩幀數據時間差;I(t)為t時刻充電電流;ΔSOC為SOC變化量。
3.2 容量樣本篩選
以往的研究大多限定SOC范圍計算容量,依照這種思路,分別選取ΔSOC≥15、ΔSOC≥30、ΔSOC≥45、ΔSOC≥60計算當前充電最大容量,圖5作出容量數據分布箱型,從樣本數目、離散度、累積里程回歸度三個角度評價容量數據,結果見表1??梢钥闯?,當ΔSOC≥15增大至ΔSOC≥60,樣本量減少60%;箱型圖中上下線距離、箱體長度都在減小,對應極差、四方位差減小,說明隨著ΔSOC減小,容量數據分布變異性變?。挥捎诶鄯e里程可間接表征電池老化程度,因此建立當前充電最大容量與累積里程的回歸模型,結果表明隨著ΔSOC增大,模型決定系數R2先降低后增加,其中ΔSOC≥30時,兩者線性相關性最低。不難看出,當選取的SOC范圍較小時,信號噪聲或電流波動導致當前容量的計算誤差較大,但當充電深度較高時又會導致訓練樣本量不足。此外,以上計算方法未考慮電流不一致對容量造成的計算誤差。
圖5 不同計算方法下容量數據分布箱型
表1 不同計算方法下容量數據評價指標對比
剔除倍率突變時電流異常波動階段數據,同時限定充電倍率類型和起止荷電狀態(tài),分別在45%~65%、70%~80%、85%~95%、97%~100%SOC區(qū)間內計算Ⅰ、Ⅱ、Ⅲ、Ⅳ四個電流階段對應的當前充電最大容量,其容量數據分布箱型圖及指標如圖5和表1所示,可以看出:Ⅳ階段的中位值容量數據幾乎是其余階段的兩倍,這是由于Ⅳ階段電流對應SOC在97%以上,SOC變化緩慢導致計算誤差較大;Ⅲ、Ⅳ階段容量數據的極差和四方位差是其他計算方法的3倍以上,并且與累積里程幾乎不存在明顯負線性相關性(R2<0.2);同時,相較Ⅰ、Ⅱ階段,Ⅲ、Ⅳ階段的數據樣本數目減少40%以上。由此說明,Ⅲ、Ⅳ階段對應容量數據樣本個數少、集中度差、與累積里程線性相關性弱,不宜作為容量計算條件。此外,所有方案中,Ⅰ階段計算容量的數據集中度和與累積里程線性相關性最佳,極差、四方位差、R2分別為0.1653、0.0495、0.6985,說明包含多階梯電流的充電片段,會由于電流不一致或異常波動將導致容量數據的分散和波動。盡管Ⅱ階段的計算容量也避免了電流誤差,但由于充電深度較低,數據長度較短,偶然的噪聲對容量的影響會被放大,其容量數據的集中度和與累積里程的線性相關度與“ΔSOC≥60”方案相當。
綜上分析,傳統(tǒng)限定SOC范圍計算容量的方法,較難同時兼顧樣本數目和計算精度。本文分階段電流計算容量,篩選出Ⅰ、Ⅱ階段樣本共同構建數據模型,這種方法可以最大程度降低電流對容量的計算誤差,同時可以充分利用原始數據,即1#車輛的有效充電片段共328個,篩選出的容量樣本共318個,數據利用率達到96.9%。
3.3 實車動力電池SOH計算方法
由于1#車輛動力電池初始最大容量未知,利用式(2)的計算電池SOH:
式中,Q、Q1分別為當前充電最大容量和初始充電最大容量,ΔSOC、ΔSOC1分別為當前充電和初始充電SOC變化值。
以其前10次充電片段的容量平均值作為電池初始容量,假定初始狀態(tài)電池SOH=1。經計算,Ⅰ、Ⅱ階段初始充電最大容量分別為1.31 Ah、1.35 Ah。
4 實車動力電池SOH特征值提取
本文將從當前工況和歷史累積兩個維度提取SOH特征值:其中,當前工況特征包含電壓相關特征值、電流相關特征值、SOC相關特征值;歷史累積特征包含時間累積特征、工況累積特征、不一致性累積特征。下面以1#車輛進行詳細的特征值提取說明。
4.1 當前工況特征值提取及相關性分析
電壓相關特征值選擇等電壓上升時間HF1、等電壓上升充電容量HF2、等電壓曲線斜率HF3、PDF峰值HF4[計算公式見式(3),式中ksdensity表示概率密度函數]、PDF峰對應電壓位置HF5;SOC相關特征值選擇等SOC區(qū)間電壓標準差HF6、等SOC區(qū)間電壓最小值HF7、等SOC區(qū)間電壓最大值HF8;電流相關特征值選擇恒流充電時間HF9。以Ⅰ階段樣本為例,其等SOC區(qū)間為45%~65%,等電壓范圍為343.6~353.1 V。
進一步,對當前工況特征值進行相關性分析,由于其樣本數量少、規(guī)律不明顯,首先對特征值進行灰色關聯(lián)分析,分辨系數設為0.6,關聯(lián)系數計算結果見表2,以0.8為系數關聯(lián)閾值(高度相關)篩選出HF3、HF5、HF6、HF7、HF8、HF9;其次,采用添加特征干擾的隨機森林模型對以上特征值進行二次篩選。定義特征重要度如式(4)所示,式中,ERROOB1和ERROOB2分別為無噪聲、添加噪聲條件下袋外樣本誤差。設置決策樹數目為100,最小葉子節(jié)點數為8,隨機打亂樣本順序,將80%作為訓練集,20%作為測試集,對10次特征重要度計算結果求平均作為最終結果。逐次改變引入各特征數據的白噪聲比例,計算模型的平均絕對誤差(mean absolute error,MAE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)、方均根誤差(root mean square error,RMSE)、決定系數R2,結果如圖6所示?;谄x程度對Ⅰ、Ⅱ階段樣本特征重要度進行統(tǒng)計,重要度排序熱力圖如圖7所示,可以看出Ⅰ階段樣本當前工況特征值的重要度排序依次是:HF9>HF6>HF3>HF5>HF7>HF8;最終,選擇排名靠前的HF9、HF6、HF3、HF5作為Ⅰ樣本的當前工況特征值。依照相同思路,篩選HF9、HF6、HF5、HF7作為Ⅱ樣本的當前工況特征值。
表2 當前工況特征值灰色關聯(lián)度計算結果
圖6 對各特征值引入不同噪聲后模型誤差指標對比
圖7 當前工況特征值隨機森林重要度計算結果
4.2 歷史累積工況特征值提取及相關性分析
時間累積特征包含累積里程(HF10)、循環(huán)充電次數(HF11)。其中,累積里程可通過實車數據實時采集,循環(huán)充電次數可通過式(5)計算,式中SOCi,START和SOCi,END為某次充電片段起止SOC。工況累積特征包含低放電截止電壓次數(HF12),即統(tǒng)計放電截止電壓低于15%總電壓的次數;不一致性累積特征包含:累積電壓不一致性(HF13)、累積溫度不一致性(HF14)。其中,累積電壓不一致性即單體最高和最低電壓最大差值的累積,見式(6)所示,式中Ui,dmax和Ui,dmin為同一時刻電池單體最高和最低電壓;累積溫度不一致性即單體最高和最低溫度最大差值的累積,見式(7)所示,式中Ti,max和Ti,dmin為同一時刻電池單體最高和最低溫度。
易知,歷史累積特征值隨里程增加而單調遞增。利用Spearman相關系數進行相關性分析,結果如圖8所示,可以看出歷史累積特征與容量存在趨向強相關,但部分互相關系數較大,表明特征值間存在較大信息冗余。采用可提取數據高階關系的KPCA方法降低特征值冗余,選取核函數σ2=10000的高斯徑向基核函數,計算相應主成分貢獻率系數及負荷向量V,結果表明Ⅰ、Ⅱ階段歷史累積特征值的第一主成分貢獻率均超過99%,最終根據式(8)計算特征值HF15,以此替代5個歷史累積工況特征信息。最終,1#車輛Ⅰ、Ⅱ階段樣本的SOH特征向量分別為{HF3,HF5,HF6,HF9,HF15},{HF6,HF7,HF9,HF5,HF15}。
圖8 歷史累積特征值與容量的Spearson相關系數
5 實車動力電池SOH估計模型構建
5.1 基于循環(huán)神經網絡的實車動力電池SOH估計模型
循環(huán)神經網在處理當前樣本的同時,會接受前一刻隱層狀態(tài)信息,因此對于電池健康度這類具有顯而易見時間序列特性的數據,循環(huán)神經網絡更具處理優(yōu)勢,其中的典型結構為長短期記憶網絡(LSTM)和門控循環(huán)單元網絡(GRU)。
5.1.1 長短記憶網絡(LSTM)
LSTM網絡結構如圖9(a)所示,引入記憶結構C完成線性信息傳遞,并將非線性信息輸出給隱含層ht,該過程引入輸入門it、遺忘門ft、輸出門ot。計算過程如式(9)~式(13)所示,式中,下標t和t-1表示當前和上一時刻,ct和圖片分別為t時刻內部狀態(tài)和候選狀態(tài),xt、ht-1分別為當前時刻的輸入和上一時刻隱含狀態(tài),σ(?)為Losgistic函數。it為輸入門,用于保存當前時刻候選狀態(tài)圖片的部分信息;ft為遺忘門,用于遺忘上一時刻內部狀態(tài)ct-1的部分信息;ot為輸出門,用于輸出當前時刻內部狀態(tài)ct的部分信息給外部狀態(tài)圖片。
5.1.2 循環(huán)神經網絡(GRU)
GRU傳遞結構圖如圖9(b)所示,引入更新門zt來代替LSTM網絡的輸入門和遺忘門,如式(14)、式(15)所示,當zt=0時,當前狀態(tài)ht和前一時刻狀態(tài)ht-1為非線性關系,當zt=1時,兩者為線性關系,式中圖片為當前時刻候選狀態(tài),通過引入重置門rt重置上一時刻部分隱層信息進行求解,如式(16)、式(17)所示。
圖9 LSTM和GRU網絡架構Fi
5.2 GRU網絡優(yōu)化
5.2.1 自注意力機制
傳統(tǒng)GRU網絡對各輸入特征的連接程度相同,這限制了模型對重要特征信息的捕捉和表達,導致信息混淆甚至產生梯度消失。在GRU模型中加入自注意力連接層,采用“查詢-鍵-值”模式來動態(tài)調節(jié)連接權重,實現(xiàn)給予相關性強的特征更大關注度,計算過程如圖10所示。對于輸入向量X,首先將其映射至查詢空間Q、鍵空間K、值空間V,空間維度分別為q×n、k×n、v×n;其次利用查詢空間及鍵空間生成注意力打分函數;最終采用縮放點積運算得到輸出向量Y。
圖10 自注意力模型計算過程Fig. 10 Th
5.2.2 RUN優(yōu)化算法
GRU網絡包含神經元數量、初始學習率、正則化系數等初始參數,其中初始學習率控制網絡的收斂速度,正則化系數和隱藏節(jié)點數決定網絡復雜度和擬合度。表3列出12種初始參數設置方案,圖11繪制不同方案下SOH的估計結果,灰色區(qū)域表示SOH估計結果的波動范圍,可以看出模型結果受初始參數的影響較大,最大差異可達到15%。此外,不同初始參數對模型運行時間也有一定影響,其中方案1訓練耗時最短(2.916 s),方案12訓練耗時最長(11.253 s)。
表3 初始參數設置方案
圖11 不同參數設置的GRU模型對SOH的評估結果
本文采用龍格庫塔優(yōu)化算法(Runge Kutta optimizer,RUN)算法尋找隱藏節(jié)點、學習率、正則化系數最佳組合,算法流程如圖12所示。其中,搜索策略如式(18)所示,式中XRK為四階龍格庫塔系數加權值,ΔX為位置增量,兩者與每個粒子的最優(yōu)位置和當前位置相關。更新策略如式(19)所示,式中,XE、XM、SM分別為種群探索子、種群領導子、搜索策略,r為方向因子,g和u為[0,2]內隨機數,SF為平衡因子,與迭代次數有關;此外,當更新程度較低時,在原有更新策略基礎上,依式(20)產生第二代新的粒子,其中R為方向因子,取值為1、-1、0,μ和ω為與迭代次數相關的自適應因子,Xave為某個粒子所有迭代中的平均位置,Xnew1與Xave和當前全局最優(yōu)解相關。若第二代粒子適應度不佳,同理再依式(21)產生第三代粒子。
圖12 RUN尋優(yōu)算法流程
設置RUN算法種群數目為10,迭代次數為30,種群粒子軌跡如圖13(a)所示,可以看出,受到平衡因子影響,在迭代初期,種群搜索范圍較大,可有效避免陷入局部最優(yōu)值,在末期逐漸縮小搜索范圍,保證模型穩(wěn)定度。圖13(b)標注出某個粒子不同迭代次數的軌跡,可以看出該粒子沿梯度方向搜索,并在5、7、12代通過強化個體質量快速調整方向完成收斂。進一步地,為驗證RUN算法尋優(yōu)效果,與近年來提出的黏菌優(yōu)化算法(slime mould algorithm,SMA)和非洲禿鷲優(yōu)化算法(African vulture optimization algorithm,AVOA)進行適應度對比,限定3種算法相同的種群數目和迭代次數,結果如圖13(c)所示,可以看出SMA算法在搜索初期速度最快,但在后期接近最優(yōu)解時由于振蕩搜索能力減弱出現(xiàn)搜索停滯,最終停留在局部最優(yōu)區(qū)域;AVOA算法由于僅根據最佳群體信息更新,忽略個體信息,導致收斂速度較慢,迭代末期才接近最優(yōu)解;RUN算法在25代搜索到最優(yōu)解,適應度和收斂性均表現(xiàn)最佳。
5.3 RUN-GRU-attention模型構建
引入attention機制合理分配特征學習權重,引入RUN算法對GRU網絡部分初始參數進行尋優(yōu),最終構建RUN-GRU-attention模型,算法流程和模型參數設置(1#車輛)如圖14所示。主要步驟如下:①實車數據預處理。②限制SOC范圍和電流階段計算容量并獲取SOH標簽。③提取SOH特征值。其中當前工況特征值經灰色關聯(lián)度析、隨機森林重要度分析雙重篩選;歷史累積特征值經Spearson相關性分析和KPCA分析進行降維;④基于RUN-GRU-attention算法構建實車動力電池SOH評估模型。對于單階段電流充電片段,直接輸出SOH估計結果。對于包含多階段電流的充電片段,需將不同電流階段對應的SOH估計結果進行加權求和,其中加權系數由不同電流階段訓練樣本估計值的決定系數R2確定。
圖13 RUN算法粒子軌跡及不同優(yōu)化算法適應度曲線對比
圖14 RUN-GRU-attention模型流程
6 實驗結果與討論
6.1 容量樣本計算方法與模型估計結果分析
為了驗證容量樣本計算方法對模型估計精度的影響,基于1#車輛數據,設計4種方案進行實驗,為保證結果可比性,所有方案均采用相同的特征值提取方法并使用RUN-GRU-attention模型,電池初始容量均為各方案前10次充電片段的容量平均值,除了特征值具體數值及RUN算法獲取的最優(yōu)初始參數組合不同外,其余參數設置相同。訓練集和測試集樣本數目為4∶1。采用MAE、MAPE(mean absolute percentage error,平均絕對百分比誤差)、RMSE、R2評價模型估計精度。SOH估計結果見表4和圖15所示,其中方案4在兩個電流階段計算容量,因此包含兩個電流階段的SOH真值和估計值,誤差指標為兩個電流階段樣本的綜合統(tǒng)計結果。
表4 基于不同容量樣本篩選方法的SOH估計結果比對
圖15 不同容量樣本計算方法的SOH評估結果
從圖中可以看出不同容量樣本計算方法得到的樣本數目和SOH真值不同,當充電深度從60%下降至15%時,樣本數目減少近50%,較高的充電深度導致訓練樣本嚴重不足,方案3的誤差指標和模型回歸度最差;方案1雖然較方案2樣本數目更多,但數據區(qū)間內異常電流波動較多,導致計算容量數據離群點多(例如第291次和300次),一定程度上降低了模型精度;方案2避開了倍率突變階段,樣本數量和容量數據集中度較為均衡,模型精度稍高于方案1和方案3;方案4在方案2的基礎上,進一步增加訓練樣本數目,有效平衡樣本質量和樣本數目,得到較高的估計精度。
6.2 現(xiàn)有模型估計結果分析
基于1#、2#車輛運行數據(訓練集和測試集樣本數目均為4∶1),與LSTM、GRU、GRU-attention、SMA-GRU-attention、AVOA-GRU-attention模型進行SOH估計比對,原始數據信息及模型參數見表5。為排除運行隨機性的影響,對10次實驗的估計結果和運行時長取平均,每次實驗計算的誤差指標為兩個電流階段樣本的綜合統(tǒng)計結果。
表5 原始數據信息及模型參數
不同模型估計結果如圖16和表6所示。估計精度方面,LSTM和GRU模型屬于記憶網絡,擅長抓取數據時序特征,對SOH變化趨勢能較完整表達,但隨著充電次數的增加估計誤差逐漸增加,例如1#數據集第293次、2#數據集第790次充電片段后,估計值偏離真實值的程度逐漸變大,并且出現(xiàn)估計延遲或異常振蕩,這一現(xiàn)象在2#數據集上表現(xiàn)更明顯;LSTM模型精度略低于GRU模型,這是由于在處理并非過于復雜的序列數據時,同樣訓練樣本數目下,包含權閾值更多的LSTM模型容易出現(xiàn)過擬合現(xiàn)象;GRU-attention模型由于引入注意力機制,強化特征值權重分配,對突變數據的變化趨勢的表征更精確,但由于網絡初始參數隨機生成,導致部分測試樣本的每次估計結果差距較大;SMA-GRU-attention、AVOA-GRU-attention、RUN-GRU-attention增加了網絡初始參數自動尋優(yōu)模塊,其中SMA-GRU-attention、RUN-GRU-attention模型精度提升較大,AVOA-GRU-attention模型精度提升程度較弱,這一現(xiàn)象在1#數據集上表現(xiàn)更明顯。根據表5可知SMA算法和RUN算法所求的最優(yōu)參數組合相近,但與AVOA算法尋優(yōu)結果差距較大,而AVOA-GRU-Attention模型估計精度明顯低于其余兩種模型,是因為隱藏節(jié)點數目過低導致網絡沒有學習到足夠信息產生欠擬合。綜合來說,RUN-GRU-attention在兩個樣本集上誤差指標和模型回歸度表現(xiàn)最佳,以1#樣本數據為例,MAE、MAPE、RSEM指標相較GRU模型分別降低了52.9%、53.4%、56.0%,相較GRU-attention模型分別降低了38.3%、38.5%、44.0%,相較AVOA-GRU-attention分別降低了36.6%、35.9%、38.7%,相較SMA-GRU-attention模型分別降低了21.1%、21.9%、25.7%,決定系數R2相較以上模型分別提高了22.1%、11.4%、7.8%、2.5%。
圖16 不同模型在單階段電流樣本上SOH評估結果
表6 不同模型在單階段電流樣本上SOH評估誤差對比
計算耗時方面,同樣以1#樣本數據為例,GRU模型運行時間比LSTM模型節(jié)省約63%;SMA-GRU-attention、AVOA-GRU-attention、RUN-GRU-attention模型運行耗時較長,其中尋優(yōu)模塊占總運行時長的97%以上,去除尋優(yōu)模塊后與GRU-attention模型運行時長相當,考慮到網絡訓練完成后一段時間無需重復訓練,因此增加尋優(yōu)模塊不限制模型應用。此外,相較依賴于“隱喻”優(yōu)化器的群智能優(yōu)化算法,RUN算法采用無隱喻種族尋優(yōu)模式,以“微分方程迭代求解”方式代替煩瑣的仿生搜索過程,與SMA算法和AVOA算法相比尋優(yōu)更加精準高效,運行時長分別降低了41.4%、24.0%。
上文在兩個數據集的單階段電流樣本集上,對不同模型的估計精度進行了對比分析。1#、2#數據集測試樣本數目分別為64個、317個,其中包含多階段電流的樣本數目分別為30個、138個,根據圖14的計算流程,若包含多階段電流樣本,則根據訓練集R2進行加權求和得到最終SOH估計值,計算方法如式(22)所示。例如對于1#數據集的Ⅰ、Ⅱ階段訓練樣本,RUN-GRU-attention模型的R2分別為0.971和0.907,即Ⅰ階段樣本訓練集估計精度略高于Ⅱ階段樣本,因此認為Ⅰ階段估計值對最終SOH估計結果貢獻更高。不同模型的估計誤差見表7和圖17,可以看出,由于2#數據集的樣本數目較多,相較1#模型的估計誤差更低。綜合來看對于多階段充電片段,RUN-GRU-attention仍表現(xiàn)出良好的估計效果,MAE、MAPE、RSEM指標分別不超過0.0067、0.0072、0.0086,R2高于0.9128,同時隨著充電循環(huán)次數增加RUN-GRU-attention模型誤差收斂性更佳,可有效適應對容量再生和波動趨勢,具備更高的應用價值。
表7 不同模型對包含多階段電流樣本的SOH評估誤差對比
圖17 不同模型對包含多階段電流樣本的SOH評估結果
7 結 論
圍繞實車電池健康狀態(tài)評估面臨數據質量低、缺乏有效樣本、特征不典型、模型精度有待提高等問題,本文基于RUN-GRU-attention模型建立了一種可適用于階梯充電的實車動力電池SOH估計模型,主要結論如下。
(1)針對階梯充電工況分階段電流計算容量,實現(xiàn)原始數據利用率達96.9%,并與單獨限定SOC范圍計算容量的方法相比,可實現(xiàn)誤差指標降低48.1%以上,決定系數R2提高25.9%以上,該方法可以同時兼顧樣本數目和數據質量。
(2)從當前工況、歷史累積兩個維度提取實車動力電池SOH特征值,對于非線性相關的當前工況特征值,聯(lián)合灰色關聯(lián)度分析和干擾性隨機森林重要度模型進行雙重篩選;對于高度線性相關的歷史累積特征值,利用Spearson相關性分析和KPCA分析降信息冗余,最終篩選出5個特征值作為模型輸入向量。
(3)對傳統(tǒng)GRU模型引入注意力機制合理分配特征權重,利用RUN算法自動獲取網絡最優(yōu)的隱藏單元數目、初始學習率和正則化系數組合,構建RUN-GRU-attention模型實現(xiàn)實車動力電池SOH估計。利用兩輛實車運行數據集,分別在其單階段、多階段電流的測試集上,與其余5種模型進行對比,實驗結果表明RUN-GRU-attention模型估計精度更高,MAE、MAPE、RSME、R2指標分別優(yōu)于0.0071、0.0075、0.0086、84.1%,并且隨著充電循環(huán)次數增加表現(xiàn)出良好的誤差收斂性,可有效預測SOH波動趨勢。