中國儲能網訊:
摘 要 準確估計鋰離子電池(lithium-ion battery,LIB)的健康狀態(tài)(state of health,SOH)對于確保儲能電站的安全穩(wěn)定運行至關重要。然而,現(xiàn)有的數(shù)據(jù)驅動方法通常依賴手工特征提取,并且特征的時間尺度比較單一,很難進行高效且精確的電池健康狀態(tài)評估。為了解決這些問題,提出了一種基于多時間尺度建模自動特征提取和通道注意力機制的健康狀態(tài)估計模型。該模型首先將充電過程信息輸入多個并行的膨脹卷積模塊(dilation convolution module,DCM),從不同時間尺度進行自動特征提取,獲得豐富且全面的特征表示。隨后,不同尺度的特征通過融合后結合門控循環(huán)單元(gated recurrent unit,GRU)提取時間序列的長期依賴關系。模型進一步融入通道注意力機制(efficient channel attention,ECA),對歷史信息進行相關性動態(tài)權重分配,關注顯著特征。最后,在兩個公開數(shù)據(jù)集上驗證了本方法的優(yōu)越性,并與其他常用深度學習模型進行了比較。結果表明,本模型具有較高的SOH估計精度和良好的遷移性,兩個數(shù)據(jù)集上的均方根誤差分別僅為0.0110和0.0095,在跨數(shù)據(jù)集的遷移實驗中均方誤差僅為0.0092。
關鍵詞 鋰離子電池;健康狀態(tài);卷積神經網絡;注意力機制;時間序列
全球積極推進“雙碳”目標的背景下,對穩(wěn)定高效儲能系統(tǒng)的需求不斷上升。鋰離子電池(lithium-ion battery,LIB)以其高能量密度、長效循環(huán)壽命和低自放電特性已成為多種應用中首選的儲能解決方案。但是,隨著使用年限的增長,鋰離子電池性能會逐漸衰退。尤其是當電池容量和功率出現(xiàn)顯著下降時,可能引發(fā)故障甚至造成火災或交通安全事故。因此,精確評估電池的健康狀態(tài)(state of health,SOH)對于保障儲能系統(tǒng)的安全和穩(wěn)定運行尤為重要。
為了提升對電池SOH的估計準確性,業(yè)界提出了多種模型方法,主要包括電化學模型、等效電路模型及數(shù)據(jù)驅動方法。電化學模型通過構建描述電池內部化學反應的詳細機理模型,解釋電池老化過程。然而,這類模型往往涉及復雜的方程和高度耦合的參數(shù),計算復雜度較高,更適用于基礎電化學研究中。等效電路模型則基于電池充放電過程中表現(xiàn)出的關鍵特征參數(shù)(如容量、內阻和循環(huán)次數(shù)等),通過合適的算法構建這些參數(shù)與電池SOH之間的數(shù)學關聯(lián)性。雖然這種方法在理論上能夠提供較高的預測準確性,但實際表現(xiàn)嚴重依賴于所用模型的準確性和假設的合理性。除此之外,由于模型依賴的是對電池物理化學屬性的先驗認知,并容易受到各種環(huán)境和操作條件的干擾,使得它們在預測不同老化狀態(tài)下的電池SOH時常常存在局限性,進而影響其在實際應用場景中的廣泛使用。
基于數(shù)據(jù)驅動的方法,尤其是在近年來迅猛發(fā)展的深度學習領域,通過整合海量數(shù)據(jù),能夠通過集成大量的數(shù)據(jù)來盡可能避免引入復雜的電化學機制,表現(xiàn)出良好的預測性能。因此,這一技術在能源存儲系統(tǒng)中受到了廣泛關注。數(shù)據(jù)驅動的方法通常是分析LIB數(shù)據(jù),提取與SOH相關的健康指標(health indicators,HI)。例如,王琛等基于增量容量分析法,從充電過程中提取容量增量曲線的各項特征如峰值高度、峰值電壓及峰面積作為表征電池老化的健康指標,并通過Pearson系數(shù)驗證了這些健康特征與SOH之間的相關性。Jia等利用改進的麻雀搜索算法(improved sparrow search algorithm,ISSA)優(yōu)化深度極端學習機(deep extreme learning machine,DELM),從隨機局部放電電壓和電流數(shù)據(jù)中提取關鍵HI,并將其輸入到DELM中,以預測隨機負載條件下LIB的SOH。Zhu等從充滿電后的松弛過程電壓曲線中提取了6個統(tǒng)計特征,并采用XGBoost、彈性網和支持向量回歸模型估算涵蓋130個LiNiCoAl和LiNiCoMn商用電池的3個數(shù)據(jù)集的電池容量。Lin等通過對電壓、溫度與增量容量曲線等多個數(shù)據(jù)源進行分析,提取了影響電池老化進程的七個關鍵HI作為輸入。該研究采用多模型融合策略以增強模型整體性能,公開數(shù)據(jù)集上的驗證結果顯示,此方法能夠實現(xiàn)較高的SOH估算精度。
這些現(xiàn)有的數(shù)據(jù)驅動方法在SOH估計問題中確實可行,但也存在明顯不足,即某些關鍵特征提取過程需依賴研究者對電池老化機制的深入了解,且需要進行大量的數(shù)學運算。此外,還需要找到合適的數(shù)據(jù)驅動模型來有效處理從電池循環(huán)數(shù)據(jù)中提取的健康特征。因此,如何在更少或不需先驗知識和較低工作量的情況下提取出可以被適當?shù)腟OH估計模型處理的有效健康特征,是一個持續(xù)的挑戰(zhàn)。一個可能的解決方案是利用機器學習算法的強大學習能力和非線性建模能力,自動從原始電池數(shù)據(jù)中提取特征。例如,李超然等將鋰離子電池在恒流-恒壓充電過程中的電壓、電流、溫度曲線直接作為輸入,應用一維深度卷積神經網絡(convolutional neural networks,CNN)來實現(xiàn)鋰離子電池容量估算,進而獲取SOH。然而,傳統(tǒng)CNN的感受野有限,對長時間序列的學習依賴于更深層次的網絡。Fu等采用了膨脹卷積網絡來進行特征提取,通過調整擴孔數(shù)而不增加卷積核參數(shù)數(shù)量,以獲得更長距離的信息特征,避免了在池化層輸入信息丟失的問題。盡管如此,單一時間尺度的特征提取可能無法全面捕捉到電池老化的不同層次的信息,從而影響SOH估計的準確性與魯棒性。
此外,現(xiàn)有的深度學習模型往往忽略對輸入特征的差異化關注,可能導致未能捕獲關鍵特征或過多地納入無關特征,從而影響模型的性能。作為一種創(chuàng)新的深度學習技術,注意力機制能夠實現(xiàn)對特征的自動權重調整,有效提升模型的特征學習能力,因此受到廣泛關注。毛百海等將自注意力機制(self-attention,SA)與循環(huán)神經網絡RNN結合使用,優(yōu)化了對內在關聯(lián)性強的特征的重視程度,進而顯著提升了SOH估計的預測準確性。Lin等在長短期記憶網絡(long short-term memory,LSTM)模型中引入了一種局部注意力機制,通過一個固定窗口中心化地計算注意力權重,更加集中地關注時序信號中的關鍵局部特征。然而,這些方法主要集中于時序特征間的動態(tài)權重,忽略了特征通道之間的相互依賴性。
因此,為了實現(xiàn)不同時間尺度的自動特征提取和特征融合,本文提出了一種新的基于MDCNN-GRU-ECA融合模型(multiscale dilated convolutional neural networks-gated recurrent unit-efficient channel attention,MDGE)的SOH估計方法。首先采用并行的多尺度膨脹卷積來更好地從電壓、電流等原始電池數(shù)據(jù)中提取不同時間尺度的時序特征,并進行多尺度特征融合。然后通過GRU進一步捕捉序列數(shù)據(jù)中的時間依賴關系,并增強特征表達能力。再利用通道注意力機制顯式地建模不同通道之間的依賴關系,從而提高模型的整體性能。為了驗證所提出方法的有效性,通過兩個公開數(shù)據(jù)集進行了驗證,并與幾種常用的深度學習模型進行了比較,結果顯示MDGE網絡具有更高的SOH估計精度。
這里需要明確的是,本文中的“多尺度”特指建模中的時間尺度,即通過不同時間跨度的數(shù)據(jù)特征提取來提高模型的預測能力。這與傳統(tǒng)物質科學研究中常用的多尺度概念(包括空間尺度,如從原子到宏觀尺度的特征)有所不同。在電池健康狀態(tài)估計中,時間尺度的多樣性對于捕捉電池老化過程中的動態(tài)變化至關重要。
1 數(shù)據(jù)集介紹
1.1 NASA數(shù)據(jù)集
本研究采用的首個電池測試數(shù)據(jù)集來源于美國國家航空航天局(National Aeronautics and Space Administration,NASA)艾姆斯卓越預測中心(Ames Prognostics Center of Excellence,PCoE)。該數(shù)據(jù)集包含同一電池型號、容量均為2 Ah的多個樣本。研究中特別選取了4塊電池的老化數(shù)據(jù),編號分別為B0005、B0006、B0007和B0018。這些電池在1.5 A恒流(constant current,CC)模式下充電至電池電壓達到4.2 V,隨后轉入恒壓(constant voltage,CV)模式,直至充電電流減至20 mA。放電過程采用2 A的恒定電流進行,直到電池電壓分別降至2.7 V、2.5 V、2.2 V及2.5 V。電池的可用容量通過此恒流放電過程獲得。如圖1(a)所示,電池的容量隨著老化逐漸下降。當電池的容量衰減至額定值的70%(即1.4 Ah)時,被認定為達到了壽命終點(end of life,EOL)。圖1(b)、(c)展示了電池在第1、50、100、150個循環(huán)期間的充電電流與電壓圖像,充電參數(shù)的變化揭示了電池老化過程中顯著的規(guī)律性,該信息對識別電池老化信號具有重要價值。
圖1 NASA電池數(shù)據(jù)集
1.2 CACLE數(shù)據(jù)集
本研究使用的第二個電池數(shù)據(jù)集來源于馬里蘭大學高級生命周期工程中心(Center for Advanced Life Cycle Engineering,CALCE)。本部分研究涉及4塊鈷酸鋰電池(型號CS2),編號為35、36、37和38,各電池容量為1.1 Ah,且均采用一致的充放電模式。具體操作中,電池以0.5C的倍率進行恒流充電至4.2 V,隨后轉入恒壓充電直到充電電流降至0.05 A。在放電階段,電池以1C的恒定電流放電至2.7 V截止電壓。4塊電池的容量伴隨循環(huán)次數(shù)增加表現(xiàn)出衰減趨勢,其變化曲線如圖2(a)所示。當電池的可用容量下降至額定容量的70%時,被認為達到了壽命終點。此外,圖2(b)展示了編號CS2_35的電池在某一充電循環(huán)中的電壓與電流變化,而圖2(c)則顯示了不同循環(huán)中恒流充電階段的電壓趨勢。觀察結果表明,隨著循環(huán)次數(shù)的增加,充電時間逐漸縮短,從而揭示了電池性能的逐步退化。
圖2 CALCE電池數(shù)據(jù)集
1.3 數(shù)據(jù)預處理
SOH可以定義為:
式中,C和Cnorm分別表示LIB的當前容量和標稱容量。因此,由于Cnorm是LIB的一個常數(shù)特征,當前可用容量C足以代表SOH??紤]到實際放電過程受到用戶行為和環(huán)境的影響,而充電過程通常遵循固定的協(xié)議。因此,通常利用充電過程測量信號來估計SOH。
來自NASA數(shù)據(jù)集的4塊電池在電池充電過程中共記錄了約50000個數(shù)據(jù)點。然而,僅有950條曲線數(shù)據(jù)適用于電池SOH的估計。這一數(shù)量的數(shù)據(jù)點對于支持神經網絡進行深入的參數(shù)學習顯得不足。為了優(yōu)化神經網絡訓練效果并在一定程度上減少測量噪聲所引起的估計誤差,本研究采用了數(shù)據(jù)增強策略。具體方法是,在NASA數(shù)據(jù)集原始數(shù)據(jù)中引入均值為0、幅度在1%~2%之間的高斯白噪聲,通過該手段擴展樣本容量至4750。相較之下,CACLE數(shù)據(jù)集的數(shù)據(jù)量已足夠支持神經網絡的參數(shù)學習,故未執(zhí)行任何數(shù)據(jù)增強處理。
此外,考慮到卷積神經網絡通常對輸入數(shù)據(jù)有特定長度的要求,對數(shù)據(jù)進行了重采樣,使重采樣后的數(shù)據(jù)長度統(tǒng)一為128。在將來自CACLE和NASA數(shù)據(jù)集的樣本輸入到神經網絡模型之前,進行了必要的歸一化處理,以確保數(shù)據(jù)在適當?shù)臄?shù)值范圍內。歸一化采用的最小-最大比例法可以表示為公式(2):
式中,Xnormal為歸一化數(shù)據(jù);Xraw為來自CALCE數(shù)據(jù)集和NASA數(shù)據(jù)集的原始數(shù)據(jù);Xmin和Xmax分別為原始數(shù)據(jù)中的最小值和最大值。
2 SOH估計網絡模型
2.1 膨脹因果卷積網絡
卷積神經網絡CNN屬于一類前饋神經網絡,其主要由交替堆疊的卷積層、池化層和全連接層組成。在這種網絡結構中,卷積層通過局部連接實現(xiàn),使得低層神經元具備特定的感受野,從而能夠高效自動提取局部特征。在傳統(tǒng)的卷積神經網絡設計中,為了整合更廣泛的上下文信息并實現(xiàn)全局信息的融合,常常借助池化層或較大的卷積核來擴大感受野,但這樣做往往會引起一定程度的信息損失。為了解決這一問題,開發(fā)了膨脹卷積神經網絡(dilated CNN),該技術在不改變特征圖尺寸的前提下增大感受野,避免了信息丟失等副作用。
在處理序列數(shù)據(jù)時,因果性是一個重要概念,指的是模型的輸出只依賴于先前的輸入,而非未來的輸入。這一特性對于時間序列預測等應用場景至關重要。膨脹因果卷積(dilated causal convolution)技術結合了膨脹卷積和因果卷積的優(yōu)點,專門用于處理序列數(shù)據(jù),常見于時間序列分析與生成模型的應用中。該技術的核心在于同時擴大感受野且保持數(shù)據(jù)的時序因果性。
膨脹卷積通過引入一個膨脹率參數(shù)r來修改卷積核的采樣模式。膨脹率定義了卷積核元素之間的間隔。對于一個大小為k的卷積核,膨脹卷積的公式可以表示為:
式中,kr為膨脹卷積核;r為膨脹率;i·r為在輸入特征圖f上以r為間隔進行采樣。
膨脹卷積技術在不犧牲特征圖尺寸的前提下有效增大了感受野,進而增強了模型對更大尺度特征的提取能力。然而,由于該技術造成輸入特征中的空洞現(xiàn)象,不是所有輸入元素都會參與到后續(xù)的計算過程中。為了克服這一限制并實現(xiàn)多尺度特征提取,采用了多條并行的一維膨脹因果卷積網絡,每條網絡具有不同的膨脹率參數(shù)。如圖3所示,經預處理的采樣數(shù)據(jù)被分配至各個不同膨脹率的卷積網絡中處理。此外,為了提升網絡的泛化能力和緩解梯度消失問題,引入了殘差連接機制。最終,通過整合各個膨脹卷積網絡的輸出,實現(xiàn)了對多時間尺度特征的有效融合。這種方法在提升模型性能方面展示了出色的潛力,特別是在處理具有復雜時間動態(tài)的數(shù)據(jù)集時。
圖3 膨脹因果卷積網絡
2.2 GRU網絡
與長短時記憶網絡(LSTM)相似,門控循環(huán)單元(GRU)也是循環(huán)神經網絡(RNN)的一種變型。其設計采用了門控機制來調節(jié)信息流,主要目的是解決長期依賴及反向傳播中的梯度問題。相較于LSTM,GRU在保持類似性能的同時,能夠提供更高的計算效率。如圖4展示的GRU結構中,包括兩個關鍵的門:更新門(update gate)和重置門(reset gate)。這兩個門的行為受當前輸入和前一個時間步的隱藏狀態(tài)共同影響,它們協(xié)同作用確定如何融合歷史信息與當前信息。每一次迭代中,GRU通過這些門來控制信息的流通,使得每個單元能夠根據(jù)需要選擇性地處理輸入信息。這種機制允許GRU單元在傳遞整條鏈結構的狀態(tài)信息時具有選擇性地更新或忽略信息。在數(shù)據(jù)輸入至GRU單元時,其正向傳播過程涉及信息的篩選,這是通過動態(tài)調整的門結構實現(xiàn)的,從而有效平衡了信息的長期保留與即時更新。此種設計不僅提高了模型對時間序列數(shù)據(jù)的處理能力,還增強了模型在面對不同類型記憶需求時的適應性。
圖4 GRU神經網絡結構
GRU網絡的計算可以分為以下幾個步驟:
(1)更新門的計算
式中,zt為更新門的輸出;Wz為更新門的權重矩陣;ht-1為前一時間步的隱藏狀態(tài);xt為當前時間步的輸入;σ為sigmoid激活函數(shù)。
(2)重置門的計算
式中,rt為重置門的輸出;Wr為重置門的權重矩陣。
(3)候選隱藏狀態(tài)的計算
式中,圖片為候選隱藏狀態(tài);W為權重矩陣;⊙表示元素級別的乘法。
(4)最終隱藏狀態(tài)的計算
式中,ht為當前時間步的隱藏狀態(tài);(1-zt)⊙ht-1表示保留前一時間步的信息;zt⊙圖片表示更新到當前時間步的信息。
2.3 ECA注意力機制
為了有效建模特征通道間的相互依賴性,采用ECA(efficient channel attention)通道注意力機制。此方法通過學習過程自動識別各通道的重要性,并據(jù)此調節(jié)通道特征表達,增強關鍵通道的特征響應力,同時抑制不重要的通道。此策略較傳統(tǒng)的SENet(squeeze-and-excitation networks)通道注意力機制采用一維卷積代替全連接層,實現(xiàn)了在保持功能效果的同時顯著減少參數(shù)量。
如圖5所示,ECA注意力的實現(xiàn)包括以下幾個步驟:
圖5 ECA通道注意力機制結構
(1)全局平均池化(global average pooling):首先,對輸入的特征圖每個通道執(zhí)行全局平均池化,以提取每個通道的全局統(tǒng)計信息,實現(xiàn)特征壓縮并突出全局特征。
(2)一維卷積(1D convolution):使用一個一維卷積層來學習通道間的相互依賴關系。其中一維卷積層的核大小根據(jù)通道的數(shù)量來自適應確定,以確保計算效率。
(3)激活函數(shù):一維卷積后,一維卷積的輸出通過激活函數(shù)(如sigmoid或tanh)處理,將權重縮放到[0, 1]區(qū)間內,反映每個通道的相對重要性。
(4)通道加權:最終,根據(jù)得到的權重對原始輸入特征圖的各通道進行加權操作,通過這種方式強化或削弱特定通道的表達。
2.4 所提的SOH估計模型架構
本文中的輸入是以電池恒流充電過程的重采樣信號。假設第k個循環(huán)周期的電池SOH為yk,對應的輸入樣本數(shù)據(jù)為Xk=[tk; ik; vk]。其中tk、ik、vk分別為128×1的時間序列。
膨脹卷積可以通過擴大感受野進而更加全面地提取特征,但在處理時序動態(tài)信息時不夠靈活。GRU在時間軸上能較好地學習相鄰時間序列數(shù)據(jù)之間的耦合關系,但在數(shù)據(jù)特征的挖掘和提取方面表現(xiàn)不佳。通過結合膨脹卷積的寬廣視野和GRU的深度時間理解,可以增強模型對于各種不同序列任務的泛化能力,使其在面對不同類型的數(shù)據(jù)時能表現(xiàn)得更加穩(wěn)健。采用通道注意力機制使模型能夠聚焦關鍵特征,從而進一步提高模型的泛化能力。
本文設計了如圖6所示的網絡架構,包含3個并行的多尺度膨脹因果卷積神經網絡,一個堆疊的GRU網絡,一個ECA,最后通過一個全連接網絡輸出。具體訓練過程如下:
圖6 提出的MDCNN-GRU-ECA模型網絡架構
第一步,數(shù)據(jù)采樣和預處理。將電池的恒流充電采集數(shù)據(jù),包括時間、電流、電壓序列進行重采樣,得到3個長度為128的1維向量,然后按特征歸一化到[-1, 1]區(qū)間。預處理之后,將每個電池分別作為測試集,其他電池作為訓練集。
第二步,模型設置和初始化。首先根據(jù)經驗,將GRU的隱藏層數(shù)設為4,隱藏層維度設為32。學習率設置為10-3,批次大小設置為64,迭代次數(shù)設置為100。損失函數(shù)采用均方誤差(mean-square error,MSE),優(yōu)化算法采用Adam優(yōu)化器。此外,根據(jù)后面的幾組實驗確定了最優(yōu)的卷積核大小和膨脹率。
第三步,多尺度自動特征提取。將樣本數(shù)據(jù)直接輸入到并行的膨脹因果卷積神經網絡中,提取時間序列數(shù)據(jù)的特征,然后通過相加來進行不同尺度的時間序列特征融合。再通過Relu非線性激活函數(shù),將特征映射到高維空間。隨后通過Dropout層使模型中的神經元以0.2的概率隨機停止工作,防止模型過擬合,提高模型的泛化能力。
第四步,學習動態(tài)時序特性。通過GRU來捕捉時間序列數(shù)據(jù)的時間動態(tài)和依賴關系,然后通過殘差連接來緩解深度學習的梯度消失問題。
第五步,通道自適應權重分配。將GRU層的信息傳輸?shù)紼CA注意力層,計算不同通道的權重,和加權映射。
第六步,輸出結果。通過全連接層將多維數(shù)據(jù)轉化為一維輸出。
第七步,迭代訓練更新。計算損失函數(shù),并通過反向傳播算法完成網絡參數(shù)的更新。然后重復迭代,直到損失函數(shù)達到收斂或完成迭代次數(shù)。
第八步,模型評估。將測試數(shù)據(jù)輸入到訓練好的網絡中,獲得估計的SOH值,與真實值進行對比,通過不同的指標評價模型的性能。
2.5 模型遷移和微調
為進一步驗證模型的泛化能力和遷移性,進行了跨數(shù)據(jù)集的模型遷移實驗。具體為先在NASA數(shù)據(jù)集上訓練模型,然后在CACLE數(shù)據(jù)集上進行微調并驗證。微調的過程是為了適應數(shù)據(jù)集間的差異性,但不進行大規(guī)模的重新訓練,以確保遷移學習的有效性。通過這種方法,評估模型在不同數(shù)據(jù)集上的表現(xiàn),以測試其遷移學習能力。具體通過兩種微調方式進行模型遷移:第一種微調方式(T1-MDGE)先凍結網絡中頂端全連接層以外的其他參數(shù),然后在CACLE數(shù)據(jù)集上利用部分電池數(shù)據(jù)完成20次訓練迭代。第二種微調方式(T2-MDGE)與之類似,區(qū)別在于完成15次訓練迭代后將網絡底層中的所有參數(shù)解凍,剩下的5次訓練迭代進行全網絡的參數(shù)學習。
3 結果和討論
在本節(jié)中,為了驗證本文方法的有效性,將提出的MDGE模型在兩個不同的數(shù)據(jù)集上進行了測試,并與已存在的兩種常規(guī)模型——CNN和GRU進行了比較,這兩種模型均來源于文獻[26]中關于SOH估計任務的報道。同時,為了突出多尺度特征融合模型的優(yōu)勢,還增加了對應的單尺度模型進行了對比,即DGE(DCNN-GRU-ECA)。這些模型的輸入數(shù)據(jù)和訓練算法與MDGE模型相同。此外,為了進一步展示方法的先進性,還選取了針對相同數(shù)據(jù)集的最新SOH估計研究成果進行了誤差的比較分析,并驗證了基于該模型的跨數(shù)據(jù)集遷移學習策略。使用了兩個評價指標:平均絕對誤差(mean absolute error,MAE),均方誤差(root mean square error,RMSE)。它們的計算方法如式(8)~(9):
3.1 NASA數(shù)據(jù)集SOH估計結果分析
膨脹率和卷積核尺寸是影響膨脹卷積神經網絡性能的重要超參數(shù)。為了進一步探索這些超參數(shù)對預測性能的影響,本節(jié)使用NASA數(shù)據(jù)集進行了一系列實驗,其中B06、B07、B18作為訓練集,B05作為測試集。通過比較MDGE模型在不同膨脹率和卷積窗口長度下的計算精度[圖7(a)],觀察到最優(yōu)的超參數(shù)配置是卷積核大小為3,膨脹率為4。實驗結果表明,無論是膨脹率還是卷積核尺度的過度增大或減小均對計算精度有不利影響。如圖7(b)所示,在膨脹率設定為4的條件下,3個并行部署的膨脹卷積神經網絡(DCNN)模塊對不同尺度的特征進行了提取。這些模塊分別采用1、4及16作為其膨脹因子,使得它們能夠針對序列信息在不同的時間尺度上進行捕獲。具體來說,較小的膨脹因子使得網絡能夠細致地捕捉到短期特征,而較大的膨脹因子則使網絡有能力從寬廣的時間范圍內提取出長期且較為粗糙的特征。通過整合多個不同尺度的膨脹卷積層,網絡能夠同時學習到多層次的時間序列特征。因此,恰當選擇膨脹率和窗口長度不僅有助于保證感受野的適度擴展,以便捕獲必要的上下文及局部特征信息,同時可以平衡模型的計算效率與過擬合風險,從而促進模型的整體性能及其泛化能力。后續(xù)將通過最優(yōu)的超參數(shù)配置驗證MDGE模型的性能。
圖7 多尺度特征提取方法的超參數(shù)優(yōu)化
圖8比較了MDGE方法與其他方法在NASA數(shù)據(jù)集中的SOH估計效果。為了證明結果的一般性,圖8(a)~(d)分別以B05、B06、B07、B18作為測試集,剩余的3塊電池作為訓練集。表1列出了各模型的評價指標??梢杂^察到,通過MDGE方法獲得的SOH估計結果相對于其他3種方法更接近于真實的SOH。根據(jù)表1,MDGE的SOH估計誤差最低,平均RMSE僅為0.0110,優(yōu)于文獻[31]中的0.0131和DGE方法的0.0160,其次是GRU模型的0.0212和CNN模型的0.0258。同時,MDGE方法的MAE指標也低于文獻[31]和[30]。這表明,多時間尺度相比單一時間尺度的特征提取方式可以更全面地捕捉數(shù)據(jù)在不同尺度下的動態(tài)變化和模式,有助于理解不同時間跨度上的內在特性。此外,與傳統(tǒng)的CNN和GRU模型相比,MDGE和DGE融合模型結合了CNN的高級特征提取能力和GRU的序列數(shù)據(jù)處理優(yōu)勢,同時利用通道注意力機制提升模型對關鍵特征的捕捉能力,能夠實現(xiàn)更好的SOH估計效果。
圖8 NASA數(shù)據(jù)集上不同方法的SOH估計結果比較
表1 NASA數(shù)據(jù)集上不同方法的SOH的估計誤差比較
3.2 CALCE數(shù)據(jù)集SOH估計結果分析
為了進一步證實所提方法的可靠性,本節(jié)采用CALCE數(shù)據(jù)集對擬定的模型進行檢驗。相較于NASA數(shù)據(jù)集,CALCE數(shù)據(jù)集所涵蓋的電池壽命更長,可為提供更多具有代表性的樣本。
圖9展示了在CALCE數(shù)據(jù)集上,提出的MDGE方法與其他幾種估算方法在鋰離子電池SOH估計方面的比較結果。具體操作為分別選取CS2_35、CS2_36、CS2_37、CS2_38四種電池作為測試集,而將其他電池數(shù)據(jù)指定為訓練集使用。表2詳細列出了各個模型的估計誤差數(shù)據(jù),從中可以看出,MDGE模型具有最優(yōu)的估計效果,其均方根誤差RMSE僅為0.0095,分別比傳統(tǒng)的CNN、GRU及DGE方法降低了67%、43%和23%,同時也低于文獻[31]中的0.0173和文獻[32]中的0.0373。
圖9 CALCE數(shù)據(jù)集上不同方法的SOH估計結果比較
表2 CALCE數(shù)據(jù)集上不同方法的SOH的估計誤差比較
為了進一步驗證提出模型的遷移能力,在NASA數(shù)據(jù)集上訓練模型,并在CACLE數(shù)據(jù)集上進行微調和測試。具體來說,首先使用NASA數(shù)據(jù)集中包含的電池數(shù)據(jù)(B0005、B0006、B0007、B0018)進行訓練,訓練過程與之前描述的保持一致。然后,將訓練好的模型分別通過2.5節(jié)中介紹的兩種方式進行微調,隨后應用于CACLE數(shù)據(jù)集中的電池數(shù)據(jù)。最后在CACLE數(shù)據(jù)集上進行預測,并計算預測誤差。在這個過程中,使用CS2_35號和CS2_37號電池進行SOH估計的模型,是通過對CS2_36號和CS2_38號電池的部分數(shù)據(jù)進行微調后獲得;同理,對于CS2_36號和CS2_38號電池的SOH估計,所使用的模型則是基于CS2_35號和CS2_37號電池的部分數(shù)據(jù)進行微調。估計結果如圖10和表2所示,可以看出,盡管模型是在NASA數(shù)據(jù)集上訓練的,但在CACLE數(shù)據(jù)集上仍然表現(xiàn)出較高的預測精度。這表明,提出的MDGE模型具有良好的遷移能力,可以在不同的數(shù)據(jù)集上實現(xiàn)有效的SOH估計。其中,T2-MDGE方式優(yōu)于T1-MDGE方式,其平均估計誤差RMSE僅為0.0092。這可能是由于不同數(shù)據(jù)集中電池類型及相應老化特性的差異所致。對于不同的電池材料,即使在相同的老化狀態(tài)下,充電電壓特性曲線存在較大差異,這意味著在跨數(shù)據(jù)集遷移時可能需要學習不同的特征表示。在僅凍結部分層的T1-MDGE微調方式中,底層參數(shù)保持不變可能會限制模型對新數(shù)據(jù)的學習能力,尤其是在源域和目標域差異較大的情況下。而T2-MDGE微調方式通過全網絡的參數(shù)更新,可以減少這種信息損失,使模型能夠更自由地探索新的特征空間,這有助于模型在目標域上獲得更好的泛化能力。
圖10 利用遷移學習實現(xiàn)NASA至CALCE數(shù)據(jù)集的SOH估計實證結果
4 結 論
本研究旨在解決現(xiàn)有數(shù)據(jù)驅動方法在估計鋰離子電池的健康狀態(tài)SOH時,特征提取能力不足的問題。為此提出了一種創(chuàng)新的融合模型,該模型基于多時間尺度建模自動特征提取和通道注意力機制。具體來說,該模型采用了多尺度膨脹因果卷積網絡MDCNN并行處理架構,能夠從多個時間尺度上捕捉電池充電過程中的動態(tài)信息,并實現(xiàn)這些信息的有效融合。隨后,通過GRU網絡進一步提取這些時間序列中的長期依賴特征。
此外,為了加強模型對關鍵特征的關注力度,集成了ECA通道注意力機制,該機制專注于增強重要特征通道的表示學習能力。這一步驟通過調整各特征通道中的權重分配,以優(yōu)化最終特征表示的方式進行。模型的最后階段包括一個全連接層,它將處理后的特征信息轉換為最終的輸出維度,即電池的SOH估值。
在兩個公開的鋰離子電池數(shù)據(jù)集上對提出的模型進行了廣泛測試。測試結果顯示,與傳統(tǒng)深度學習方法相比,本文提出的基于多尺度自動特征提取和通道注意力機制的融合模型在SOH的估計精確性方面表現(xiàn)更為優(yōu)越。在跨數(shù)據(jù)集的遷移實驗中,該模型仍然表現(xiàn)出較高的預測性能,這進一步證明了MDGE模型在處理電池健康管理問題上相對于傳統(tǒng)深度學習方法的優(yōu)勢和在不同數(shù)據(jù)集上的適應性。通過這種方法,可以顯著提高電池管理系統(tǒng)在實際應用中的性能和可靠性,為未來鋰離子電池健康狀態(tài)評估與管理提供了一種新的技術途徑。