在長期監測心電圖(ECG)的過程中不可避免地會混雜各類噪聲,影響醫生對患者數據的讀取和判斷,因此在分析和診斷前對ECG信號質量進行評估至關重要。針對目前已有的ECG信號質量評估方法對12導聯多尺度相關性關注不足的問題,本文提出一種集成卷積神經網絡(CNN)和壓縮與激勵殘差網絡(SE-ResNet)的ECG信號質量評估方法。該方法不僅能提取ECG信號時間序列的局部及全局特征,而且還關注了ECG信號的空間相關性,在公共數據集上測試得到的準確率、靈敏度和特異性分別為99.5%、98.5%和99.6%。與其他方法相比,本文所提方法利用導聯間相關信息有效提高了ECG信號質量評估的準確率,有望促進ECG信號的智能監測與診斷技術的發展。
0 引言
心電圖(electrocardiogram,ECG)用于記錄心臟活動[1-2],是臨床醫學中無創診斷心血管疾病的有效工具。對于臨床診斷和個人監護,多導聯ECG信號監測在提高心律失常的檢出率和對患者的及時干預以及個體化治療方面具有重要意義[3-4]。然而,日常生活環境的復雜性常常導致可穿戴設備采集的ECG信號易受多種噪聲干擾,包括:電極運動偽影(electrode motion artefacts,EM)、肌肉偽影(muscle artifacts,MA)、基線漂移(baseline wander,BW)等[5]。因此,對ECG信號進行質量評估是心血管疾病智能診斷的重要環節。
通常,評價ECG信號質量的方法分為兩大類:機器學習方法和深度學習方法[6]。在機器學習領域,Zhang等[7]采用了27個專家特征,包括基線漂移、最大最小幅值和功率譜密度等,結合模糊支持向量機(fuzzy support vector machine,FSVM),并通過網格搜索(grid search,GS)優化FSVM分類器的參數。Xia等[8]從ECG信號中提取出恒定電壓、平均幅值以及交點個數等9個專家特征,使用基于閾值的方法和基于支持向量機(support vector machine,SVM)的方法進行分析。Prabhakararao等[9]使用48個多尺度帶能量和7個多尺度子帶失配累計直方圖構建55維多尺度特征組合,用于SVM非線性分類。機器學習模型的性能很大程度上依賴于所提取的各種特征,但是手動提取的特征往往難以全面捕獲ECG信號的全部信息。
深度學習是一種特殊的機器學習算法,不需要人工定義特征,而是依靠神經網絡自主地從數據中提取特征,具有較強的學習能力[10]。Liu等[11]使用手工提取的統計數據和基于S變換頻譜圖特征結合3層卷積神經網絡(convolutional neural network,CNN)的方法,采用在線增強方案得到正確的時頻表示,然后將3層CNN提取的深度學習特征和手工特征融合以實現ECG信號的質量評估。Jin等[12]提出雙注意力卷積長短期記憶神經網絡(dual attentional convolutional long short-term memory neural network,DAC-LSTM),利用DAC-LSTM從ECG信號中獲取大量深層特征的同時,通過雙層注意力展示模型對ECG信號上不同導聯、不同時期的注意力。Liu等[13]結合殘差網絡(residual network,ResNet)和注意力機制,利用單個QRS波群心跳在10 s片段內的相似性原理提取ECG信號特征。與傳統的機器學習方法相比,深度學習方法雖然能夠自行提取大量特征,但是較簡單的深度學習模型在處理受現實環境影響而變化的ECG信號時,可能難以準確捕捉其中的復雜特征。
此外,雖然不同導聯的放置提供了多個視角觀察心臟活動,但它們捕獲的都是同一類心臟活動信息[14]。因此,如果能全面了解不同導聯之間的相關性,可以更好地應對ECG信號的復雜噪聲,對于提高ECG信號質量評估的準確率,以及進一步優化長期ECG信號監測都至關重要。
基于上述原因,本文提出了一種能夠充分提取導聯間多尺度信息的ECG信號質量評估方法,即多尺度CNN壓縮與激勵殘差網絡(multi-scale CNN squeeze and excitation-residual network,MSCSR),使用CNN和壓縮與激勵殘差網絡(squeeze and excitation-residual network,SE-ResNet)結合的方法進行不同尺度特征的提取,預計該方法在ECG信號的質量評估中將比現有的先進模型更具有效性,且準確率更高。本研究旨在為ECG信號質量評估領域提供更為精確和可靠的解決方案,以期推動相關技術的發展并為未來的臨床應用提供重要參考。
1 數據來源
本文實驗使用的ECG信號來自2011年心臟病學計算機挑戰賽(PhysioNet/CinC Challenge 2011,PICC 2011)中使用的數據[15],這是ECG信號質量評估常見數據集,可公開下載。該數據庫為12導聯(編號為:Ⅰ、Ⅱ、Ⅲ、aVR、aVL、aVF和V1~V6)的ECG信號數據庫。由臨床專家、技術人員以及志愿者在接受不同程度培訓后,根據樣本能否用于臨床診斷并將其標注為“質量可接受”和“質量不可接受”兩類,共包含998條12導聯ECG數據。實驗將60%的樣本作為訓練集,40%的樣本作為測試集。
2 方法
2.1 MSCSR模型概述
12導聯ECG信號質量評估的目標是構建一個可以評估所有導聯信號的模型[16]。本文將多導聯ECG信號表示為,對應的質量標簽表示為
,則ECG信號的質量評估任務如式(1)所示:
![]() |
其中,θ*是最優參數,θ是模型中的參數向量,Ф是ECG信號質量評估的模型,ω是模型的權重,J是損失函數,這里Ф即為MSCSR,為12個單導聯的數據,Xi代表12導聯的不同導聯;Yi為輸入導聯對應的標簽,這里的Yi
{0,1}。
皮爾遜相關系數是用于衡量兩個變量之間線性關系強度的統計量。Tan等[16]通過皮爾遜相關系數分析并證實了質量可接受的ECG信號在各導聯間通常顯示出高度相關性,這反映了心臟正常的生理連接。然而,他們未對質量不可接受ECG信號的導聯相關性進行分析。為了深入探索多導聯ECG信號間的相關性,本研究在MSCSR模型設計初期進行了皮爾遜相關性分析實驗。實驗結果如圖1所示,其中左圖為可接受ECG信號,展示了導聯間的高度的相關性,例如:Ⅱ、Ⅲ、aVR、aVL和aVF導聯的皮爾遜相關系數均接近1,V3和V4的皮爾遜相關系數也顯示出相關性。右圖為不可接受ECG信號,通常應表現出相關性的aVL和Ⅲ導聯的相關系數僅為0.14,aVF和Ⅱ的相關系數為–0.20,呈現負相關。這可能是因為技術故障、導聯放置不當、患者移動或其他噪聲影響了信號質量,從而導致導聯間缺乏正常的相關性,降低了信號的診斷價值。因此,本文通過導聯間相關性設計模型來區分ECG信號的可接受與不可接受是可行的。

如圖2所示,為了提取導聯間的多尺度信息,提出了MSCSR組合模型。為捕獲導聯間的相關性,本文將12導聯ECG信號的每10 s數據拼接為1組時域序列進行處理。MSCSR模型首先使用不同卷積核大小的CNN捕獲ECG信號的空域特征,該模塊不僅可以提取每組導聯數據的空域特征,還通過多尺度卷積加強導聯拼接位置處的數據特征;然后,設計不同內核大小的并行SE-ResNet模塊,一方面關注多導聯數據間的相關性特征,另一方面捕獲ECG信號的時序特征;緊接著,使用重塑層(Reshape)將提取的特征重塑為一維特征,并使用不同內核大小的并行SE-ResNet 模塊進行進一步的特征提取。在特征提取結束后,使用全局最大池化(global max pooling,GMP)和全局平均池化(global average pooling,GAP)并行的方式對SE-ResNet模塊提取的特征進行降維處理,然后通過拼接層(Concat)實現特征表示上的信息融合,從而豐富特征表示并提高模型性能。最后,使用全連接層作為ECG信號質量評估的分類器來獲得輸出,激活函數采用S型生長曲線(Sigmoid)函數。

2.2 CNN模塊
CNN模塊的結構如圖3所示,參數設置如表1所示。CNN的核心是卷積層,主要用于提取特征,目前已被廣泛用于諸多領域[17]。CNN模塊使用多尺度卷積結構,能夠有效捕獲不同尺度ECG信號特征,通過多尺度結構,增加整體模型的感受野,每個CNN模塊由4個卷積層(convolution,Conv)(Conv1~ Conv4)和最大池化層(max pooling,Maxpool)組成。


2.3 SE-ResNet模塊
ResNet由多個堆疊的“殘差單元”組成,每個單元如式(2)~式(3)所示:
![]() |
![]() |
其中,xl和xl+1是第l個單元的輸入和輸出,yl是第l層的輸出,Wl是第l層的訓練權重,F(·)是殘差函數,h(·)是恒等映射,f(·)是線性整流函數(rectified linear unit,ReLU)。
Hu等[18]通過研究圖像處理中通道間的相互作用,開發了壓縮和激勵(squeeze and excitation,SE)模塊,該模塊通過捕獲通道特征來增強神經網絡的性能。SE模塊主要由壓縮和激勵組成。
SE網絡結構如圖4所示,Ftr是一個轉型結構,如式(4)所示:

![]() |
其中,X是輸入特征圖,U是輸出特征圖,是SE的最終輸出,H是高度,W是寬度,C是通道數,R是實數集。
壓縮操作如式(5)所示:
![]() |
其中,zc是通道c上的壓縮結果,Fsq(·)是池化操作,i是特征圖在高度方向的索引,j是特征圖在寬度方向的索引,z是通過池化得到的特征向量。由于卷積僅在局部空間內進行,其感受野相對較小。為了解決這一問題,壓縮操作將通道上整個空間特征編碼為一個全局特征,采用GAP來實現,從而有效地捕獲到每個通道中的全局信息。
激勵操作如式(6)所示:
![]() |
其中,s是縮放系數,Fex(·)是通道注意力擴展操作,W、W1、W2是權重矩陣,σ(·)是Sigmoid函數,g(·)是非線性函數,δ(·)是激活函數。該操作是為了完全捕獲通道相關性。這里首先用W1·z,這是一個全連接層的操作,W1的維度是C·C/r,其中r是縮放參數,目的是為了減少通道個數從而降低計算量。z的維度是1×1×C,然后W1·z的結果為1×1×C/r;然后再經過一個ReLU層,輸出維度保持不變;接下來與W2相乘,其中W2的維度為C·C/r,此時輸出的維度變為1×1×C;最后經過激活函數得到s。
最后,將學習到的各個通道的激活值乘上原始特征,如式(7)所示:
![]() |
這里的是最終輸出特征圖中第c個通道的值,Fscale(·)是縮放操作,uc是一個二維矩陣,sc是權重,通過這種方法,uc矩陣中的每個元素都被相應的sc加權。本文在ResNet的基礎上引入了SE模塊來優化不同通道的特征處理,從而更加準確地捕獲ECG信號不同導聯間的相關性信息。
SE-ResNet模塊由批歸一化(batch normalization,BN)、ReLU、Conv層和SE構成,如圖5所示,其中二維Conv層(two-dimensional Conv,Conv 2D)的第1次Conv(Conv 2D 1)的卷積核大小分別為1×1、3×1、5×1、7×1,步長均為(1,1);Conv2D的第2次Conv(Conv 2D 2)的卷積核大小為1×1,步長為(2,1)。一維Conv層(one-dimensional Conv,Conv 1D)的第1次Conv(Conv 1D 1)的卷積核大小分別為1、3、5、7,步長為2;Conv 1D的第2次Conv(Conv 1D 2)的卷積核大小為1,步長為2;Conv 1D的第3次Conv(Conv 1D 3)的卷積核大小分別為1、3、5、7,步長均為1。通過使用不同大小的卷積核,SE-ResNet模塊能夠在不同尺度上捕獲特征,比較小的卷積核捕捉局部特征,而較大的卷積核用來捕捉更大范圍的特征。這種多尺度特征提取機制極大地增強了模型對ECG信號中各導聯間差異的敏感性,進一步提升了模型對不同導聯間特征的關注能力。

2.4 評價指標及實驗環境
本文采用準確率(Accuracy)、靈敏度(Sensitivity)和特異性(Specificity)來衡量模型的有效性。各項指標具體計算公式如式(8)~式(10)所示:
![]() |
![]() |
![]() |
式中,真陽性(true positive,TP)表示正類別中正確分類樣本的數量;真陰性(true negative, TN)表示負類別中正確分類樣本的數量;假陽性(false positive,FP)表示正類別中錯誤分類樣本的數量;假陰性(false negative,FN)是負類別中錯誤分類樣本的數量。
2.5 實驗環境
為避免過擬合,對數據進行歸一化操作。所有實驗均在一臺配備顯卡NVIDIA GeForce RTX 3090(NVIDIA Corporation,美國)和處理器Intel I9 13900KF(Intel Corporation,美國)的計算機上運行,該計算機操作系統為Windows10(Microsoft Corporation,美國)。模型開發環境為編程語言Python3.6(Python Software Foundation,美國)和深度學習框架TensorFlow 2.6(Google Inc,美國)。本實驗采用自適應矩估計(adaptive moment estimation,Adam)優化器進行模型優化,使用交叉熵損失函數評估模型性能,學習率為0.01,批量大小為128,訓練周期為200。
3 實驗結果
MSCSR模型訓練和測試過程曲線如圖6所示,隨著訓練周期的增加,訓練損失和測試損失均逐漸降低并趨于穩定;訓練準確率和測試準確率逐步上升,最終也趨于穩定。這些趨勢表明模型的性能持續提升,并且能夠很好地擬合訓練集和測試集的數據,顯示出模型在學習能力和泛化能力方面都有很好的效果。

3.1 消融實驗
本實驗在PICC 2011數據庫上進行消融實驗,實驗結果如表2所示。

3.1.1 消融CNN模塊
為揭示CNN模塊在整體模型中的影響,本實驗消融了CNN模塊,以比較有和沒有CNN模塊的模型性能差異。實驗結果表明,CNN模塊在模型中發揮了不可或缺的作用,它能夠充分提取不同導聯之間的相關信息,從而提升整體模型的性能。
3.1.2 消融并行SE-ResNet中不同內核卷積
本實驗分別消融了內核大小為3 × 1、7 × 1的通道,以探究這些內核尺寸對模型性能的影響。實驗證明,結合使用較小卷積核捕獲局部特征和較大卷積核捕獲全局特征的方法,不僅提升了模型性能,還增強了模型對導聯之間相關信息的關注能力。
3.1.3 消融全局池化模塊
本實驗消融了GMP,采用單一的GAP,以探究其對模型性能的影響。實驗結果表明,在模型中同時引入GMP和GAP對整體性能起到了積極作用。這兩種池化操作能夠從不同角度捕獲和整合特征,增強模型對信號關鍵信息的把握。
3.2 PICC 2011數據集的性能比較
MSCSR與現有文獻[19-24]提及的方法比較結果如表3所示,數據均采用的是PICC 2011數據。MSCSR模型在進行ECG信號質量評估時實現了較好的競爭力。這一優勢源于MSCSR模型不單純依賴ECG信號單拍QRS波群的形態特征,而是綜合考慮12導聯ECG信號之間的相關性,從而更有效地區分噪聲與真實的ECG信號。此外,MSCSR模型實現了優異的靈敏度和特異性,這樣意味著它在ECG信號質量評估任務中具有更好的普適性和更低的誤診率。綜上所述,從模型的性能角度來看,MSCSR模型在實際環境中能夠很好地區分可接受和不可接受的ECG信號。

3.3 交叉驗證實驗
雖然模型在PICC 2011數據集上表現優異,但這些指標可能受到數據分割偏差的影響,僅反映模型對這一特定測試集的擬合程度,難以全面代表其泛化能力。為了更全面地評估模型的泛化能力,本實驗采用5折交叉驗證。結果顯示,模型達到了(98.9 ± 0.007 1)%的準確率,表明了其對數據集良好的適應性和泛化能力;靈敏度和特異性分別為(97.5 ± 0.023 5)%和(99.4 ± 0.002 6)%,這說明模型對于真正類別的預測準確度較高;標準差的低值反映出模型在不同數據子集上的高穩定性。
4 討論
本研究通過分析不同導聯之間的相關性,構建了多尺度的特征提取模型MSCSR,用于多導聯ECG信號的質量評估,多尺度特征提取策略不僅增強了模型對ECG信號中細微變化的感知能力,還通過整合不同導聯的信息,提升了模型對ECG信號全局和局部特征的整體理解。
相比之下,盡管一些基于深度學習的方法通過引入注意力機制改善了特征提取,但在導聯間信息融合方面仍顯不足。此外,盡管有些研究探討了不同導聯之間的相關性,但在處理多尺度特征時仍然不夠充分,導致實際性能波動較大。還有一些方法基于QRS波群監測和圖像相似性指標,雖然在特定情境下表現出色,但普遍存在泛化能力不足和對噪聲敏感的問題。當面對非典型或質量較差的ECG信號時,這些方法的準確率和可靠性往往受到較大影響。
然而,盡管本文的方法在多個指標上表現優異,但模型的復雜性較高,這可能導致在實際應用中需要較高的計算資源。未來的工作可以探索如何優化模型結構,以降低其在移動設備中的應用成本。同時,可以進一步研究不同導聯信號在特征情況下的相關性變化,為ECG信號質量評估提供新的視角。
5 結論
本文提出了一種多尺度ECG信號質量評估的新方法,利用不同導聯之間的相關性,采用CNN模塊和四分支SE-ResNet模塊進行特征提取,用于12導聯ECG信號的質量評估。實驗結果顯示,MSCSR模型達到了99.5%的準確率、98.5%的靈敏度和99.6%的特異性。消融實驗進一步證明,基于不同導聯間相關性設計的各個結構對于整體模型的重要性。在進一步的交叉驗證實驗中,MSCSR達到(98.9 ± 0.007 1)%的準確率、(97.5 ± 0.023 5)%的靈敏度和(99.4 ± 0.002 6)%特異性。與其他先進方法相比,在性能上均有較大提升,因此MSCSR模型在實際ECG信號質量評估中具有較強的潛力。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:陳誠主要負責算法的實現以及論文的撰寫;張愛華、馬玉潤主要負責實驗的整體安排以及論文修訂;漆宇晟、李佳琪負責數據的分析以及論文修訂。
0 引言
心電圖(electrocardiogram,ECG)用于記錄心臟活動[1-2],是臨床醫學中無創診斷心血管疾病的有效工具。對于臨床診斷和個人監護,多導聯ECG信號監測在提高心律失常的檢出率和對患者的及時干預以及個體化治療方面具有重要意義[3-4]。然而,日常生活環境的復雜性常常導致可穿戴設備采集的ECG信號易受多種噪聲干擾,包括:電極運動偽影(electrode motion artefacts,EM)、肌肉偽影(muscle artifacts,MA)、基線漂移(baseline wander,BW)等[5]。因此,對ECG信號進行質量評估是心血管疾病智能診斷的重要環節。
通常,評價ECG信號質量的方法分為兩大類:機器學習方法和深度學習方法[6]。在機器學習領域,Zhang等[7]采用了27個專家特征,包括基線漂移、最大最小幅值和功率譜密度等,結合模糊支持向量機(fuzzy support vector machine,FSVM),并通過網格搜索(grid search,GS)優化FSVM分類器的參數。Xia等[8]從ECG信號中提取出恒定電壓、平均幅值以及交點個數等9個專家特征,使用基于閾值的方法和基于支持向量機(support vector machine,SVM)的方法進行分析。Prabhakararao等[9]使用48個多尺度帶能量和7個多尺度子帶失配累計直方圖構建55維多尺度特征組合,用于SVM非線性分類。機器學習模型的性能很大程度上依賴于所提取的各種特征,但是手動提取的特征往往難以全面捕獲ECG信號的全部信息。
深度學習是一種特殊的機器學習算法,不需要人工定義特征,而是依靠神經網絡自主地從數據中提取特征,具有較強的學習能力[10]。Liu等[11]使用手工提取的統計數據和基于S變換頻譜圖特征結合3層卷積神經網絡(convolutional neural network,CNN)的方法,采用在線增強方案得到正確的時頻表示,然后將3層CNN提取的深度學習特征和手工特征融合以實現ECG信號的質量評估。Jin等[12]提出雙注意力卷積長短期記憶神經網絡(dual attentional convolutional long short-term memory neural network,DAC-LSTM),利用DAC-LSTM從ECG信號中獲取大量深層特征的同時,通過雙層注意力展示模型對ECG信號上不同導聯、不同時期的注意力。Liu等[13]結合殘差網絡(residual network,ResNet)和注意力機制,利用單個QRS波群心跳在10 s片段內的相似性原理提取ECG信號特征。與傳統的機器學習方法相比,深度學習方法雖然能夠自行提取大量特征,但是較簡單的深度學習模型在處理受現實環境影響而變化的ECG信號時,可能難以準確捕捉其中的復雜特征。
此外,雖然不同導聯的放置提供了多個視角觀察心臟活動,但它們捕獲的都是同一類心臟活動信息[14]。因此,如果能全面了解不同導聯之間的相關性,可以更好地應對ECG信號的復雜噪聲,對于提高ECG信號質量評估的準確率,以及進一步優化長期ECG信號監測都至關重要。
基于上述原因,本文提出了一種能夠充分提取導聯間多尺度信息的ECG信號質量評估方法,即多尺度CNN壓縮與激勵殘差網絡(multi-scale CNN squeeze and excitation-residual network,MSCSR),使用CNN和壓縮與激勵殘差網絡(squeeze and excitation-residual network,SE-ResNet)結合的方法進行不同尺度特征的提取,預計該方法在ECG信號的質量評估中將比現有的先進模型更具有效性,且準確率更高。本研究旨在為ECG信號質量評估領域提供更為精確和可靠的解決方案,以期推動相關技術的發展并為未來的臨床應用提供重要參考。
1 數據來源
本文實驗使用的ECG信號來自2011年心臟病學計算機挑戰賽(PhysioNet/CinC Challenge 2011,PICC 2011)中使用的數據[15],這是ECG信號質量評估常見數據集,可公開下載。該數據庫為12導聯(編號為:Ⅰ、Ⅱ、Ⅲ、aVR、aVL、aVF和V1~V6)的ECG信號數據庫。由臨床專家、技術人員以及志愿者在接受不同程度培訓后,根據樣本能否用于臨床診斷并將其標注為“質量可接受”和“質量不可接受”兩類,共包含998條12導聯ECG數據。實驗將60%的樣本作為訓練集,40%的樣本作為測試集。
2 方法
2.1 MSCSR模型概述
12導聯ECG信號質量評估的目標是構建一個可以評估所有導聯信號的模型[16]。本文將多導聯ECG信號表示為,對應的質量標簽表示為
,則ECG信號的質量評估任務如式(1)所示:
![]() |
其中,θ*是最優參數,θ是模型中的參數向量,Ф是ECG信號質量評估的模型,ω是模型的權重,J是損失函數,這里Ф即為MSCSR,為12個單導聯的數據,Xi代表12導聯的不同導聯;Yi為輸入導聯對應的標簽,這里的Yi
{0,1}。
皮爾遜相關系數是用于衡量兩個變量之間線性關系強度的統計量。Tan等[16]通過皮爾遜相關系數分析并證實了質量可接受的ECG信號在各導聯間通常顯示出高度相關性,這反映了心臟正常的生理連接。然而,他們未對質量不可接受ECG信號的導聯相關性進行分析。為了深入探索多導聯ECG信號間的相關性,本研究在MSCSR模型設計初期進行了皮爾遜相關性分析實驗。實驗結果如圖1所示,其中左圖為可接受ECG信號,展示了導聯間的高度的相關性,例如:Ⅱ、Ⅲ、aVR、aVL和aVF導聯的皮爾遜相關系數均接近1,V3和V4的皮爾遜相關系數也顯示出相關性。右圖為不可接受ECG信號,通常應表現出相關性的aVL和Ⅲ導聯的相關系數僅為0.14,aVF和Ⅱ的相關系數為–0.20,呈現負相關。這可能是因為技術故障、導聯放置不當、患者移動或其他噪聲影響了信號質量,從而導致導聯間缺乏正常的相關性,降低了信號的診斷價值。因此,本文通過導聯間相關性設計模型來區分ECG信號的可接受與不可接受是可行的。

如圖2所示,為了提取導聯間的多尺度信息,提出了MSCSR組合模型。為捕獲導聯間的相關性,本文將12導聯ECG信號的每10 s數據拼接為1組時域序列進行處理。MSCSR模型首先使用不同卷積核大小的CNN捕獲ECG信號的空域特征,該模塊不僅可以提取每組導聯數據的空域特征,還通過多尺度卷積加強導聯拼接位置處的數據特征;然后,設計不同內核大小的并行SE-ResNet模塊,一方面關注多導聯數據間的相關性特征,另一方面捕獲ECG信號的時序特征;緊接著,使用重塑層(Reshape)將提取的特征重塑為一維特征,并使用不同內核大小的并行SE-ResNet 模塊進行進一步的特征提取。在特征提取結束后,使用全局最大池化(global max pooling,GMP)和全局平均池化(global average pooling,GAP)并行的方式對SE-ResNet模塊提取的特征進行降維處理,然后通過拼接層(Concat)實現特征表示上的信息融合,從而豐富特征表示并提高模型性能。最后,使用全連接層作為ECG信號質量評估的分類器來獲得輸出,激活函數采用S型生長曲線(Sigmoid)函數。

2.2 CNN模塊
CNN模塊的結構如圖3所示,參數設置如表1所示。CNN的核心是卷積層,主要用于提取特征,目前已被廣泛用于諸多領域[17]。CNN模塊使用多尺度卷積結構,能夠有效捕獲不同尺度ECG信號特征,通過多尺度結構,增加整體模型的感受野,每個CNN模塊由4個卷積層(convolution,Conv)(Conv1~ Conv4)和最大池化層(max pooling,Maxpool)組成。


2.3 SE-ResNet模塊
ResNet由多個堆疊的“殘差單元”組成,每個單元如式(2)~式(3)所示:
![]() |
![]() |
其中,xl和xl+1是第l個單元的輸入和輸出,yl是第l層的輸出,Wl是第l層的訓練權重,F(·)是殘差函數,h(·)是恒等映射,f(·)是線性整流函數(rectified linear unit,ReLU)。
Hu等[18]通過研究圖像處理中通道間的相互作用,開發了壓縮和激勵(squeeze and excitation,SE)模塊,該模塊通過捕獲通道特征來增強神經網絡的性能。SE模塊主要由壓縮和激勵組成。
SE網絡結構如圖4所示,Ftr是一個轉型結構,如式(4)所示:

![]() |
其中,X是輸入特征圖,U是輸出特征圖,是SE的最終輸出,H是高度,W是寬度,C是通道數,R是實數集。
壓縮操作如式(5)所示:
![]() |
其中,zc是通道c上的壓縮結果,Fsq(·)是池化操作,i是特征圖在高度方向的索引,j是特征圖在寬度方向的索引,z是通過池化得到的特征向量。由于卷積僅在局部空間內進行,其感受野相對較小。為了解決這一問題,壓縮操作將通道上整個空間特征編碼為一個全局特征,采用GAP來實現,從而有效地捕獲到每個通道中的全局信息。
激勵操作如式(6)所示:
![]() |
其中,s是縮放系數,Fex(·)是通道注意力擴展操作,W、W1、W2是權重矩陣,σ(·)是Sigmoid函數,g(·)是非線性函數,δ(·)是激活函數。該操作是為了完全捕獲通道相關性。這里首先用W1·z,這是一個全連接層的操作,W1的維度是C·C/r,其中r是縮放參數,目的是為了減少通道個數從而降低計算量。z的維度是1×1×C,然后W1·z的結果為1×1×C/r;然后再經過一個ReLU層,輸出維度保持不變;接下來與W2相乘,其中W2的維度為C·C/r,此時輸出的維度變為1×1×C;最后經過激活函數得到s。
最后,將學習到的各個通道的激活值乘上原始特征,如式(7)所示:
![]() |
這里的是最終輸出特征圖中第c個通道的值,Fscale(·)是縮放操作,uc是一個二維矩陣,sc是權重,通過這種方法,uc矩陣中的每個元素都被相應的sc加權。本文在ResNet的基礎上引入了SE模塊來優化不同通道的特征處理,從而更加準確地捕獲ECG信號不同導聯間的相關性信息。
SE-ResNet模塊由批歸一化(batch normalization,BN)、ReLU、Conv層和SE構成,如圖5所示,其中二維Conv層(two-dimensional Conv,Conv 2D)的第1次Conv(Conv 2D 1)的卷積核大小分別為1×1、3×1、5×1、7×1,步長均為(1,1);Conv2D的第2次Conv(Conv 2D 2)的卷積核大小為1×1,步長為(2,1)。一維Conv層(one-dimensional Conv,Conv 1D)的第1次Conv(Conv 1D 1)的卷積核大小分別為1、3、5、7,步長為2;Conv 1D的第2次Conv(Conv 1D 2)的卷積核大小為1,步長為2;Conv 1D的第3次Conv(Conv 1D 3)的卷積核大小分別為1、3、5、7,步長均為1。通過使用不同大小的卷積核,SE-ResNet模塊能夠在不同尺度上捕獲特征,比較小的卷積核捕捉局部特征,而較大的卷積核用來捕捉更大范圍的特征。這種多尺度特征提取機制極大地增強了模型對ECG信號中各導聯間差異的敏感性,進一步提升了模型對不同導聯間特征的關注能力。

2.4 評價指標及實驗環境
本文采用準確率(Accuracy)、靈敏度(Sensitivity)和特異性(Specificity)來衡量模型的有效性。各項指標具體計算公式如式(8)~式(10)所示:
![]() |
![]() |
![]() |
式中,真陽性(true positive,TP)表示正類別中正確分類樣本的數量;真陰性(true negative, TN)表示負類別中正確分類樣本的數量;假陽性(false positive,FP)表示正類別中錯誤分類樣本的數量;假陰性(false negative,FN)是負類別中錯誤分類樣本的數量。
2.5 實驗環境
為避免過擬合,對數據進行歸一化操作。所有實驗均在一臺配備顯卡NVIDIA GeForce RTX 3090(NVIDIA Corporation,美國)和處理器Intel I9 13900KF(Intel Corporation,美國)的計算機上運行,該計算機操作系統為Windows10(Microsoft Corporation,美國)。模型開發環境為編程語言Python3.6(Python Software Foundation,美國)和深度學習框架TensorFlow 2.6(Google Inc,美國)。本實驗采用自適應矩估計(adaptive moment estimation,Adam)優化器進行模型優化,使用交叉熵損失函數評估模型性能,學習率為0.01,批量大小為128,訓練周期為200。
3 實驗結果
MSCSR模型訓練和測試過程曲線如圖6所示,隨著訓練周期的增加,訓練損失和測試損失均逐漸降低并趨于穩定;訓練準確率和測試準確率逐步上升,最終也趨于穩定。這些趨勢表明模型的性能持續提升,并且能夠很好地擬合訓練集和測試集的數據,顯示出模型在學習能力和泛化能力方面都有很好的效果。

3.1 消融實驗
本實驗在PICC 2011數據庫上進行消融實驗,實驗結果如表2所示。

3.1.1 消融CNN模塊
為揭示CNN模塊在整體模型中的影響,本實驗消融了CNN模塊,以比較有和沒有CNN模塊的模型性能差異。實驗結果表明,CNN模塊在模型中發揮了不可或缺的作用,它能夠充分提取不同導聯之間的相關信息,從而提升整體模型的性能。
3.1.2 消融并行SE-ResNet中不同內核卷積
本實驗分別消融了內核大小為3 × 1、7 × 1的通道,以探究這些內核尺寸對模型性能的影響。實驗證明,結合使用較小卷積核捕獲局部特征和較大卷積核捕獲全局特征的方法,不僅提升了模型性能,還增強了模型對導聯之間相關信息的關注能力。
3.1.3 消融全局池化模塊
本實驗消融了GMP,采用單一的GAP,以探究其對模型性能的影響。實驗結果表明,在模型中同時引入GMP和GAP對整體性能起到了積極作用。這兩種池化操作能夠從不同角度捕獲和整合特征,增強模型對信號關鍵信息的把握。
3.2 PICC 2011數據集的性能比較
MSCSR與現有文獻[19-24]提及的方法比較結果如表3所示,數據均采用的是PICC 2011數據。MSCSR模型在進行ECG信號質量評估時實現了較好的競爭力。這一優勢源于MSCSR模型不單純依賴ECG信號單拍QRS波群的形態特征,而是綜合考慮12導聯ECG信號之間的相關性,從而更有效地區分噪聲與真實的ECG信號。此外,MSCSR模型實現了優異的靈敏度和特異性,這樣意味著它在ECG信號質量評估任務中具有更好的普適性和更低的誤診率。綜上所述,從模型的性能角度來看,MSCSR模型在實際環境中能夠很好地區分可接受和不可接受的ECG信號。

3.3 交叉驗證實驗
雖然模型在PICC 2011數據集上表現優異,但這些指標可能受到數據分割偏差的影響,僅反映模型對這一特定測試集的擬合程度,難以全面代表其泛化能力。為了更全面地評估模型的泛化能力,本實驗采用5折交叉驗證。結果顯示,模型達到了(98.9 ± 0.007 1)%的準確率,表明了其對數據集良好的適應性和泛化能力;靈敏度和特異性分別為(97.5 ± 0.023 5)%和(99.4 ± 0.002 6)%,這說明模型對于真正類別的預測準確度較高;標準差的低值反映出模型在不同數據子集上的高穩定性。
4 討論
本研究通過分析不同導聯之間的相關性,構建了多尺度的特征提取模型MSCSR,用于多導聯ECG信號的質量評估,多尺度特征提取策略不僅增強了模型對ECG信號中細微變化的感知能力,還通過整合不同導聯的信息,提升了模型對ECG信號全局和局部特征的整體理解。
相比之下,盡管一些基于深度學習的方法通過引入注意力機制改善了特征提取,但在導聯間信息融合方面仍顯不足。此外,盡管有些研究探討了不同導聯之間的相關性,但在處理多尺度特征時仍然不夠充分,導致實際性能波動較大。還有一些方法基于QRS波群監測和圖像相似性指標,雖然在特定情境下表現出色,但普遍存在泛化能力不足和對噪聲敏感的問題。當面對非典型或質量較差的ECG信號時,這些方法的準確率和可靠性往往受到較大影響。
然而,盡管本文的方法在多個指標上表現優異,但模型的復雜性較高,這可能導致在實際應用中需要較高的計算資源。未來的工作可以探索如何優化模型結構,以降低其在移動設備中的應用成本。同時,可以進一步研究不同導聯信號在特征情況下的相關性變化,為ECG信號質量評估提供新的視角。
5 結論
本文提出了一種多尺度ECG信號質量評估的新方法,利用不同導聯之間的相關性,采用CNN模塊和四分支SE-ResNet模塊進行特征提取,用于12導聯ECG信號的質量評估。實驗結果顯示,MSCSR模型達到了99.5%的準確率、98.5%的靈敏度和99.6%的特異性。消融實驗進一步證明,基于不同導聯間相關性設計的各個結構對于整體模型的重要性。在進一步的交叉驗證實驗中,MSCSR達到(98.9 ± 0.007 1)%的準確率、(97.5 ± 0.023 5)%的靈敏度和(99.4 ± 0.002 6)%特異性。與其他先進方法相比,在性能上均有較大提升,因此MSCSR模型在實際ECG信號質量評估中具有較強的潛力。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:陳誠主要負責算法的實現以及論文的撰寫;張愛華、馬玉潤主要負責實驗的整體安排以及論文修訂;漆宇晟、李佳琪負責數據的分析以及論文修訂。