<複雑な現象をわかりやすく映像化します>

救急車両内の心電図を人工知能(Artificial Intelligence)で解析するシステム構築と救急医療への適応

 

(1) 実施内容

本研究では、深層学習を用いて病院前心電図の重症度分類モデルを構築し、実際の救急車両から送られた臨床データでテストした。分類精度はWeighted F1-Score=0.88、AUC=0.95を示した。さらに、臨床データによるカッパ係数は医療機関で十分、利用できることを示唆している。本アプローチを用いることで心電図伝送段階でのスクリーニングにも役立つ。

①データ収集と前処理

2017年9月から2020年9月までに岩手県立二戸病院に心電図が伝送された患者を登録した。合計120人の患者のPH-ECGがPCベースの心電計(EC-12RS ラブテック社製、Debrecen, Hungary)によって取得され、グッドケア社のワイヤレス12誘導心電図伝送システム「富士の国」によって伝送された。また、データは画像変換アプリケーション「MFER Image converter」によってJPEG形式の画像ファイルに変換されてから伝送された。含まれる患者の平均年齢は77±14.5 歳だった。患者の約50%が男性であった。このうち、画像不鮮明の10症例が除外され、最終的なデータとして110症例を登録した。

各患者のPH-ECGデータに対して循環器内科医が「正常」「軽度または中等度」「重度」の3段階の重症度分類を行った。画像をネットワークへの入力に適したサイズにするために、1つの12誘導心電図から36個の1誘導心電図が切り出された。各画像には細線化およびニ値化が施された。最終データ3960枚のうち、2652枚が正常波形、1308枚が異常波形だった。内訳を表1に示す。次節の実験では、このうち80%を学習データ、20%をテストデータとして使用した。また、学習データのうち合計20%を検証データとして用い、5回に分けて交差検証を行った。

②心電図解析用ニューラルネットワーク構築

PH-ECGからの重症度分類モデルにはEfficientnetB0がベースとして使用された(図1)。全ての入力画像は線形補間アルゴリズムによって224×224ピクセルにサイズ変更された。ミニバッチサイズは512、エポックを100とした。最適化手法にはAdamオプティマイザが選択された。Adamオプティマイザには4つのハイパーパラメータが存在し、それら全てが重要であるとされている。そのためベイズ最適化を用いて探索を行った。ベイズ最適化は未知の空間からガウス過程の事前分布を用いて、目標関数の最適解を探索する手法である。

モーメント推定に使う指数減衰率を示すβ1とβ2、ゼロ除算を防ぐためのオフセットであるε、および初期学習率αの4つを探索し、その範囲はそれぞれ0.8~0.99、0.9~0.999、1e-9~1e-7、1e-6~1e-2と設定した。探索の反復を50回行い、得られた推定最適解はそれぞれ0.98657、0.98762、9.8352e-08、0.00096726であった。しかし、50回の探索において、Adamオプティマイザの既定値であるβ_1=0.9、β_2=0.999, ε=1e-8, α=0.001と設定した際の結果を上回る推定解は得られなかった。また、モデルの広さ、深さ、入力解像度も学習に影響を及ぼすハイパーパラメータであるが、EfficientnetB0の初期値に固定し、探索を行わなかった。これらの値には相関があり、Tanらのベースラインの時点で入力解像度に応じて広さと深さが既に適切に調整されているためである。

入力された心電図画像は、画像の局所的な特徴抽出を担う畳み込み層と、局所ごとに特徴をまとめあげるプーリング層によって特徴抽出され、バッチ正規化層によってサンプル分布特性を維持しながら層間の分布の違いが排除された。また、グローバル平均プーリング(GAP)によって、特徴マップの各チャネルごとに画像空間方向における平均値が算出され、その平均値が各特徴マップの値として使用された。また、全結合層の直前でドロップアウト(0.25)が実行され、モデルの過学習が抑制された。最終出力層は確率を提供するSoftmax関数を使用して活性化された。学習の結果、検証Lossは7エポック目で最小となり、検証精度は15エポック前後から横ばいを続けた。また、ドロップアウトがあっても、損失関数には過学習傾向がみられた。これはデータの少なさが原因と考えられる。

Table 1. クラス分類と症例数

Class Num
Normal 2652
Mild/Moderate 571
Severe 737

 

http://advancedvislab.com/wp/wp-content/uploads/CNNネットワーク図.png

図1  ニューラルネットワークのモデル図

③心電図解析用ニューラルネットワークのテスト結果、可視化例

提案したモデルが何を見ているかを可視化するために、最終的な畳み込み層のClass Activation Map (CAM)を生成した。CAMは、モデルが焦点を当てた部分をヒートマップで出力する(図2)。提案されたネットワークによって4つの分類器が作成され、テストデータセットの心電図画像が診断された。

http://advancedvislab.com/wp/wp-content/uploads/CAMの事例.jpg

図2 Class Activation Map(CAM)を用いた心電図の表示例

 

(2) 研究成果

実世界のデータを使用した救急車からの心電図の重症度分類には様々な制限がある。病院内で撮影された心電図と比較してデータの蓄積が少なく、STEMIの割合はわずか12.9% (512/3960) だった。また、我々の調査母集団の心電図データは波形ではなく画像伝送・蓄積されており、救急車両の振動や患者の体動、あるいは電極の脱落によって発生するノイズの除去が難しい。そのため心電計が除去しきれなかったノイズを含んだ状態でモデルを構築する必要があった。また、日本では、病院前の12誘導心電図は、First medical contactの現場でEmergency medical service担当者によって日常的に実施されておらず、大規模なデータセットを構築すること難しかった。そのため、今回作成した分類モデルのパフォーマンスの傾向として、データが少ないクラスのRecallが低くなる傾向がみられた。特に、STEMIのような経時的に変化する症例では特徴の学習に必要とするデータ数も多くなると考えられ、学習データの枚数を増やすことで分類精度の改善が可能と推察する。

救急隊が現場で撮影する心電図は、心疾患のより早期の心電図変化を示していることが多く、In-Hospital-ECGと異なる特徴を有するため、PH-ECGを使用した診断モデルの作成には意義がある。PH-ECGを使用した機械学習ベースの予測アルゴリズムは少ないながらも、以前に報告されている。Al-Zaitiらは1244人のアメリカ人のPH-ECG信号を対象として、ACSの予測を行い、ロジスティック回帰、勾配ブースティングマシン、および人工ニューラルネットワークの組み合わせでAUC=0.82を示した。Chenらは台湾中部の救急車から取得した2907人のPH-ECG信号を対象として、STEMIの予測を行い、1D-CNNとLSTMの組み合わせを使用してAUC=0.997を示した。ただし、Simonsonが示した人種間による心電図の基準値の相違から、心電図のAI解析は人種別に作成されたモデルを使用することが望ましいと考えられ、我々の知る限り、日本人を対象とした研究は1件だけである。Takedaらは日本の都市部で取得された555人のバイタルサイン、3誘導ECGモニタリング、および症状を含む17の特徴を使用して、サポートベクターマシンを用いたACSの診断およびサブカテゴリの予測を行い、AUC=0.864を示した。