fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

多様なPET/CTデータセットからの半教師あり擬似ラベル付けと学習を用いた肺がん生存予測の向上 #853

Open fulfulggg opened 13 hours ago

fulfulggg commented 13 hours ago

タイトル: 多様なPET/CTデータセットからの半教師あり擬似ラベル付けと学習を用いた肺がん生存予測の向上

リンク: https://arxiv.org/abs/2412.00068

概要:

本研究では、肺がん(LCa)生存予測の向上を目的として、PET/CT画像から抽出される手作業による放射線画像特徴量(HRF)と深層学習による放射線画像特徴量(DRF)をハイブリッド機械学習システム(HMLS)で解析し、多様なデータセットを用いた疑似ラベル戦略による半教師あり学習(SSL)を検討した。TCIAおよび当施設データベースからPET/CT画像付きのLCa患者199例と、TCIAから頭頸部がん(HNCa)のPET/CT画像408例を収集した。ViSERAソフトウェアを用いて、セグメンテーションされた原発腫瘍からPySERAにより215個のHRF、3Dオートエンコーダにより1024個のDRFをそれぞれ抽出した。教師あり学習(SL)戦略では、HRFとDRFの両方に対して、主成分分析(PCA)と4つの分類器を組み合わせたHMLSを採用した。SSL戦略では、ランダムフォレストアルゴリズムでラベル付けした408例のHNCa疑似ラベルデータを追加することでデータセットを拡張し、同じHMLS技術を用いた。さらに、生存ハザード比分析には、PCAと4つの生存予測アルゴリズムを組み合わせた手法を用いた。SSL戦略はSL法よりも優れた性能を示し(p値<0.05)、PET由来のDRFとPCA+多層パーセプトロン(MLP)の組み合わせで平均精度0.85を達成した。一方、SL戦略では、CT由来のDRFとPCA+K近傍法(KNN)の組み合わせで0.65であった。また、CTから抽出されたHRFとDRFの両方に対して、PCAとComponent-wise Gradient Boosting Survival Analysisを組み合わせた手法は、平均c-index 0.80、ログランク検定p値<<0.001を達成し、外部テストでも確認された。データが少ない状況では、HRFとSL戦略からDRFとSSL戦略に移行することで、CTまたはPET単独でも高い予測性能を達成できる。

fulfulggg commented 13 hours ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました:

以下の新しいラベルが作成され、適用されました:

fulfulggg commented 13 hours ago

論文要約

この論文は、PET/CT画像を用いた肺がんの生存予測精度向上を目的として、半教師あり学習(SSL)を用いた新しい手法を提案しています。