zerebom / paper-books

@zerebom が読んだ技術書、論文をまとめています。推薦システム系が多いです。
https://github.com/zerebom/paper-books/issues
2 stars 0 forks source link

[WIP]Diagnosis of Coronavirus Disease 2019 (COVID-19) with Structured Latent Multi-View Representation Learning #30

Open zerebom opened 4 years ago

zerebom commented 4 years ago

コロナウイルスの自動診断をするためのパイプラインを提案した論文。 CT画像のCT値の分布などから得られる様々な特徴量を、次元圧縮し学習することで、どの特徴量も統一的に扱えるようにし、精度や汎化性能を高めたと主張している。

src: https://arxiv.org/abs/2005.03227

Abstract

急速に感染者を伸ばしているコロナウイルス。 今まではPCR検査を行ってきたが、準備が大変な上に偽陽性が多く、代わりの診断方法の考案が急務である。 本研究ではコロナウイルス感染者のCT画像から得られる様々な特徴量を潜在空間に写像し隠れ変数を作成することで精度の向上をはかる。

Introduction

現在、コロナウイルスのデータセットはImageNetのような巨大なものは揃っていない。 そのような状態でも高い精度を出すために、CT画像から得られる情報は少しでも多く取得したい。そのため様々な形式で特徴量を抽出する。しかしこの方法だと特徴量のshapeや統計量は大きくことなる。そこで、一定の方法を用いて次元圧縮を行うことで全ての特徴量を統一に扱い、精度の向上を目指す。

潜在空間を使って学習することは以下のようなメリットがある ・次元数が減るので、計算量が減る&次元の呪いを回避できる ・いろんな形式の特徴量を統一的に扱うことができる ・今回の課題に限らず、様々な課題にそのまま適応することができる。

Material

実験は以下のように行う 1495人のコロナウイルスのデータセットと1027人の市中肺炎患者のデータセットを使用。 これらのデータセットに対して、以下の7種類,189次元の特徴量を用意する。 全てのデータセットはVnetを用いてあらかじめ、病変領域、肺領域などがアノテーションされている。

Method

以下の3つの手順で行われる

  1. training dataから全ての特徴量が、できるだけ元の形に逆写像できるような空間へ飛ばせる写像を作る。
  2. 1で作った写像がtest data にも適応できるようにキャリブレーションする。
  3. 2で完成した特徴量を使ってFCNNで学習を行う。

Result

ロジスティック回帰、SVM、GNB、KNN,NNなど様々なモデルで学習したが、どれも 提案手法を通して作った特徴量を用いて学習した方が精度が上がった

感想