Open idekazuki opened 4 years ago
Related Work Image correspondence
Multi-modal matching 画像と言語の質問について共同に推論する。 クロスモーダル表現の学習。複数モーダルの共通のシーンを学習。 本研究では複数の画像をいつの間取り図に対応させるので1対1の対応ではない。
Indoor scene understanding 明示的な幾何学推論を用いる 本研究では深層学習を適用。
手法
学習時はpositive sample , negative sample= 1:1 random 50%
異なるモダリティのデータの対応関係を推論する。不動産の内覧の写真と、その写真空間がある不動産の間取り図なのかを推測。人間の精度基準を使って評価。