Open idekazuki opened 4 years ago
例示画像からマスクされた空間チャンネル注意と自己監視を用いた任意のシーンを合成する
効率的な分離されたAttentionを介して、2つの任意のシーンの間の対応関係をモジュール化するMasked Spatial-Channel Attention(MSCA)を提案。
グローバル特徴と局所特徴の調整と合成を共同で行う。
画像合成に対応するsemanticをモデル化する新しいcross-attention mechanismを提案。
入力は、semantic label map c1 参照画像x2, x2に対応する解析済みsemantic label map c2,
出力は、x2のスタイルとx1の構造に一致する画像x12
ジェネレーターは3つの部分で構成。 1)特徴抽出 2)特徴の位置合わせ 3)画像の合成
セアンは領域ごとのプーリング、これはattenitonを使った複雑な構造になっている。
例示画像からマスクされた空間チャンネル注意と自己監視を用いた任意のシーンを合成する
効率的な分離されたAttentionを介して、2つの任意のシーンの間の対応関係をモジュール化するMasked Spatial-Channel Attention(MSCA)を提案。
グローバル特徴と局所特徴の調整と合成を共同で行う。
画像合成に対応するsemanticをモデル化する新しいcross-attention mechanismを提案。