Open tkuri opened 2 years ago
画像中の物体の属性(色・形・状態・行動等)を予測する。3つの異なる特徴抽出器を利用し、各特徴抽出器の適切な重みを学習するために自己注意の手法を採用。3つの異なる特徴抽出器を2つのデータセットにおいてある指標(mR)で従来技術に対して5%以上の向上。
https://openaccess.thecvf.com/content/CVPR2022/html/Metwaly_GlideNet_Global_Local_and_Intrinsic_Based_Dense_Embedding_NETwork_for_CVPR_2022_paper.html
https://github.com/kareem-metwaly/glidenet
論文概要
画像中の物体の属性(色・形・状態・行動等)を予測する。3つの異なる特徴抽出器を利用し、各特徴抽出器の適切な重みを学習するために自己注意の手法を採用。3つの異なる特徴抽出器を2つのデータセットにおいてある指標(mR)で従来技術に対して5%以上の向上。
https://openaccess.thecvf.com/content/CVPR2022/html/Metwaly_GlideNet_Global_Local_and_Intrinsic_Based_Dense_Embedding_NETwork_for_CVPR_2022_paper.html
Code
https://github.com/kareem-metwaly/glidenet