Open ichiroex opened 2 years ago
Zhang, Zhipeng, Xinglin Hou, Kai Niu, Zhongzhen Huang, Tiezheng Ge, Yuning Jiang, Qi Wu, and Peng Wang. 2022. “Attract Me to Buy: Advertisement Copywriting Generation with Multimodal Multi-Structured Information.” arXiv [cs.CL]. arXiv. http://arxiv.org/abs/2205.03534.
従来のマルチモーダルテキスト生成(例えば、動画キャプション生成)では、「何が起きているか、何があるか」という観点の生成が中心だった。これらは広告文生成の観点では十分ではない。 本タスクにおけるチャレンジは2点ある
www.taobao.comよりデータ収集
Key
Value
他の手法との比較. 他の手法の説明はない. なぜ他の手法と比べて優れているかよくわからない.
Ablation studyの結果. Structured informationがあることでinformativeになっている.
Conceptualizationがある方が良い
Hard homologous metric branch / color / material / people / time & season について、ground truthと比較して、正解率/エラー率を算出.
人手評価結果 生成分が商品説明文として利用可能かどうか、という観点で評価を実施した。
解決したい課題
従来のマルチモーダルテキスト生成(例えば、動画キャプション生成)では、「何が起きているか、何があるか」という観点の生成が中心だった。これらは広告文生成の観点では十分ではない。 本タスクにおけるチャレンジは2点ある
提案手法
データセット構築
www.taobao.comよりデータ収集
モデル
Key
で汎化するValue
を引っ張ってくる結果
他の手法との比較. 他の手法の説明はない. なぜ他の手法と比べて優れているかよくわからない.
Ablation studyの結果. Structured informationがあることでinformativeになっている.
Conceptualizationがある方が良い
Hard homologous metric branch / color / material / people / time & season について、ground truthと比較して、正解率/エラー率を算出.
人手評価結果 生成分が商品説明文として利用可能かどうか、という観点で評価を実施した。