ichiroex / nlp-papers

a brief summary of the papers I read
3 stars 0 forks source link

Attract Me to Buy: Advertisement Copywriting Generation with Multimodal Multi-Structured Information #14

Open ichiroex opened 2 years ago

ichiroex commented 2 years ago

Zhang, Zhipeng, Xinglin Hou, Kai Niu, Zhongzhen Huang, Tiezheng Ge, Yuning Jiang, Qi Wu, and Peng Wang. 2022. “Attract Me to Buy: Advertisement Copywriting Generation with Multimodal Multi-Structured Information.” arXiv [cs.CL]. arXiv. http://arxiv.org/abs/2205.03534.

解決したい課題

従来のマルチモーダルテキスト生成(例えば、動画キャプション生成)では、「何が起きているか、何があるか」という観点の生成が中心だった。これらは広告文生成の観点では十分ではない。 本タスクにおけるチャレンジは2点ある

提案手法

データセット構築

www.taobao.comよりデータ収集

スクリーンショット 2022-06-27 10 02 37

モデル

スクリーンショット 2022-06-27 10 03 36

結果

他の手法との比較. 他の手法の説明はない. なぜ他の手法と比べて優れているかよくわからない.

スクリーンショット 2022-06-27 10 18 02

Ablation studyの結果. Structured informationがあることでinformativeになっている.

スクリーンショット 2022-06-27 10 20 00

Conceptualizationがある方が良い

スクリーンショット 2022-06-27 10 20 58

Hard homologous metric branch / color / material / people / time & season について、ground truthと比較して、正解率/エラー率を算出.

スクリーンショット 2022-06-27 10 30 28

人手評価結果 生成分が商品説明文として利用可能かどうか、という観点で評価を実施した。

スクリーンショット 2022-06-27 10 33 20