hajisho / world_model2022_group22

MIT License
0 stars 0 forks source link

FLIN: A Flexible Natural Language Interface for Web Navigation #3

Open bishopfunc opened 1 year ago

Rn86222 commented 1 year ago

Summary

  1. どんなもの?(Abstract,Conclusion) 自然言語によるwebサイトの操作のためのFLINというモデルの提案。クリックやタイピングなどローレベルの動作ではなく、概念レベルの動作(ユーザーがウェブサイトをひと目見たときに知覚するものを表現するもの)をマッピングし、ある特定のサイトだけでなくそれに似たサイトに対応できるようにしている。

  2. 先行研究と比べてどこがすごいの?(先行研究,どんな問題を解決した) 自然言語によるweb操作のタスクを扱うモデルはいくつかあるが、それらには、 ・異なるサイト間の汎化ができていない ・パラメータつきの行動を扱っていない ・実際に実行できるような操作のパスを出力しない ・多クラス分類をしていて状態を持たないため同じwebサイト中のページ間で意味が重複するようなintentを扱っていない 等の問題点があった。それらを解決しようとしている。

  3. 技術や手法の"キモ"はどこにある?(新規点,どう解決した) 概念レベルの自然言語のweb操作を扱うアプローチをとり、自然言語の指示文を意味解析して操作命令にマッピングしている。

  4. どうやって有効だと検証した?(実験手法)

  5. 議論はあるか?(未解決点,応用例)

次に読むべき論文? (任意)より詳しい手法の理解

論文情報・リンク

https://arxiv.org/abs/2010.12844 Mazumder, Sahisnu, and Oriana Riva. "Flin: A flexible natural language interface for web navigation." arXiv preprint arXiv:2010.12844 (2020).

Google Scholar 被引用数:7

国際会議: