Open nogawanogawa opened 1 year ago
https://arxiv.org/abs/2305.06569
Wenyue Hua, Shuyuan Xu, Yingqiang Ge, Yongfeng Zhang
SIGIR-AP 2023
生成タスクである以上生成するIDに何らかの意味を持たせないと、全く見当違いのIDを生成してしまう恐れがある。しかし、LLMで扱えるような意味を持ったIDをアイテムに一意に割り当てるのは簡単ではない。アイテム数は膨大に存在しそれらに対して一意のIDを割り当てる必要があり、自然言語と互換性がありLLMの学習やプロンプトで扱えなければいけない。 さらに、生成されたテキストが実際のアイテムと一致することを保証しなければいけない(ハルシネーションの回避)が、制約付き複合法を用いると長文生成能力を持つLLMの柔軟性を損なってしまう。
生成的推薦で使用しやすいIDの生成方法の検討
下記のように、ログに登場した順にIDを降っていく。
このとき同様のアイテムに対するインタラクションが発生した時にはそのIDを使用する。
協調フィルタリングの成分を反映させたインデックス法。 アイテム(ノード)とその共起度(エッジ)をグラフ構造で表現し、ノードクラスタリングによってインデックスとなるラベルを決めていく
コンテンツベースのインデックス。カテゴリ情報の組み合わせをIDとする。
複数の手法の組み合わせ。
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. https://github.com/wantedly/machine-learning-round-table/issues/217
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!