nogawanogawa / paper_memo

4 stars 0 forks source link

Meta Knowledge for Retrieval Augmented Large Language Models #119

Closed nogawanogawa closed 1 week ago

nogawanogawa commented 2 weeks ago

論文URL

著者

Laurent Mombaerts, Terry Ding, Adi Banerjee, Florian Felice, Jonathan Taws, Tarik Borogovac

会議

KDD 2024

背景

従来のRAGはretrieve-then-readフレームワークによって行われてきた。

ただし、

といった経緯より、期待する推論は難しくなっている

目的

アプローチ

ひとことメモ

nogawanogawa commented 2 weeks ago

背景

従来のRAGはretrieve-then-readフレームワークによって行われてきた。

ただし、

といった経緯より、期待する推論は難しくなっている

nogawanogawa commented 2 weeks ago

目的

アプローチ

nogawanogawa commented 2 weeks ago

提案

image

Synthetic QA Generation

データに対してカテゴリー(研究分野やベンチマーク用Appの種類など)に分類し、メタデータを作成する。 次に、メタデータを使用してQAペアを作成する。

このメタデータとQAのQを使用した埋め込みをベクトル化して使用して検索を行う。

Generation of Meta Knowledge Summary

メタデータの特定の組み合わせに対してメタナレッジサマリーを作成する。 関心のあるメタデータでタグ付けされた質問の概念を要約することでメタナレッジサマリーとしている。

Augmented Generation of Queries and Retrieval

クエリ拡張の際には、検索のトピックに基づいてメタナレッジを検索し、メタナレッジサマリーに基づいて複数のサブクエリに拡張、元の水つもんに関連するフィルタリングされたDBで並列検索を行う。

nogawanogawa commented 2 weeks ago

性能評価

image