Open nogawanogawa opened 5 months ago
(PDFのダウンロードリンクしか見つからなかったのでリンクは付けてないです)
モデルの全体像
https://arxiv.org/abs/2404.11731
Thomas Vecchiato, Claudio Lucchese, Franco Maria Nardini, Sebastian Bruch
SIGIR ’24
今日の情報検索ではANNは非常に重要な要素となっている。 ANNによる高速化の一般的なアプローチはクラスタリングであるが、どのクラスタ内でNNのスコアを計算するかについてはクラスタリングアルゴリズムに沿ったものが利用されている。
一方、ルーティングはクエリに対してもっとも関連するクラスタを発見するランキング問題と考えることができる。そのため、ルーティング自体もランク学習によって精度を向上させる余地がある。
top-1の問題では従来のクラスタリングをそのまま利用したものより高いaccuracyを示す
top-kの問題にしたとしても、従来のクラスタリングをそのまま利用したものより高いaccuracyを示す
embeddingを変えても優位な傾向は変わらず
以下のような指標をチェックする
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. https://github.com/wantedly/machine-learning-round-table/issues/242
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!