Open nogawanogawa opened 10 months ago
https://arxiv.org/abs/2308.14963
Jimmy Lin, Ronak Pradeep, Tommaso Teofili, Jasper Xian
(なし)
昨今のNNの検索への応用は、最近ではembeddingによって表現される表現学習に焦点が当てられている。
現在では、embeddingを用いた検索には多数のembeddingを管理する必要があり、ベクトルデータベースが必要といった主張も少なくない。
現在広く普及しているLuceneベースの検索エコシステムは、表現学習の最近のトレンドへの適応が遅れているかもしれないが、一方で大きな投資を行っており、今後ベクトルデータベースなしで検索にembeddingに組み込む際の機能的な差分は見当たらない。
このように、embeddingを用いた検索は有望であるが、そのためにベクトルデータベースが必要であるということにはならない。
追加のベクトルデータベースなしでembedding検索が十分実用的であることを示す。
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev.https://github.com/wantedly/machine-learning-round-table/issues/210
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!