feat llm: improve similarity search

ark2016 commented 2 weeks ago

upd: new metric (L2 Distance -> Cosine Similarity) add: some demo for DB

TonitaN commented 1 week ago

Мне тут вообще не очевидно, что был поиск подходящего подбора эмбеддинга. Нужно проверить:

если все вопросы считаются близкими, что возможно, с учётом того, что все они из ТФЯ, то всюду будут лезть машины Тьюринга или что-то, что случайным образом окажется в массиве самым первым
сколько вопросов попадает в контекст, если вообще нет ограничения 10?
насколько часто в контекст попадают вопросы с ответами, содержащие минимальное число терминов, типа "самоприменимой МТ"?

stewkk commented 1 week ago

поправим комменты в #75

BaldiSlayer / rofl-lab1