Мне тут вообще не очевидно, что был поиск подходящего подбора эмбеддинга. Нужно проверить:
если все вопросы считаются близкими, что возможно, с учётом того, что все они из ТФЯ, то всюду будут лезть машины Тьюринга или что-то, что случайным образом окажется в массиве самым первым
сколько вопросов попадает в контекст, если вообще нет ограничения 10?
насколько часто в контекст попадают вопросы с ответами, содержащие минимальное число терминов, типа "самоприменимой МТ"?
upd: new metric (L2 Distance -> Cosine Similarity) add: some demo for DB