RUC-NLPIR / FlashRAG

⚡FlashRAG: A Python Toolkit for Efficient RAG Research
https://arxiv.org/abs/2405.13576
MIT License
1.17k stars 85 forks source link

如何加快RAG流程的速度? #28

Closed lwj2001 closed 3 months ago

lwj2001 commented 3 months ago

image 我正在使用llama3-70Bframework: hf作为来运行整个RAG流程,并且显卡资源足够,如何加快整体RAG流程的速度呢?

我注意到:在config.yaml文件中,存在retrieval_batch_sizererank_batch_sizegenerator_batch_size这几个参数,但似乎增大这些参数,并不会减少 Retrieval process 所消耗的时间:比如我设置 retrieval_batch_size: 1024 ,虽然每一次Retrieval process 的数量从14减小到4,但总体时间并不会缩短,仍为1小时左右

ignorejjj commented 3 months ago

请先确认花费在检索和生成上的时间分别是多久。

如果检索时间比较长(10000条数据上花费>20分钟):

  1. 可能是faiss版本不兼容的问题,参考#25 使用conda重装
  2. 使用gpu版本的faiss,在config中设置faiss_gpu为True

如果是生成时间比较长:

  1. 使用vllm框架进行模型的加载