如何加快RAG流程的速度？

RUC-NLPIR / FlashRAG

⚡FlashRAG: A Python Toolkit for Efficient RAG Research

MIT License

1.17k stars 85 forks source link

我正在使用llama3-70B，framework: hf作为来运行整个RAG流程，并且显卡资源足够，如何加快整体RAG流程的速度呢？

我注意到：在config.yaml文件中，存在retrieval_batch_size，rerank_batch_size，generator_batch_size这几个参数，但似乎增大这些参数,并不会减少 Retrieval process 所消耗的时间：比如我设置 retrieval_batch_size: 1024 ，虽然每一次Retrieval process 的数量从14减小到4，但总体时间并不会缩短，仍为1小时左右

RUC-NLPIR / FlashRAG

如何加快RAG流程的速度？ #28