Open ChengRuiLiang opened 3 months ago
有什么方法能够对它进行性能优化,有没有适合重排模型的推理加速框架
想减少运行时间的话可以尝试使用低层输出、减少rerank的范围或使用bge-reranker-v2-m3 关于推理加速框架方面我们没有具体探究过
想减少运行时间的话可以尝试使用低层输出、减少rerank的范围或使用bge-reranker-v2-m3 关于推理加速框架方面我们没有具体探究过
非常感谢
rerankerllm.compute_score 的use_dataloader=False 试试呢,我跑起来还挺快
同求一个推理加速方案
rerankerllm.compute_score 的use_dataloader=False 试试呢,我跑起来还挺快
默认就是 False
在A5000的显卡上,对100条数据进行重排序,需要5s才能完成