Open xiaoToby opened 4 months ago
抱歉,没有使用过FastAPI,。建议到FastAPI repo提问
现在能运行了,加上了环境变量 cuda_visiable_device
但是现在还有一个问题,因为这是一个api,但是每次运行的时候都会要j如进行图的操作:
应该如何提前配置好trust_remote_code=True? @staoxiao
bge-reranker-v2-m3不需要trust_remote_code参数,这个是jina-reranker需要的参数。 你可以参考jina官方的做法调用其reranker
建议在flag_reranker.py中159行 self.model = AutoModelForSequenceClassification.from_pretrained(model_name_or_path, cache_dir=cache_dir, trust_remote_code=True)
我使用了该文档调用了bge-reranker-v2-m3模型
使用该测试文档测试模型:
GPU资源使用情况截图:
现在就是一直这样卡着: