CosmosShadow / gptpdf

Using GPT to parse PDF
MIT License
2.76k stars 212 forks source link

通过转换成openai api接口的gemini-1.5,提示接口错误 #26

Closed codegitnoob closed 1 month ago

codegitnoob commented 2 months ago
ERROR - Error code: 400 - {'error': {'message': 'Request contains an invalid argument. (request id: 2024070)', 'type': '', 'param': '', 'code': 400}}
Traceback (most recent call last):
  File "/gptpdf/.venv/lib/python3.12/site-packages/GeneralAgent/skills/llm_inference.py", line 152, in _llm_inference_with_stream
    response = client.chat.completions.create(messages=messages, model=model, stream=True, temperature=temperature)

已将gemini-1.5转化为openai的API接口,提示上述参数错误。 单独使用GeneralAgent是可以返回正常结果的。

是不是因为图片的识别接口上,gemini-1.5还有一点特殊性?

CosmosShadow commented 1 month ago

可能是的。 如果有接入gemini的需求,建议提一个issue: 支持gemini