devcxl / WeChatBot

WeChatBot 基于ItChat-UOS的 个人微信号OpenAI机器人
MIT License
49 stars 9 forks source link

图片识别的函数接口 #10

Open 1487879421888 opened 8 months ago

1487879421888 commented 8 months ago

作者你好,我之前看到一个,使用3.5的key,然后进行函数调用,可以实现,你任意发一张图片,然后可以识别,返回结果。请问作者知道这个不?

devcxl commented 8 months ago

我去翻了下文档,这个功能可以做到。但是gpt-3.5-turbo是不具备视觉能力的,得用gpt-4-vision-preview模型

devcxl commented 7 months ago

目前为止,开源的image2text模型依赖比较多,需要transformers torch等框架的支持,依赖比较复杂庞大,为了保持项目的精简,使用开源模型进行识图的功能后期会新开一个项目为此项目提供相应可选的image2text-api。当前阶段后续会添加gpt-vision-preview的支持。 如果你能找到一些支持识图的api我也可以接入支持