Open 1487879421888 opened 8 months ago
我去翻了下文档,这个功能可以做到。但是gpt-3.5-turbo
是不具备视觉能力的,得用gpt-4-vision-preview
模型
目前为止,开源的image2text模型依赖比较多,需要transformers torch等框架的支持,依赖比较复杂庞大,为了保持项目的精简,使用开源模型进行识图的功能后期会新开一个项目为此项目提供相应可选的image2text-api。当前阶段后续会添加gpt-vision-preview的支持。 如果你能找到一些支持识图的api我也可以接入支持
作者你好,我之前看到一个,使用3.5的key,然后进行函数调用,可以实现,你任意发一张图片,然后可以识别,返回结果。请问作者知道这个不?