OFA-Sys / Chinese-CLIP

Chinese version of CLIP which achieves Chinese cross-modal retrieval and representation generation.
MIT License
4.21k stars 439 forks source link

请问这个项目有图片转成中文描述的功能吗,类似clip的interrogator #247

Closed mmix574 closed 7 months ago

mmix574 commented 7 months ago

clip_interrogator.py

我希望通过图片可以解析出文字,想知道这个是否可行,或者有没有相关的资料呢,谢谢!

yangapku commented 7 months ago

您好,关于图像描述任务,欢迎参见我们团队的最新工作Qwen-VL哈~ 欢迎关注通义千问系列模型 https://github.com/QwenLM/Qwen-VL