deepseek-ai / DeepSeek-VL

DeepSeek-VL: Towards Real-World Vision-Language Understanding
https://huggingface.co/spaces/deepseek-ai/DeepSeek-VL-7B
MIT License
2.08k stars 195 forks source link

是否评估过有作为web或者windows的agent的潜力? #23

Open DirtyKnightForVi opened 8 months ago

DirtyKnightForVi commented 8 months ago

如题。 目前开源的多模态大模型似乎都只有有限的agent能力,要么不能完全理解文字,要么图像识别能力无法兼顾,要么没有任务规划能力,要么缺乏函数调度或者解释器能力。

deepseek目前的模型里,67B有文本agent的潜力,但是太大。

很期待deepseek在agent领域的发力。