Open DirtyKnightForVi opened 8 months ago
如题。 目前开源的多模态大模型似乎都只有有限的agent能力,要么不能完全理解文字,要么图像识别能力无法兼顾,要么没有任务规划能力,要么缺乏函数调度或者解释器能力。
deepseek目前的模型里,67B有文本agent的潜力,但是太大。
很期待deepseek在agent领域的发力。
如题。 目前开源的多模态大模型似乎都只有有限的agent能力,要么不能完全理解文字,要么图像识别能力无法兼顾,要么没有任务规划能力,要么缺乏函数调度或者解释器能力。
deepseek目前的模型里,67B有文本agent的潜力,但是太大。
很期待deepseek在agent领域的发力。