Open positive666 opened 6 days ago
感谢提供的项目idea 1.if only text input , which is equivalent to Mindsearch? 2.如果VLM的能力经过微调或者是更大的vlm是否可能替代掉ground dino? 有没有考虑提供分离大模型服务的后端API? 3.搜索模型使用的是Internlm2原因是否只是因为这个模型经过相关数据训练, 这个几个步骤有没有可能可以合并为一个VLM进行,目前因为模型能力受限。所以做的过渡组合?
有什么进一步的问题欢迎接着讨论
感谢解答,空余时间会读下Paper去学习下,另外想请教下 1.vlm 微调这里指的是需要冻结Llm部分吗 2.我自己有一个大模型平台,之前接过Mindsearch作为我的AI搜索应用,但是我觉得还不太成熟,咱们这个目的主要是解决图片搜索的场景吗?还是加深通用场景 图像caption的能力?
好的 明白感谢解答,另外这个现在有没有通用性,比如只输入文本的网络搜索
感谢提供的项目idea 1.if only text input , which is equivalent to Mindsearch? 2.如果VLM的能力经过微调或者是更大的vlm是否可能替代掉ground dino? 有没有考虑提供分离大模型服务的后端API? 3.搜索模型使用的是Internlm2原因是否只是因为这个模型经过相关数据训练, 这个几个步骤有没有可能可以合并为一个VLM进行,目前因为模型能力受限。所以做的过渡组合?