Open Qia98 opened 3 months ago
GroundingDINO是一个非常棒的基于文本提示的开集目标检测工作,你们有想法探究一下基于图像提示的开集目标检测模型吗? 目前MQ-Det是一个更接近的工作,他们采用文本提示 + 图像提示来做目标检测。
i have the same question, how to generate the heatmap on VLM such as Grounding dino or GLIP
GroundingDINO是一个非常棒的基于文本提示的开集目标检测工作,你们有想法探究一下基于图像提示的开集目标检测模型吗? 目前MQ-Det是一个更接近的工作,他们采用文本提示 + 图像提示来做目标检测。