AILab-CVC / YOLO-World

[CVPR 2024] Real-Time Open-Vocabulary Object Detection
https://www.yoloworld.cc
GNU General Public License v3.0
4.06k stars 391 forks source link

@shihuojian #417

Open Jeremy-J-J opened 3 weeks ago

Jeremy-J-J commented 3 weeks ago
          @shihuojian

我个人不接受你的评价

  1. 首先,这不是造轮子,希望能看清YOLO-World本身的价值和意义。
  2. 我赞同Grounding-SAM是一个不错的工作,但不代表我们的效果会比他们差,我们从速度、精度目前是经过严格的对比,是优于Grounding DINO的,请查看论文,如果你觉得逊色,要么你不会用,要么摆出明确的指标,我们可以公平对比?其次,SAM不是Grounding-SAM的contribution,我们也可以接入SAM,目前社区提供了YOLO-World Efficient-SAM。
  3. 本项目开源了全套训练、微调、以及推理的代码,如果你了解Open-Vocabulary Deteciton这个领域,你应该知道类似于Grounding DINO的工作是没有开源预训练的,所以我希望知道什么叫所谓的“意义不大”?
  4. 本项目已经在内部项目中实际应用起来,希望给我一个没什么优势的理由。

我欢迎你来battle,我做好开源项目,支持大家随意使用,提供各种上下游的支持,开源所有预训练模型,支持免费商用,我想知道什么叫做意义不大?但我希望你在说出issue标题的时候,思考下,自己又做成了什么?

Originally posted by @wondervictor in https://github.com/AILab-CVC/YOLO-World/issues/108#issuecomment-1983441261

Jeremy-J-J commented 3 weeks ago

说得好