Closed xiuqhou closed 4 months ago
Furthermore, RT-DETR-R50 outperforms DINO-R50 by 2.2% AP in accuracy and about 21 times in FPS
***差很多
的结论个人猜测更可能是代码层面的bug ( 原始模型也是参考DINO设计的 并没有发现精度差很多的现象 去掉你提到的操作更多的是从推理速度的角度考虑的这是不是说明RT-DETR的性能是来自图片输入尺寸的设计,而不是网络本身的优越性?
如果还有其他疑问 欢迎继续留言
感谢作者回复,您说的有一定道理,不过还是存在一些疑问。
(我可以通过堆数据增强将DINO训出远高于SOTA检测其CoDETR的结果,那你觉得能说DINO性能高于CoDETR吗?)
所以我个人觉得,不能拿 A模型+数据增强1 > C模型+数据增强2 就得到 A模型 > C模型 的结论,这会给阅读论文的人带来误导。
YOLOv3和YOLOv5的论文未经过同行评审,所以对他们之间的对比不作评价。
但为什么你论文中汇报的DINO速度会比我测的慢这么多(慢了2倍),而RT-DETR的速度会比我测的快这么多(快了3倍)?您导出的DINO和RT-DETR的tensorrt engine文件,能否分享一下我亲自测试看看速度。
例如RT-DETR vs XX-DINO,而不是RT-DETR vs DINO。
我疑惑的并不是RT-DETR的推理速度(你也说了社区能够复现你们的效果)
而是"RT-DETR比DINO加快21倍"这个结论
但为什么你论文中汇报的DINO速度会比我测的慢这么多(慢了2倍),而RT-DETR的速度会比我测的快这么多(快了3倍)
但推理速度只加快2倍(和论文差很多),具体来说是DINO比论文汇报的(5FPS)要快、RT-DETR比论文汇报的(108FPS)慢很多
T4 TensorRT FP16
下测的,论文里是有说明的DINO的输入size是800*1333,纯pytorch代码的情况下对比(而不是TensorRT导出)
至少我在pytorch实现的代码上,RT-DETR(无论是640640还是8001333输入)都没有达到比DINO(800*1333输入)快21倍的效果。
由于DINO并没有提供TensorRT的导出脚本,所以我暂时没法对比TensorRT情况下两者的速度差异
如果你有导出好的DINO和RT-DETR的TensorRT engine,可以分享一下不?
导出参考rtdetr文档 ( ppdet里不同模型导出onnx和tensorrt的流程基本都是一样的
论文的对比实验是需要(尽可能)控制变量的,像Backbone、data augmentation、epoch等,而RT-DETR在这三点上都没有和对比的其他DETR方法对齐(PResNet50 vs ResNet50,数据增强不同,用6x对比DINO的3x)
论文的对比实验是需要(尽可能)控制变量的,像Backbone、data augmentation、epoch等
如果像你说的那样,只需要对比模型的最终结果,
s m l x
系列,没见过l
和x
比的;再者文章写的很清楚是和DINO-R50
比 不是DINO
;另外 也可以和63.1
的模型比啊 比如我s
模型和63.1
的模型比 可以得到精度低几十个点 速度快几百倍
的结论 没什么问题 但是这样的结论对读者来说有什么意义呢 如果像你说的那样,只需要对比模型的最终结果,那为什么以50.9的精度作为DINO的最终结果参与对比,而不是DINO原始论文中汇报的63.1的结果?
就零零碎碎回复几句:
- 什么叫`tricks`?必须得用了什么高深理论、复杂网络、晦涩语言才能站到鄙视链顶端?
- 什么是好(论文)?AI领域落不了地束之高阁的肯定不是;反之`yolov3`的写作丝毫不影响它的价值,`28061`的引用还需要什么`专业同行`质评嘛
- 整体精度都做不起来,怎么证明优越性?`SOTA`这词价值何在?不成了自娱自乐了嘛
- 论文和比赛打榜并不对立,反例太多了,不然各大学术会干嘛还举办比赛?个人认为 能取得top指标的肯定有其的高明之处 反而能写出论文的idea可能只是文笔好
- 再看看现在LLM、MM-LLM领域的论文,大量用`所谓的tricks`把最终精度堆地越高就是越好,就是同行认可的好文章
- 当然最终时间会用<引用量 开发者喜欢度 以及 带来的社会价值>来judge什么是好
- ...
- 求同存异
我觉得论文不是比赛打榜,不是用tricks把精度堆地越高越好,
好的,非常抱歉浪费了你很多时间,我就不继续往下issue了,最后也只碎碎念几句。
是这样的 我们这边还是偏落地方向考虑多点;你这细节都比较严谨 挺好的
( 文字交流难免有个别不流畅的地方 没有别的意思 有机会当面交流
作者你好,在测试代码后我对论文的指标有些疑惑,希望您可以解答: