Open NeverWangX opened 3 months ago
带4层Transformer检测头的vit-base/hivit-base训练耗时大约是带2层FC检测头的swin-base的2倍(这是继承imTED导致的一个缺点)。swin-base的训练耗时大约是swin-tiny的3倍,是r50的3.5倍。因此std+hivit-b是orcnn的6~7倍训练耗时是成立的。
@yuhongtian17 可以提供rotated_imted_vb1m_oriented_rcnn_vit_base_1x_dota_ms_rr_le90_stdc_xyawh321v.py和rotated_imted_hb1m_oriented_rcnn_hivitdet_base_1x_dota_ms_rr_le90_stdc_xyawh321v.py相关的GFLOPs / FPS以及#Params信息吗
可以用MMRotate官方提供的代码计算
作者您好,我根据您提供的代码将模型迁移至了mmrotate1.x版本,然后在我自己的数据集上训练。使用的显卡是单卡4090,运行的配置文件是rotated_imted_hb1_oriented_rcnn_hivitdet_base_1x_dota_le90_16h.py,但是我发现该模型训练时间要远超正常的模型训练时间。orcnn训练3x大约需要1.5h,但是使用您的模型大约需要10h,这是正常现象吗?