mxin262 / Bridging-Text-Spotting

(CVPR 2024) Bridging the Gap Between End-to-End and Two-Step Text Spotting.
https://arxiv.org/pdf/2404.04624.pdf
Other
50 stars 1 forks source link

Confused about the WEIGHT of the DiG used in model #8

Open zenosai opened 6 months ago

zenosai commented 6 months ago

论文中说不需要额外训练识别器,所以DiG模型的权重使用的是预训练权重而不是微调权重吗? 检测器使用的是微调权重?

mxin262 commented 5 months ago

DiG权重是使用了DiG官方开源的finetune的权重,检测器使用的是DPText-DETR开源的微调权重。我们使用了adapter来让冻结的检测器和识别器学习端到端优化的权重。