Open Yujing-Yan opened 1 week ago
作者您好,我使用您给出的checkpoints进行测试,结果跟您论文里面的出入比较大。PathVQA实际测试准确率61.9,Slake实际测试准确率85.0,RadVQA实际测试准确率74.3。这个是什么原因呢?
您好,论文报告结果的准确率是通过prediction和answer的字符串比对计算,如果prediction和answer互相包含(召回),均算正确,以避免类似“lung”和“left lung”漏计的情况。 PathVQA checkpoint似乎不是我们调参得到的最优值(印象中overall有62.8%,但时隔一年,权重找不见了),你可以调seed和学习率训练试试,如果还有问题可以邮件联系我。
作者您好,我使用您给出的checkpoints进行测试,结果跟您论文里面的出入比较大。PathVQA实际测试准确率61.9,Slake实际测试准确率85.0,RadVQA实际测试准确率74.3。这个是什么原因呢?