测试结果未达到预期

ecoxial2007 / CH-ICL

Candidate-Heuristic In-Context Learning: A New Framework for Enhancing MedVQA with Large Language Models

MIT License

4 stars 2 forks source link

测试结果未达到预期 #2

Open Yujing-Yan opened 1 week ago

Yujing-Yan commented 1 week ago

作者您好，我使用您给出的checkpoints进行测试，结果跟您论文里面的出入比较大。PathVQA实际测试准确率61.9，Slake实际测试准确率85.0，RadVQA实际测试准确率74.3。这个是什么原因呢？ 1730301372034

ecoxial2007 commented 1 week ago

您好，论文报告结果的准确率是通过prediction和answer的字符串比对计算，如果prediction和answer互相包含（召回），均算正确，以避免类似“lung”和“left lung”漏计的情况。 PathVQA checkpoint似乎不是我们调参得到的最优值（印象中overall有62.8%，但时隔一年，权重找不见了），你可以调seed和学习率训练试试，如果还有问题可以邮件联系我。