JiaquanYe / TableMASTER-mmocr

2nd solution of ICDAR 2021 Competition on Scientific Literature Parsing, Task B.
Apache License 2.0
410 stars 100 forks source link

表格结构识别精度 #51

Open Letdreamfly opened 1 year ago

Letdreamfly commented 1 year ago
截屏2022-08-16 下午4 01 23

如上图所示,为什么表格结构识别精度在78%左右,这么低的表格结构识别精度是怎么做到Teds在96%的?

delveintodetail commented 1 year ago

我们报告的这个是表格序列预测的准确性, 这个指标比较严格,要求序列全对才是对,否则纠错,有些结构的序列长度会是300-500个token, 一个都不错不是很容易的事情,78%的准确率其实是不低的,我大致记得,结构序列准确性只有60%多一点, 最后的ted都有可能达到96%,Teds是一个很松的指标,跟它的计算方式有关。即使结构序列错了一个token, 可能这张图的Teds也可以达到97%以上。。

Letdreamfly commented 1 year ago

我们报告的这个是表格序列预测的准确性, 这个指标比较严格,要求序列全对才是对,否则纠错,有些结构的序列长度会是300-500个token, 一个都不错不是很容易的事情,78%的准确率其实是不低的,我大致记得,结构序列准确性只有60%多一点, 最后的ted都有可能达到96%,Teds是一个很松的指标,跟它的计算方式有关。即使结构序列错了一个token, 可能这张图的Teds也可以达到97%以上。。

明白了,感谢回复~