UniModal4Reasoning / StructEqTable-Deploy

A High-efficiency Open-source Toolkit for Table-to-Latex Task
Apache License 2.0
147 stars 10 forks source link

输出格式问题:Latex和HTML结果未对齐? #19

Open DayDreamerEric opened 2 days ago

DayDreamerEric commented 2 days ago

命令行: python demo.py --image_path ./demo.jpg --ckpt_path U4R/StructTable-InternVL2-1B --output_format latex python demo.py --image_path ./demo.jpg --ckpt_path U4R/StructTable-InternVL2-1B --output_format html

DayDreamerEric commented 2 days ago

刚刚拜读了DocGenome,其中「表结构识别」的任务定义是image2latex。

初步猜测,是否是由于训练数据的格式问题导致的呢?

DayDreamerEric commented 1 day ago

补充: markdown输出存在类似的问题

| 名称 | 产量 (吨) | 环比 |  | 
| --- | --- | --- | --- | 
|  |  | 增长量 (吨) | 增长率 (\%) | 
| 荔枝 | 11 | 1 | 10 | 
| 芒果 | 9 | -1 | -10 | 
| 香蕉 | 6 | 1 | 20 |
名称 产量 (吨) 环比
增长量 (吨) 增长率 (\%)
荔枝 11 1 10
芒果 9 -1 -10
香蕉 6 1 20