multimodal-art-projection / MAP-NEO

877 stars 81 forks source link

关于document convert pipeline #36

Open qibao77 opened 3 months ago

qibao77 commented 3 months ago

paper通过document convert pipeline转换后得到的markdown,是走通用数据一样的过滤流程么?最后训练时用的是markdown格式,还是纯文本格式?如果是纯文本的话,那表格怎么处理的?