Open qibao77 opened 3 months ago
paper通过document convert pipeline转换后得到的markdown,是走通用数据一样的过滤流程么?最后训练时用的是markdown格式,还是纯文本格式?如果是纯文本的话,那表格怎么处理的?
paper通过document convert pipeline转换后得到的markdown,是走通用数据一样的过滤流程么?最后训练时用的是markdown格式,还是纯文本格式?如果是纯文本的话,那表格怎么处理的?