GOT-OCR 2.0 训练新的prompt数据后发现推理没有任何效果

dhhcj1 commented 6 days ago

Describe the bug What the bug is, and how to reproduce, better with screenshots(描述bug以及复现过程，最好有截图)

Your hardware and system info Write your system info like CUDA version/system/GPU/torch version here(在这里给出硬件信息和系统信息，如CUDA版本，系统，GPU型号和torch版本等)

Additional context Add any other context about the problem here(在这里补充其他信息)

我想尝试对表格识别成html格式的prompt然后构建了如下训练集 1491a3c03541f6ea88f8555ebfc8a2b7_compress 然后进行训练，发现收敛的还不错 8a67de4a49152754fb2f6a4623f3fb09_compress 接着就是做模型权重合并最后进行推理，推理的时候也使用了新的prompt 但是结果中还是latex格式？？？

Jintao-Huang commented 6 days ago

请多训练几个epoch

dhhcj1 commented 6 days ago

请多训练几个epoch

刚训练20个epoch还是一样的，感觉好奇怪不应该训练完成后一点影响没有,我重新改了下数据格式也不太行 47be158c3a18875fbe9782c34f23208c_compress 我用swift自带示例推理也没有效果 b69208b10ec3c9cbead42762539324b2_compress

Jintao-Huang commented 2 days ago

images是一个list 会不会是这个原因

modelscope / ms-swift

GOT-OCR 2.0 训练新的prompt数据后发现推理没有任何效果 #2259