Use PEFT or Full-parameter to finetune 350+ LLMs or 100+ MLLMs. (LLM: Qwen2.5, Llama3.2, GLM4, Internlm2.5, Yi1.5, Mistral, Baichuan2, DeepSeek, Gemma2, ...; MLLM: Qwen2-VL, Qwen2-Audio, Llama3.2-Vision, Llava, InternVL2, MiniCPM-V-2.6, GLM4v, Xcomposer2.5, Yi-VL, DeepSeek-VL, Phi3.5-Vision, ...)
3.93k
stars
347
forks
source link
GOT-OCR 2.0 训练新的prompt数据后发现推理没有任何效果 #2259
Open
dhhcj1 opened 6 days ago
Describe the bug What the bug is, and how to reproduce, better with screenshots(描述bug以及复现过程,最好有截图)
Your hardware and system info Write your system info like CUDA version/system/GPU/torch version here(在这里给出硬件信息和系统信息,如CUDA版本,系统,GPU型号和torch版本等)
Additional context Add any other context about the problem here(在这里补充其他信息)
我想尝试对表格识别成html格式的prompt然后构建了如下训练集 然后进行训练,发现收敛的还不错 接着就是做模型权重合并 最后进行推理,推理的时候也使用了新的prompt 但是结果中还是latex格式???