njucckevin / SeeClick

The model, data and code for the visual GUI Agent SeeClick
Apache License 2.0
187 stars 10 forks source link

作者您好,在微调使用seeclick ckpt时loss为0 #33

Closed cbigeyes closed 4 months ago

cbigeyes commented 4 months ago

作者您好, 我在使用finetune/finetune_lora_ds.sh做微调,并使用huggingface上的seeclick模型作为base加载后,loss从一开始就为0,请问有遇到过这样的情况吗。 PS:使用QWEN VL Chat int4作为base时,没有上述问题

njucckevin commented 4 months ago

您好,我在微调时没有遇到这样的情况。loss一开始就为0肯定是不正常的,可以看看是哪步出了问题? 另外我没有尝试过int4版本的微调,你有试过标准的Qwen-VL checkpoint可以正常微调吗?