Open anthisyme opened 3 months ago
the same bug i met QAQ
hello,can you show me your train data json.
在使用finetune_lora.sh测试微调的时候,我也遇到了同样的问题。 麻烦帮忙看一下是哪里出现了问题,谢谢啦! 这是我的finetune_lora.sh设置
GPUS_PER_NODE=1 NNODES=1 NODE_RANK=0 MASTER_ADDR=localhost MASTER_PORT=6001
MODEL="/work/MiniCPM-V-main/check_point/OpenBMB/MiniCPM-V-2_6-int4"
DATA="/work/MiniCPM-V-main/minicpm_data/data/train.json" EVAL_DATA="/work/MiniCPM-V-main/minicpm_data/eval/eval.json" LLM_TYPE="minicpm"
export NCCL_P2P_DISABLE=1 # export NCCL_IB_DISABLE=1 # MODEL_MAX_Length=1024 # if conduct multi-images sft, please set MODEL_MAX_Length=4096
以下是我的json文件:
train.json
conda环境下一些重要的包版本:
accelerate 0.30.1
deepspeed 0.14.4
mmengine 0.10.4
mmengine-lite 0.10.4
modelscope 1.17.1
modelscope-studio 0.4.0.9
more-itertools 10.1.0
mpmath 1.3.0
ms-opencompass 0.1.0
ms-swift 2.4.0
ms-vlmeval 0.0.7
opencv-python 4.10.0.84
opencv-python-headless 4.5.5.64
transformers 4.40.0
transformers-stream-generator 0.0.5
torch 2.1.2
torchscale 0.3.0
torchvision 0.16.0
@KeepFaithMe 你好,我在微调时也遇到了这个问题,如果我没记错的话,dataset.py和finetune.py中似乎还有其他地方进行修改(时间久远细节记不太清楚了),才能正常读取数据,建议结合报错信息进行排查
非常感谢您的回复 您看是不是将图片中的conversation改为conversations。因为我发现上文根本没有conversation这个变量
please try our new finetuning code
有人解决这个问题了吗,在线急求
是否已有关于该错误的issue或讨论? | Is there an existing issue / discussion for this?
该问题是否在FAQ中有解答? | Is there an existing answer for this in FAQ?
当前行为 | Current Behavior
Data fetch error raised because of typo on https://github.com/OpenBMB/MiniCPM-V/blob/0e4ec319cf69c6d17b5aa714cbaec29276c84089/finetune/dataset.py#L383 conversation -> conversations
期望行为 | Expected Behavior
No response
复现方法 | Steps To Reproduce
No response
运行环境 | Environment
No response
备注 | Anything else?
No response