Open 312shan opened 4 days ago
参考数据集说明 :https://modelscope.cn/datasets/AI-ModelScope/LaTeX_OCR
In [1]: from modelscope import MsDataset
In [2]: xtrain_dataset = MsDataset.load("AI-ModelScope/LaTeX_OCR", subset_name="small", split="train")
small 可以成功执行,改成 full 也不行。
网络环境没有问题,参考官方文档微调报错无法获取数据集latex-ocr-print ,参考文档地址:https://github.com/modelscope/ms-swift/blob/main/docs/source/Multi-Modal/qwen2-vl%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.md
遇到报错的微调启动命令:
脚本启动之后模型正确加载,在获取和处理数据的时候报错如下: