Open scoolor opened 3 years ago
这是我们内部的训练数据,不开源
数据格式是咋样的
请问,训练数据格式还是和simbert的格式{"text": "天津津南这边有ITF跆拳道馆吗,没有可不可以推荐个近点的道馆", "synonyms": ["上海哪里有学习正在ITF跆拳道的道馆?", "天津有ITF跆拳道馆么"]}一样吗
请问,训练数据格式还是和simbert的格式{"text": "天津津南这边有ITF跆拳道馆吗,没有可不可以推荐个近点的道馆", "synonyms": ["上海哪里有学习正在ITF跆拳道的道馆?", "天津有ITF跆拳道馆么"]}一样吗
可以用这样的格式。
你好! 运行train/stage1.py 报缺少文件 /root/data_pretrain/synonyms_shuf.json 寻求帮助一下!谢谢