xueyouluo / speller-bert

中文纠错
90 stars 12 forks source link

训练的数据文件格式及样例 #4

Closed dage0127 closed 2 years ago

dage0127 commented 2 years ago

训练模型需要的数据文件格式与数据,请帮忙发一个包含几个样例的文件,参考下。 非常感谢。

xueyouluo commented 2 years ago

数据都是jsonl格式

预训练

{"text":"示例文本"}

finetune

{"src":"输入文本","tgt":"输出文本"}
dage0127 commented 2 years ago

非常感谢!