ntunlp / daga

Data Augmentation with a Generation Approach for Low-resource Tagging Tasks
MIT License
79 stars 15 forks source link

对于无标注预料和 knowledge base标注预料训练LM 模型问题 #14

Open wudi001007 opened 2 years ago

wudi001007 commented 2 years ago

请问:对于无标注预料和knowledge base标注预料 ,在训练LM模型时候会在每条数据前面加入[unlabel] 和[KB] token, 那么我在生成的时候需要加入这两个token吗? 比如:[BOS][KB]....
望解答 谢谢

liulinlin90 commented 2 years ago

你好,不需要加[unlabel]或者[KB]