lipiji / TtT

code for ACL2021 paper "Tail-to-Tail Non-Autoregressive Sequence Prediction for Chinese Grammatical Error Correction"
99 stars 16 forks source link

请问是否可以提供一个数据sample #7

Closed YouranShan closed 3 years ago

YouranShan commented 3 years ago

请问是否可以提供一个数据sample

  1. DataLoader里面需要的数据是由\t分割的三段文本,但source和target只有两段,而第三段也没有在后续代码中出现,是不是应该把断言那里改成2
  2. tag_name_list在一开始出现就加了一个sep,而后面的条件判断中又为tag_name_list添加了sep,这应当是冗余了吧?
yiweiyihang commented 3 years ago

+1 求问HybirdSet转换后的数据格式是什么样的

bing170215 commented 3 years ago

第二个问题,我也觉得是冗余了

lipiji commented 3 years ago

见data文件夹