Closed xxllp closed 2 years ago
目前我是使用后处理来修复[UNK]。
我在CCKS基线中增加了一个中文相关的后处理修复方式(引入tokenizer),后续会更新到本仓库中。 可参考: https://github.com/PaddlePaddle/PaddleNLP/blob/7f7f7d09f99079c4a412c1cdfdbe5ac0639212eb/examples/information_extraction/DuUIE/uie/evaluation/sel2record.py#L728
后处理是个办法 ~~
我在使用这个来训练中文的数据上面预测结果出现[UNK] 这种 会影响后面的评估和使用