yhcc / BARTABSA

142 stars 28 forks source link

是否考虑过将decoder部分的任务转换为预测词角标,而不是bpe index #14

Open 34127chi opened 2 years ago

34127chi commented 2 years ago

以公开数据集合训练得到模型,接着在新的数据集上进行三元组任务(triplet)抽取,发现Invalid token的比例很大

是否有考虑过在encoder的embedding部分对词(word)进行编码,decoder部分的任务转换为预测词角标的,从而减少了invalid token的比例?

yhcc commented 2 years ago

这里主要是预训练模型不太能接受word的编码,非法的预测实际上可以在decode的时候进行限制的。需要修改一下decode时候的beam search算法。