JunnYu / ChineseBert_pytorch

huggingface ChineseBert Tokenizer
MIT License
15 stars 1 forks source link

您好,请问如何修改达到复现文章中去掉字形或者去掉字音的模型 #10

Open ZZZdb opened 2 years ago

ZZZdb commented 2 years ago

文章中可以在fusion embedding之前去掉字音或者字形,请问如何修改?

JunnYu commented 2 years ago

你应该去这里 https://github.com/ShannonAI/ChineseBert 问这个问题,我发现不怎么好修改,修改完后,有的权重(map_fn的权重,因为输入是dim*3,也就是3种类型的输入)就不对了。