Open andysdc opened 2 years ago
由于做了tokenizer的优化,词典数量有25万变成了5万,mT5的encoder和decoder部分的词典embedding都变化了,请问原来mT5的初始权重是不是没法用了呢?
由于做了tokenizer的优化,词典数量有25万变成了5万,mT5的encoder和decoder部分的词典embedding都变化了,请问原来mT5的初始权重是不是没法用了呢?