wind91725 / gpt2-ml-finetune-

根据gpt2-ml中文模型finetune自己的数据集
Apache License 2.0
43 stars 15 forks source link

和原来gpt2-ml的demo.py 进行inference的代码对比,使用的不是同一个vocabulary? #15

Open huangdacheng opened 4 years ago

huangdacheng commented 4 years ago

觉得奇怪的地方, train和 inference的时候使用的vocabulary 不是同一个文件的?

cncbec commented 4 years ago

对呢,希望小哥哥来解答一下

wind91725 commented 4 years ago

额 这个词表啥的随你用啊 想用哪个就用哪个 我用的这个是中文bert常用的词表,原版的那个clue词表我没见过 所以就没用

huangdacheng commented 4 years ago

额 这个词表啥的随你用啊 想用哪个就用哪个 我用的这个是中文bert常用的词表,原版的那个clue词表我没见过 所以就没用

请问你是在原版的预训练模型基础上进行finetuning的吗?