感觉效果不太好 - Githubissues

Ethan-yt / guwenbert

GuwenBERT: 古文预训练语言模型（古文BERT） A Pre-trained Language Model for Classical Chinese (Literary Chinese)

Apache License 2.0

493 stars 40 forks source link

感觉效果不太好 #2

Closed wangbq18 closed 3 years ago

wangbq18 commented 3 years ago

fill-mask mask_token: [CLS] 晋太元中，武 [MASK]人捕鱼为业。 [SEP]

[CLS] 晋太元中，武昌人捕鱼为业。 [SEP] 0.407 [CLS] 晋太元中，武陵人捕鱼为业。 [SEP] 0.199 [CLS] 晋太元中，武康人捕鱼为业。 [SEP] 0.147 [CLS] 晋太元中，武进人捕鱼为业。 [SEP] 0.082 [CLS] 晋太元中，武阳人捕鱼为业。 [SEP]

Ethan-yt commented 3 years ago

可能会出现一些badcase，我也不能保证所有case都是准确的，毕竟都是机器自己学的。。评价效果好不好还需要靠数据集，如果有相关的开源数据集可以分享一下。目前只在NER任务做了评测，其他任务还没试过

wangbq18 commented 3 years ago

可能会出现一些badcase，我也不能保证所有case都是准确的，毕竟都是机器自己学的。。评价效果好不好还需要靠数据集，如果有相关的开源数据集可以分享一下。目前只在NER任务做了评测，其他任务还没试过

嗯，很棒的工作！

Ethan-yt commented 3 years ago

可能会出现一些badcase，我也不能保证所有case都是准确的，毕竟都是机器自己学的。。评价效果好不好还需要靠数据集，如果有相关的开源数据集可以分享一下。目前只在NER任务做了评测，其他任务还没试过

嗯，很棒的工作！

谢谢～本工作还需要在其他领域增加一些评测，主要是没有标准数据集，也没有一个可以和其他baseline模型公平对比的平台，希望未来这些会逐渐完善。