模型在中文数据集上的效果讨论

FangShancheng / ABINet

Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Text Recognition

Other

418 stars 72 forks source link

模型在中文数据集上的效果讨论 #9

Closed xxAna closed 3 years ago

xxAna commented 3 years ago

您好！非常感谢您们的工作和分享，请问如果想用这个模型在中文数据集上，会有哪些优劣吗？这里的语言模型要是换成中文的bert的话，效果影响大吗？您们是否有做过这方面的实验呢

FangShancheng commented 3 years ago

您好！非常感谢您们的工作和分享，请问如果想用这个模型在中文数据集上，会有哪些优劣吗？这里的语言模型要是换成中文的bert的话，效果影响大吗？您们是否有做过这方面的实验呢

中文数据集上目前只做了个小实验，（参见论文补充材料）
不知道您说的中文BERT是啥意思，是完全按照BERT原文预训练的语言模型，还是按本文提出的语言模型在中文上预训练的？中文方面的实验，现在展开的不是很多，您有兴趣可以多尝试下。

xxAna commented 3 years ago

您好！非常感谢您们的工作和分享，请问如果想用这个模型在中文数据集上，会有哪些优劣吗？这里的语言模型要是换成中文的bert的话，效果影响大吗？您们是否有做过这方面的实验呢
1. 中文数据集上目前只做了个小实验，（参见论文补充材料）

2. 不知道您说的中文BERT是啥意思，是完全按照BERT原文预训练的语言模型，还是按本文提出的语言模型在中文上预训练的？中文方面的实验，现在展开的不是很多，您有兴趣可以多尝试下。

好嘞，谢谢您的回复，我去看看。

xxAna commented 3 years ago

您好！我刚找了https://static.aminer.cn/storage/pdf/arxiv/21/2103/2103.06495.pdf这个版本的论文以及https://arxiv.org/pdf/2103.06495.pdf这个版本的，都没有找到您这里说的小实验呢，请问是还有别的正式版本吗？然后想请教下如果只是想初步看下在中文数据集上的效果，训练模型除了改字典还需要改哪些主要的地方呢？

FangShancheng commented 3 years ago

您好！我刚找了https://static.aminer.cn/storage/pdf/arxiv/21/2103/2103.06495.pdf这个版本的论文以及https://arxiv.org/pdf/2103.06495.pdf这个版本的，都没有找到您这里说的小实验呢，请问是还有别的正式版本吗？然后想请教下如果只是想初步看下在中文数据集上的效果，训练模型除了改字典还需要改哪些主要的地方呢？

您好，这里可以找到补充材料https://openaccess.thecvf.com/content/CVPR2021/supplemental/Fang_Read_Like_Humans_CVPR_2021_supplemental.pdf 此外，主要是需要合成中文数据集。

xxAna commented 3 years ago

您好！我刚找了https://static.aminer.cn/storage/pdf/arxiv/21/2103/2103.06495.pdf这个版本的论文以及https://arxiv.org/pdf/2103.06495.pdf这个版本的，都没有找到您这里说的小实验呢，请问是还有别的正式版本吗？然后想请教下如果只是想初步看下在中文数据集上的效果，训练模型除了改字典还需要改哪些主要的地方呢？

您好，这里可以找到补充材料https://openaccess.thecvf.com/content/CVPR2021/supplemental/Fang_Read_Like_Humans_CVPR_2021_supplemental.pdf 此外，主要是需要合成中文数据集。

好嘞，感谢您及时的回复！

lyc728 commented 2 years ago

吗？您们是否有做过这方

这里想问下，为什么训练语言模型不直接加载bert的呢？他们也有直接训练的