FangShancheng / ABINet

Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Text Recognition
Other
418 stars 72 forks source link

模型在中文数据集上的效果讨论 #9

Closed xxAna closed 3 years ago

xxAna commented 3 years ago

您好!非常感谢您们的工作和分享,请问如果想用这个模型在中文数据集上,会有哪些优劣吗?这里的语言模型要是换成中文的bert的话,效果影响大吗?您们是否有做过这方面的实验呢

FangShancheng commented 3 years ago

您好!非常感谢您们的工作和分享,请问如果想用这个模型在中文数据集上,会有哪些优劣吗?这里的语言模型要是换成中文的bert的话,效果影响大吗?您们是否有做过这方面的实验呢

  1. 中文数据集上目前只做了个小实验,(参见论文补充材料)
  2. 不知道您说的中文BERT是啥意思,是完全按照BERT原文预训练的语言模型,还是按本文提出的语言模型在中文上预训练的?中文方面的实验,现在展开的不是很多,您有兴趣可以多尝试下。
xxAna commented 3 years ago

您好!非常感谢您们的工作和分享,请问如果想用这个模型在中文数据集上,会有哪些优劣吗?这里的语言模型要是换成中文的bert的话,效果影响大吗?您们是否有做过这方面的实验呢

1. 中文数据集上目前只做了个小实验,(参见论文补充材料)

2. 不知道您说的中文BERT是啥意思,是完全按照BERT原文预训练的语言模型,还是按本文提出的语言模型在中文上预训练的?中文方面的实验,现在展开的不是很多,您有兴趣可以多尝试下。

好嘞,谢谢您的回复,我去看看。

xxAna commented 3 years ago

您好!我刚找了https://static.aminer.cn/storage/pdf/arxiv/21/2103/2103.06495.pdf这个版本的论文以及https://arxiv.org/pdf/2103.06495.pdf这个版本的,都没有找到您这里说的小实验呢,请问是还有别的正式版本吗?然后想请教下如果只是想初步看下在中文数据集上的效果,训练模型除了改字典还需要改哪些主要的地方呢?

FangShancheng commented 3 years ago

您好!我刚找了https://static.aminer.cn/storage/pdf/arxiv/21/2103/2103.06495.pdf这个版本的论文以及https://arxiv.org/pdf/2103.06495.pdf这个版本的,都没有找到您这里说的小实验呢,请问是还有别的正式版本吗?然后想请教下如果只是想初步看下在中文数据集上的效果,训练模型除了改字典还需要改哪些主要的地方呢?

您好,这里可以找到补充材料https://openaccess.thecvf.com/content/CVPR2021/supplemental/Fang_Read_Like_Humans_CVPR_2021_supplemental.pdf 此外,主要是需要合成中文数据集。

xxAna commented 3 years ago

您好!我刚找了https://static.aminer.cn/storage/pdf/arxiv/21/2103/2103.06495.pdf这个版本的论文以及https://arxiv.org/pdf/2103.06495.pdf这个版本的,都没有找到您这里说的小实验呢,请问是还有别的正式版本吗?然后想请教下如果只是想初步看下在中文数据集上的效果,训练模型除了改字典还需要改哪些主要的地方呢?

您好,这里可以找到补充材料https://openaccess.thecvf.com/content/CVPR2021/supplemental/Fang_Read_Like_Humans_CVPR_2021_supplemental.pdf 此外,主要是需要合成中文数据集。

好嘞,感谢您及时的回复!

lyc728 commented 2 years ago

吗?您们是否有做过这方

这里想问下,为什么训练语言模型不直接加载bert的呢?他们也有直接训练的