Closed 24-solar-terms closed 1 year ago
@24-solar-terms 在modelscope上有支持中英文的模型 https://modelscope.cn/models/damo/multi-modal_convnext-roberta-base_vldoc-embedding/summary
好的非常感谢!
@24-solar-terms 在modelscope上有支持中英文的模型 https://modelscope.cn/models/damo/multi-modal_convnext-roberta-base_vldoc-embedding/summary
感谢作者回复,funsd数据集开源的模型用的是bert base的tokenizer,想问下modelscope上中英文模型使用的什么tokenizer?
@malichen-cv modelscope上有提供tokenizer,用的是XLMRoberta的tokenizer
@malichen-cv hello,有一个新问题。我有一批需要训练的中文数据,按照上面的说法,我现在只需要更改tokenizer
就可以了是吗?还是说我的模型backbone
和model_ckpt
也同样需要去修改?
非常感谢达摩院读光组的工作,GeoLayoutLM是个很棒的模型,但是这个模型使用的bert base的tokenizer,请问有预训练对中文支持的模型吗,或者未来会发布吗? @wdp-007 @alibaba-oss @congyao 非常感谢!