zejunwang1 / bert4vec

一个基于预训练的句向量生成工具
Apache License 2.0
132 stars 11 forks source link

关于模型转换的问题 #1

Open xyjsjruiliu opened 2 years ago

xyjsjruiliu commented 2 years ago

您好,我看到原始的 SimBERT 和 RoFormer-Sim 模型是基于TensorFlow的,作者使用的什么方法做的?

zejunwang1 commented 2 years ago

您好,我看到原始的 SimBERT 和 RoFormer-Sim 模型是基于TensorFlow的,作者使用的什么方法做的?

我是将原始的模型权重转化为了 HuggingFace 支持的加载格式: https://huggingface.co/WangZeJun/simbert-base-chinese 原始模型介绍可参考: https://github.com/ZhuiyiTechnology/simbert

zlszhonglongshen commented 2 years ago

您好,我看到原始的 SimBERT 和 RoFormer-Sim 模型是基于TensorFlow的,作者使用的什么方法做的?

我是将原始的模型权重转化为了 HuggingFace 支持的加载格式: https://huggingface.co/WangZeJun/simbert-base-chinese 原始模型介绍可参考: https://github.com/ZhuiyiTechnology/simbert

大佬是怎么转的?

zejunwang1 commented 2 years ago

用 transformers 库中的 convert_bert_original_tf_checkpoint_to_pytorch.py 转的

zlszhonglongshen commented 2 years ago

用 transformers 库中的 convert_bert_original_tf_checkpoint_to_pytorch.py 转的 谢谢