导出llama3-8B的tokenizer报错

模型：https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct

Traceback (most recent call last):
  File "llm_export.py", line 1257, in <module>
    llm_exporter = llm_models[model_type](args)
  File "llm_export.py", line 913, in __init__
    super().__init__(args)
  File "llm_export.py", line 101, in __init__
    self.sp_model = spm.SentencePieceProcessor(tokenizer_model)
  File "/jfs-hdfs/user/chengdong01.liang/anaconda3/envs/hbdk4/lib/python3.8/site-packages/sentencepiece/__init__.py", line 468, in Init
    self.Load(model_file=model_file, model_proto=model_proto)
  File "/jfs-hdfs/user/chengdong01.liang/anaconda3/envs/hbdk4/lib/python3.8/site-packages/sentencepiece/__init__.py", line 961, in Load
    return self.LoadFromFile(model_file)
  File "/jfs-hdfs/user/chengdong01.liang/anaconda3/envs/hbdk4/lib/python3.8/site-packages/sentencepiece/__init__.py", line 316, in LoadFromFile
    return _sentencepiece.SentencePieceProcessor_LoadFromFile(self, arg)
RuntimeError: Internal: could not parse ModelProto from ./Meta-Llama-3-8B-Instruct/tokenizer.model

wangzhaode / llm-export

导出llama3-8B的tokenizer报错 #43