bert fine tuning시 에러 관련 문의드립니다.

안녕하세요. https://ratsgo.github.io/embedding/ 에 bert fine tuning하는 것을 따라해 보고 있는데요. 아래와 같은 에러가 납니다. 원인이 무엇인지 알수 있나요? 형태소 분석을 안한 데이터를 사용하였고, label을 줘도 안줘도 똑같이 에러가 발생합니다. 감사합니다

INFO:tensorflow:tokenize corpus : /notebooks/embedding/data/processed_ratings_train.txt > /notebooks/embedding/data/processed_ratings_train.txt.bert-tokenized Traceback (most recent call last): File "models/tune_utils.py", line 871, in model_save_path=args.model_save_path) File "models/tune_utils.py", line 441, in init model_name="bert", vocab_fname=vocab_fname, model_save_path=model_save_path) File "models/tune_utils.py", line 268, in init self.train_data, self.train_data_size = self.load_or_tokenize_corpus(train_corpus_fname, tokenized_train_corpus_fname) File "models/tune_utils.py", line 285, in load_or_tokenize_corpus sentence, label = line.strip().split("\u241E") ValueError: not enough va sentence, label = line.strip().split("\u241E") ValueError: not enough values to unpack (expected 2, got 1) lues to unpack (expected 2, got 1) ~

ratsgo / embedding

bert fine tuning시 에러 관련 문의드립니다. #78