sooftware / kospeech

Open-Source Toolkit for End-to-End Korean Automatic Speech Recognition leveraging PyTorch and Hydra.
https://sooftware.github.io/kospeech/
Apache License 2.0
605 stars 192 forks source link

서브워드 학습시 오류 #62

Closed mnbv7581 closed 3 years ago

mnbv7581 commented 4 years ago

subword_error

서브워드로 데이터를 전처리한 후에 학습하니 위와같은 에러가 발생해서 코드를 수정하였습니다. 수정후에는 에러는 발생하지 않아 학습이 진행되었습니다.

변경전

if self.output_unit == 'subword':
            if len(labels.shape) == 1:
                return self.sp.DecodeIds([l for l in labels])

            sentences = list()
            for batch in labels:
                sentence = str()
                for label in batch:
                    sentence = self.sp.DecodeIds([l for l in label])
                sentences.append(sentence)
            return sentences

변경후

if self.output_unit == 'subword':
            if len(labels.shape) == 1:
                return self.sp.DecodeIds([int(l) for l in labels])

            sentences = list()
            for batch in labels:
                sentence = str()
                for label in batch:
                    sentence = self.sp.DecodeIds([int(l) for l in label])
                sentences.append(sentence)
            return sentences
sooftware commented 3 years ago

버그 리포트 해주셔서 감사합니다. 반영하겠습니다!