Closed miziworld closed 3 years ago
안녕하세요, 도움주신 덕분에 최대한 오류 해결하여 트레이닝 돌리고 있는데 20번 에포치정도 돌렸을때 맨앞글자만 제대로 인식되는정도..? 의 성능을 확인하였습니다.
혹시 개발자님께서는 어느정도 훈련돌리셨을때 괜찮은 동작결과물을 얻으셨을지 질문드립니다.
그리고 batch size=1 num_workers=16 으로 돌렸을때 제가가진 gpu의 25프로정도밖에 사용하지 못하던데 배치사이즈를 늘리면 gpu활용량은 늘어나지만 오히려 한스텝당 소요되는 시간이 더 길어지는 현상이 발생합니다. 이런현상이 정상적인건가요?
안녕하세요, 도움주신 덕분에 최대한 오류 해결하여 트레이닝 돌리고 있는데 20번 에포치정도 돌렸을때 맨앞글자만 제대로 인식되는정도..? 의 성능을 확인하였습니다.
혹시 개발자님께서는 어느정도 훈련돌리셨을때 괜찮은 동작결과물을 얻으셨을지 질문드립니다.
그리고 batch size=1 num_workers=16 으로 돌렸을때 제가가진 gpu의 25프로정도밖에 사용하지 못하던데 배치사이즈를 늘리면 gpu활용량은 늘어나지만 오히려 한스텝당 소요되는 시간이 더 길어지는 현상이 발생합니다. 이런현상이 정상적인건가요?