medal-challenger / jigsaw-rate-severity-of-toxic-comments

0 stars 0 forks source link

kaggle inference 코드에 data preprocessing 작업을 추가했습니다. #19

Closed jerife closed 2 years ago

jerife commented 2 years ago

추가

  1. 이모티콘 제거
  2. 줄임말 수정
  3. 불용어 제거

위 data preprocessing 작업을 진행했습니다.

jerife commented 2 years ago

넵 그럼 stopword 제거 전/후 결과를 한번 비교하고 merge하는게 맞는것 같습니다.

kkbwilldo commented 2 years ago

비교 결과 분석 후에 이를 반영하여 바로 병합하시면 될 것 같습니다

ympaik87 commented 2 years ago

비교 분석 결과 stopword 제거 포함한 지금 버전으로 병합하는거로 결론났습니다. 머지 진행 부탁드릴게요 @Kingthegarden @jerife