boostcampaitech5 / level2_nlp_mrc-nlp-06

level2_nlp_mrc-nlp-06 created by GitHub Classroom
3 stars 3 forks source link

Preprocess #18

Closed i-mprovising closed 1 year ago

i-mprovising commented 1 year ago

train data의 context를 전처리합니다. 줄바꿈 기호와 # 기호를 제거하고 2개 이상의 공백이 붙어있을 경우 하나로 합치는 전처리입니다. train data의 context가 바뀜에 따라 answer start index도 바뀌므로 이것도 바꿔주는 코드가 포함되어 있습니다.

사용법

코드 변경 사항