boostcampaitech4lv23nlp1 / final-project-level3-nlp-03

Multi-Modal Model for DocVQA(Document Visual Question Answering)
3 stars 0 forks source link

max_length > 512 #13

Closed Ssunbell closed 1 year ago

Ssunbell commented 1 year ago

문제점

원본 텍스트가 토크나이저의 최대 길이인 512를 넘어버리는 데이터가 존재함.

train

스크린샷 2023-01-17 오전 11 00 09

val

스크린샷 2023-01-17 오전 11 00 36

test

스크린샷 2023-01-17 오전 11 00 51

해결법

stride를 이용해 512중에서 128의 길이만큼 중첩시켜 하나의 데이터를 여러 개의 데이터로 쪼갠 뒤에 모델에 넣어줌