boostcampaitech2 / mrc-level2-nlp-04

mrc-level2-nlp-04 created by GitHub Classroom
4 stars 5 forks source link

DPR 논문을 이용한 passage의 dense embedding 벡터 구현 #16

Open kimziont opened 2 years ago

kimziont commented 2 years ago

진행 순서

실험 상세 내용

  1. KLUE dataset의 query에 가장 근사한 오답 passage를 wiki dataset에서 가져오기 위해 wiki dataset을 토크나이징 합니다
    wiki 토크나이징 .

  2. 토크나이징된 query와 가장 유사하지만 정답을 포함하지 않는 passage를 구합니다.
    finding bm25_passage

  3. gold passage와 bm25 passage를 concatenate하여 passage_encoder 모델에 넣고, query는 query_encoder에 넣어서 두 BERT 계열의 모델을 학습시킵니다.

실험 결과

이슈

raki-1203 commented 2 years ago

악 졌다