issues
search
boostcampaitech7
/
level2-mrc-nlp-06
level2-mrc-nlp-06 created by GitHub Classroom
3
stars
1
forks
source link
[FEAT] Learned Sparse Retrieval 클래스 구현
#9
Closed
minjijeong98
closed
1 week ago
minjijeong98
commented
2 weeks ago
Background
challenge
: 현실적으로 Topk=10 또는 20 수준에서 retrieval을 이용할텐데, BM25만으로는 해당 topk에서 약 0.9 이상의 hit@k 성능을 얻기 어려움.
approach
: learned sparse embedding retrieval 시도
sparse(빠른 검색) + dense(의미적 유사성 반영)의 장점 결합한 방식이므로 Retrieval의 성능 향상 기대 가능
sparse retrieval을 적용할 때 최근 자주 사용되는 접근법임
learned sparse retrieval의 대표 방법: SPLADE, BGE-M3 등
Todo
[x] learned sparse embedding 방법론 이론적 탐색
[x] 작동 원리 탐색
[x] splade, bge-m3 각각의 한국어 모델 탐색
[x]
LearnedSparseRetrieval
클래스 구현
[x] 성능 확인
[x] test 코드 작성
[x] 결과 문서화
See also
6
Background
Todo
LearnedSparseRetrieval
클래스 구현See also
6