boostcampaitech7 / level2-mrc-nlp-06

level2-mrc-nlp-06 created by GitHub Classroom
3 stars 1 forks source link

Feat 15/sbert #17

Closed ocean010315 closed 1 week ago

ocean010315 commented 2 weeks ago

Overview

폴더 구조

.
|-- README.md
|-- config
|-- model
|-- outputs
|-- src
|   |-- run_sbert.ipynb
|   `-- sbert.py
`-- utils
    `-- sbert_utils.py

To Reviewer

Issue Tags

LeSaUi commented 2 weeks ago

CrossEncoder_ 이름 다시 짓는다면 BiEncoder 처럼 CrEncoder 또는 CsEncoder 로 줄이는 건 어떨까요

LeeJeongHwi commented 2 weeks ago

감사합니다! 위 상의님 말씀대로 CrossEncoder_ 대신 다른 용어로 대체하는게 좋을 것 같습니다. 추가로..코드를 확인해보니 retrieve 이후에 rerank 까지 한게 result_df 이고 이게 이제 reader에 전달되는 코드인것이죠?

ocean010315 commented 2 weeks ago

감사합니다! 위 상의님 말씀대로 CrossEncoder_ 대신 다른 용어로 대체하는게 좋을 것 같습니다. 추가로..코드를 확인해보니 retrieve 이후에 rerank 까지 한게 result_df 이고 이게 이제 reader에 전달되는 코드인것이죠?

일반적으로 2-stages가 성능이 좋다고 하지만, 실험과 모듈 각각의 사용을 용이하게 하기 위해서 개별적으로도 retrieval을 수행할 수 있게 만들어놨습니다! 따라서 Bi-Encoder와 Cross Encoder 각각만으로도 retrieval을 수행할 수 있고, 2-stage를 사용한다면 Bi-Encoder로 먼저 retrieval을 수행하고, Cross Encoder로 re-rank를 수행하면 됩니다. 세 가지 중 어떤 경우에도 result_df로 출력됩니다.