Llama 3.1 모델을 이용해 Question Answering 문제에 대한 생성 기반 접근법 시도
Change Log
./reader/abstractive/ 폴더
src/train_llama.py: Llama 모델 학습 및 평가 수행
config/llama_config.json: Llama 모델 학습 시 사용할 예시 config 파일
README.md: abstractive 폴더의 세 방법(T5, Llama, GPT4) 대한 사용법 추가
./ODQA2
llamaQA.py: prediction 시 사용할 수 있는 LlamaQA 클래스 추가
inference.py: LlamaQA 활용해 ODQA 전체 인퍼런스 수행 가능하도록 기능 추가
To Reviewer
ODQA 폴더에는 llama 모델이 반영되어 있지 않습니다.
현재 ODQA2 폴더에서도 topk가 크면 out-of-memory 이슈로 추론 코드가 작동하지 않는 상태입니다. 이 문제가 해결되지 않은 상태에서 보다 복잡한 ODQA 폴더에 llama 인퍼런스 과정을 추가하는 것은 무의미하다고 생각되어 우선 ODQA2 폴더에만 llama 코드를 추가해두었습니다.
Overview
Change Log
./reader/abstractive/
폴더src/train_llama.py
: Llama 모델 학습 및 평가 수행config/llama_config.json
: Llama 모델 학습 시 사용할 예시 config 파일README.md
: abstractive 폴더의 세 방법(T5, Llama, GPT4) 대한 사용법 추가./ODQA2
llamaQA.py
: prediction 시 사용할 수 있는LlamaQA
클래스 추가inference.py
:LlamaQA
활용해 ODQA 전체 인퍼런스 수행 가능하도록 기능 추가To Reviewer
Issue Tags