issues
search
Team-KDA
/
natural-language-processing
Study NLP topics, Participate in competitions if possible
0
stars
0
forks
source link
1016 미팅
#1
Open
HyunjoonCho
opened
3 years ago
HyunjoonCho
commented
3 years ago
AI 기반 회의 녹취록 요약 경진대회
Guide
문서화된 회의 녹취록에서 핵심 내용을 요약하는
생성요약 AI모델
개발
요약도 중요하지만 생성 측면도 고려해야할듯 - GPT2?
누구나 사용할 수 있는 공개된 외부 데이터는 활용할 수 있으나, 추가로 사용한 데이터를 반드시 명시해야 함
대회 공개 시점(2021년 9월 13일 전)에 누구나 다운로드하여 활용이 가능한 공개된 사전학습 모델 사용 가능 (Google Multilingual BERT, KorBERT, KoBERT, KoGPT2, KoBART 등)
대회 공개 시점 및 진행기간동안 공개되어 있지 않은 사전학습 모델 사용 시 실격
코드와 체크포인트가 모두에게 공개되어 있는 사전학습된 체크 포인트에 한하여 fine-tuning을 통한 활용 가능
단, 제출한 모델은 Google Colab 무료 환경 (GPU:K80 / 메모리 12GB)에서 추론이 가능해야 함. (해당 환경에서 추론 불가 시 실격 처리)
KoNLPy
한글 특화 NLP library - tokenizer 제공
Other References
KoBERT
; pre-trained BERT model for Korean lang
BERTSUM
and
KoBERTSUM
; BERT-based text summarization
KoGPT2
; text generation
TODOs
[ ] 각자 solution 구상해보기
[ ] 1023 다음 토요일 밤 미팅 예정
AI 기반 회의 녹취록 요약 경진대회
Guide
KoNLPy
Other References
TODOs