텍스트로 구성된 대화문을 읽어 요약문 추론
전체 크기 | 파일수 | NSML 데이터셋 이름 |
---|---|---|
1GB | train_data(9) test_data(9) |
final_dialogue |
root_path/train/train_data/
(Beauty_Health, Event, Food, Hobby, Living, News_Edu, Personal_Rel, Shopping, Work)train_label : 확장자명이 없는 csv 형식 파일 (280000 rows, 2 columns(dialogueID, summary))
train_data (json): 학습용 데이터셋
├ numberOfItems (ex. 71408)
├ data
│├ header
││├ dialogueInfo
│││├ numberOfParticipants (ex. 2)
│││├ numberOfUtterances (ex. 16)
│││├ numberOfTurns (ex. 6)
│││├ type (ex. 일상 대화)
│││├ topic (ex. 개인 및 관계)
│││├ dialogueID (ex. b6d7d466-25f2-5b3e-a55d-fe5ce1e32687)
││├ participantsInfo (List)
│││├ age (ex. 20대)
│││├ residentialProvince (ex. 부산광역시)
│││├ gender (ex. 여성)
│││├ participantID (P01)
+
│││├ ...
│├ body
││├ dialogue (List)
│││├ utterance (ex. 양치하고 올께)
│││├ utteranceID (ex. U1)
│││├ participantID (ex. P01)
│││├ date (ex. 2019-11-08)
│││├ turnID (ex. T1)
│││├ time (ex. 13:32:00)
+
│││├ ...
││├ summary (ex. 양치를 하고 온다고 하며 커피가 치아에 좋지 않다는 이야기를 한다.)
root_path/test/test_data/
(Beauty_Health, Event, Food, Hobby, Living, News_Edu, Personal_Rel, Shopping, Work)9개의 json 파일로 이루어진 test_data의 summary를 추론하는 문제
test_data (json): 추론용 데이터셋
├ numberOfItems (ex. 71408)
├ data
│├ header
││├ dialogueInfo
│││├ numberOfParticipants (ex. 2)
│││├ numberOfUtterances (ex. 16)
│││├ numberOfTurns (ex. 6)
│││├ type (ex. 일상 대화)
│││├ topic (ex. 개인 및 관계)
│││├ dialogueID (ex. b6d7d466-25f2-5b3e-a55d-fe5ce1e32687)
││├ participantsInfo (List)
│││├ age (ex. 20대)
│││├ residentialProvince (ex. 부산광역시)
│││├ gender (ex. 여성)
│││├ participantID (P01)
+
│││├ ...
│├ body
││├ dialogue (List)
│││├ utterance (ex. 양치하고 올께)
│││├ utteranceID (ex. U1)
│││├ participantID (ex. P01)
│││├ date (ex. 2019-11-08)
│││├ turnID (ex. T1)
│││├ time (ex. 13:32:00)
+
│││├ ...
││├ summary (ex. 추론 해야하는 요약문)
test_label (DataFrame 형식, 참가자 접근 불가)
columns - ["dialogueID", "summary"]
dialogueID
- id
summary
- 추론한 요약문을 기입하여 제출