Open do-genie opened 2 years ago
제가 이 부분을 계속 고민해 보았는데, moving window를 통해서 대화의 주제를 파악한다고 하면, moving window를 적용한 데이터셋을 사용하는 모델을 새로 학습해야할 것으로 생각됩니다. 즉, 새로운 데이터셋을 구축하기 위한 라벨링 작업이 필요할 것 같아요.
또는 어차피 출력은 특정 문서가 각 convrsThema일 확률이 출력되니까, 확률이 높은 상위 3개의 convrsThema를 추출하는 식으로 생각하는 것도 괜찮을 것 같습니다..!
더 생각해볼게요! 만약 제가 잘 못 이해하고 있는 점이 있다면 말씀해주세요
이런 식으로 파란칸을 기준으로 대화의 주제가 바뀌는데 반해 설정된 convsrTheme은 계속 "휴일"입니다. 이 부분에 대해서 직접 다시 대화주제를 분류하는 모델을 짜야 할 것 같은데 어떻게 생각하세요??
세문장씩 moving window를 설정해서 대화의 주제를 파악하는 것은 어떤지 교수님께서 제안하셨습니다! 이 부분에 대해서도 논의해봐야 될 것 같습니다!