안녕하세요, 저는 대학생 박지열이라고 합니다. 우선 훌륭한 데이터셋을 모두에게 공개해주신 점 진심으로 감사드립니다. 데이터를 들여다보는 도중, 중복이 의심되는 데이터가 있어서 문의드립니다. 물론 제 실력이 부족해서 생기는 문제일 수 있으나, 아무리 고민해봐도 알 수 없어서 이렇게 글을 남깁니다.
의심되는 데이터는 2쌍입니다. 물론, 'label' 일부가 다르지만 결국 'premise', 'hypothesis', 'gold_label' 이 동일하다는 점에서 저는 중복이라 생각했습니다.
안녕하세요, 저는 대학생 박지열이라고 합니다. 우선 훌륭한 데이터셋을 모두에게 공개해주신 점 진심으로 감사드립니다. 데이터를 들여다보는 도중, 중복이 의심되는 데이터가 있어서 문의드립니다. 물론 제 실력이 부족해서 생기는 문제일 수 있으나, 아무리 고민해봐도 알 수 없어서 이렇게 글을 남깁니다.
의심되는 데이터는 2쌍입니다. 물론, 'label' 일부가 다르지만 결국 'premise', 'hypothesis', 'gold_label' 이 동일하다는 점에서 저는 중복이라 생각했습니다.