Closed dbsrlskfdk closed 1 year ago
생각보다 성능이 더 떨어짐... 테스트 데이터에도 no-relation
으로 되어있는 것이 많을 수 있기에, 조금 위험한 생각이었나봄
no_relation이 많으면 오히려 이것에 대한 가중치를 높여야 하는 게 아닌가 싶습니다. 윤기님 말대로 test 데이터에도 no_relation이 많으니까요 [1.2 1 1 1 1] 대충 이정도로 돌리면 좋아지지 않을까.........싶습니다.
현재 상황과 문제점
no-relation
을 어떤 라벨이던지, 너무 자주 예측하는 문제점55
개선 제안 사항
CrossEntropyLoss(weight=[])
weight
파라미터로 label별 가중치를 줄 수 있다.전체 라벨 갯수 / 특정 라벨 갯수
를 가중치로 사용. 많은 라벨 갯수를 가지는 것에 대해 패널티를 갖도록성능 개선 기대점
no-relation
에 대한 예측이 덜해져서, micro-f1이 좋아질 것으로 생각.