Open kangheeyong opened 4 years ago
기존 분류 모델은 분류할 데이터가 학습 데이터셋에 속한 데이터일 경우에만 분류가 가능하다. 여기서 문제는 학습 데이터셋에 속하지 않은 데이터가 들어와도 기존 데이터셋에 속한 카테고리로 강제로 분류가 된다는 것이다.
위의 모델은 기존 분류 모델의 문제점을 해결하기 위한 대안 모델이다. 기존 모델과 차이점은 분류를 하기 전에 anomaly detection을 먼저 수행한 후 분류를 진행하는 것이다. 이런식으로 한다면 기존 분류 모델의 가정을 따르면서 정확도 높은 분류를 할 수 있다.
여기서 anomaly dataset의 정의는 위에서 제시한 집합으로 정의한다.
기존 분류 모델의 재학습 없이 새로운 분류 모델을 추가하기 위해서는 위와 같이 하면 된다.
실제 시스템에서는 위에서 정의된 엔트로피 값이 가장 작게하는 방법으로 설계를 한다면 컴퓨터 자원을 가장 효율적으로 사용하는 시스템이 될것이다.