Open kyungheee opened 3 months ago
Deep Learning에서 발생하는 UQ에 관해 정리한 논문이지만, AutoML을 돌리는 우리꺼에 어떻게 적용할 수 있을까?
6.1 Out-of-distribution detection
6.2 Active Learning
6.3 Deep Reinforcement Learning
여기선 agent와 environment의 복잡한 조건과 제한된 훈련 상태로 인해 두가지 종류의 불확실성이 발생할 수 있음
Data uncertainty : intrinsic randomness 때문에 생김, 이를 처리하기 위해 Distributional RL을 쓸 수 있다. reward function을 probabilistic perspective에서 학습하고, 이는 agent가 risk-aware behavior을 할 수 있도록 한다.
Model uncertainty : limited training state space로 인해 발생. optimum policy를 학습하지 못하고, 더 높은 reward를 줄 수 있는 탐색하지 않은 공간을 놓칠 수 있음. 이 경우, Exploration과 Exploitation사이에서 균형을 맞춰야 함