long8v / PTIR

Paper Today I Read
19 stars 0 forks source link

[103] Deep Sets #112

Open long8v opened 1 year ago

long8v commented 1 year ago
image

paper

TL;DR

Details

Permutation Invariance and Equivarnce

Problem Definition

function f는 set의 순서와 상관없이 permutaion invariant해야 한다.

image

Structure

set $X$를 받는 function f(X)는 아래와 같은 form으로 decompose될 때 pemutation invariant하다

image

어떤 function $f_\theta : \mathbb{R}^M \rightarrow \mathbb{R}^M$일 때,

수식 보니까 그냥 diagonal 만 빼고 다 같은 값이고 diagnoal 끼리도 다 같으면 되는듯 lambda torch.eyes(5) + gamma torch.ones(5,5)

$\mathbf{x}$까지 넣으면 $f(x)=\lambda Ix \mathbf{(11^T)x})$ input Ix와 x의 summation에다가 nonlinearity 취한게 permutation invariant하다(summation이 permutation과 상관없으니)

Deep Sets

위에서 정리한 특성들을 univeral approximator로 바꾸면 된다. 즉, $\phi$와 $\rho$를 polynomial로 근사하면 된다 즉 1) 각각의 instance $x_m$은 어떤 표현 $\phi(x_m)$으로 바뀌고 2) 그 표현들은 $\rho$ network에 따라 처리된 뒤 더해지게 된다. 어떤 메타정보 $z$가 있을 경우 위의 네트워크들이 condition이 있는 mapping $\phi(x_m|z)$로 표현되게 된다.

Equivariant model

image

이를 다른 연산으로 치환하면 아래와 같이할 수 있는데,

image

max-pool이 sum과 비슷하게 교환법칙이 성립하기 때문이다. 실제 적용해봤을 때 sum보다 Max연산이 더 성능이 좋았다.

Applications and Empirical Results

학습할 때는 최대 10개 보여주고 test 시에는 100개까지 보여줌 Deep Set이 RNN 계열과 달리 일반화가 잘됨

LiDAR에서 측정되는 point들은 순서가 딱히 없음.