Open danbi5228 opened 1 year ago
assign roles -s 0816 -c 1 2 3
0 | 1 | 2 | |
---|---|---|---|
member | 주선미 | 한단비 | 김유리 |
chapter | 1 | 2 | 3 |
각 픽셀은 픽셀이 속한 객체의 클래스로 구분
가장 어려운 점은 일반적인 CNN을 통과할 때 점진적으로 위치 정보를 잃음 (1 이상의 스트라이드를 사용하는 층 때문)
보통의 CNN은 이미지의 왼쪽 아래 어딘가에 사람이 있다고 알 수 있지만 그보다 더 정확히 알지는 못함
이 문제를 해결하기 위해,
업샘플링
이 외에도
순환 층 전체의 출력 벡터는 아래와 같이 계산될 수 있음
b: 편향 / ∅: ReLU와 같은 활성화 함수
피드 포워드 신경망처럼 모든 입력을 행렬로 만들어서 미니배치 전체에 대한 순환 층의 출력을 한번에 계산할 수도 있음
Y(t): 각 샘플에 대한 층의 출력을 담은 m x n 행렬 (m: 미니 배치 샘플 수 / n: 뉴런 수)
X(t): 모든 샘플의 입력값을 담은 m x n 행렬
Wx: 현재 타임 스텝의 입력에 대한 연결 가중치를 담은 n x n 행렬
Wy: 이전 타임 스텝의 출력에 대한 연결 가중치를 담은 n x n 행렬
b: 각 뉴런의 편향을 담은 n 크기의 벡터
[X(t) Y(t-1)] 표기는 행렬을 수평적으로 연결한다는 의미. m x (n + n) 크기
Y(t)는 X(t)와 Y(t-1)의 함수이고, Y(t-1)는 X(t-1)와 Y(t-2)의 함수이므로 Y(t)는 시간 t=0에서부터 모든 입력에 대한 함수가 됨