Closed ilovemyminutes closed 3 years ago
Multi-Scale Attention with Dense Encoder for Handwritten Mathematical Expression Recognition 논문이나 부스트캠프 강의에 따라 알게된 부분인데, CNN 계열 인코더로부터 얻은 feature map의 '채널'을 RNN 계열의 인풋으로 활용하기 떄문에, 이미지 크기(W, H)에 관계없이 동일한 인풋 shape를 유지할 수 있음!
지형 : resize + padding → square image 준철 : aspect_ratio의 범위에 따라 transform,resize를 다르게 주기 object detection에서 multiscale train을 했으니까 활용할 수 있지 않을까?? → 쉽지 않을듯.