bcaitech1 / p4-fr-sorry-math-but-love-you

a math-formula image recognition project which placed at the first place in a competition hosted by NAVER CONNECT boostcamp AI Tech
11 stars 8 forks source link

EDA - 이미지 리사이징 이슈 #7

Closed ilovemyminutes closed 3 years ago

ilovemyminutes commented 3 years ago

지형 : resize + padding → square image 준철 : aspect_ratio의 범위에 따라 transform,resize를 다르게 주기 object detection에서 multiscale train을 했으니까 활용할 수 있지 않을까?? → 쉽지 않을듯.

ilovemyminutes commented 3 years ago

Multi-Scale Attention with Dense Encoder for Handwritten Mathematical Expression Recognition 논문이나 부스트캠프 강의에 따라 알게된 부분인데, CNN 계열 인코더로부터 얻은 feature map의 '채널'을 RNN 계열의 인풋으로 활용하기 떄문에, 이미지 크기(W, H)에 관계없이 동일한 인풋 shape를 유지할 수 있음!