neural net output 으로 bezier_curve 를 뱉자는 논문. 우선 이것부터 보기를 추천. 중학생도 이해하는 bezier curve blog

실험적으로 3차 bezier-curve면 충분하다는 것을 보임. (사실 3차 이상으로 표현할 만한 curve text 도 없을 듯 ...) 즉, 4개의 control point를 예측하면 되는 문제임.

박스마다 위 아래의 bezier-curve 를 예측하면 되기 때문에 총 8개의 control point를 예측하면 박스 하나가 딱 나옴.

Total text 는 위 아래 5 개씩 annotation (m=5), CTW1500 은 위 아래 7 개씩 annotation (m=7) 되어 있음 p 가 annotated 되어진 point 이고 basis function B 는 정해져 있기 때문에, least square method로 기존 GT 와 가장 유사한 control point b 4개를 구할 수 있음.

빨간 점들이 control points. 요것들을 gt 로 두고 regression.

4 와 regression 방식이 유사함.

위와 같은 식으로 16channel output (8 points {x, y}) 을 활용.
즉, feature map 1 칸마다 1개의 detection 을 만들도록 하는 것.

수식을 보면 잉? 이게 뭐지 할 수 있음.
설명이 불친절하다 느꼈음 ㅎㅎ
그냥 x_min, y_min 이 4개 control point 중 가장 작은 x, y 값임.
가장 작은 x, y 값 기준으로 (top-left point) 거리를 계산하고 그걸 prediction 하는 거임. loss 는 #4 와 같은 smooth ln loss 일 듯 (확인해 봐야 함) (0, 0) 기준으로 옮겨다 놓고, regression 하겠다는 이야기임.