nnstreamer-preprocessor / nnstreamer

4 stars 0 forks source link

preprocessor 결과 도출 #21

Closed ddeokho closed 4 years ago

ddeokho commented 4 years ago

평균 정밀도, fps를 지표로 bilinear interpolation 유/무, spherical projection 프레임의 크기를 변경해가며 비교할 수 있도록 함.(테스트 시트 제작)

bilinear
9.252161 19.000000 ap= 0.486956
7.021019 15.000000 ap= 0.468068 fps=6.500
+filter
1.084274 2.000000 ap= 0.542137 fps=6.160

x
8.127360 17.000000 ap= 0.478080
8.102783 18.000000 ap= 0.450155 fps=7.124
+filter
0.874357 2.000000 ap= 0.437179 fps=6.584

매 회마다 다른 결과가 나온다. 그래서 몇 개만 간략히 뽑아 보았을 때 위와 같은 경향을 보인다.(성능이 좋지 않아 다운 님께서 작업하시는 모델을 적용 후 다시 체크해보긴 해야 한다.) fps를 비슷하게 나오도록 수정할 수 있는 부분이 있는지 체크하려함.

추가로 bilinear interpolation 외 2차 식으로 interpolation을 하는 등 추가로 적용해 비교도 가능할 것으로 보임.

ddeokho commented 4 years ago

테스트 방법 결정

it was designed
to work with square aspect ratio RGB images. The first
necessary modification to the backbone is to allow the first
channel to take images with 5 channels. As we are dealing
with a sensor that has an array of 64 vertically-placed laser
range-finders producing in the order of 130 000 points per
scan, this leaves us with a range image of around w =
2048 pixels. To retain information in vertical direction, we
therefore only perform downsampling in horizontal direction.
This means that in the encoder, an OS of 32 means a
reduction in w of a factor of 32, but 64 pixels still remain
intact in vertical direction h. To evaluate how well our post-
processing recovers the original point cloud information,
we analyze input sizes of [64 × 2048], [64 × 1024], and
[64 × 512] in our experimental evaluation, which produce
feature volumes at the end of the encoder of size [64 × 64],
[64 × 32], and [64 × 16] respectively.

Screenshot from 2020-04-13 00-17-28

ddeokho commented 4 years ago

Screenshot from 2020-04-15 15-38-41

환경 : ubuntu 18.04 LTS CPU : intel i7(8th) 시험 환경에 또 다른 정보가 필요할까요?

프레임의 비율과 크기에 따라 bilinear를 사용 유무를 제안할 수 있으며 192*1024의 프레임의 경우 가장 높은 ap을 볼 수 있었네요. 어떻게 잘 정리해서 써야 할지 고민해봐야 겠네요.