Closed ddeokho closed 4 years ago
테스트 방법 결정
it was designed
to work with square aspect ratio RGB images. The first
necessary modification to the backbone is to allow the first
channel to take images with 5 channels. As we are dealing
with a sensor that has an array of 64 vertically-placed laser
range-finders producing in the order of 130 000 points per
scan, this leaves us with a range image of around w =
2048 pixels. To retain information in vertical direction, we
therefore only perform downsampling in horizontal direction.
This means that in the encoder, an OS of 32 means a
reduction in w of a factor of 32, but 64 pixels still remain
intact in vertical direction h. To evaluate how well our post-
processing recovers the original point cloud information,
we analyze input sizes of [64 × 2048], [64 × 1024], and
[64 × 512] in our experimental evaluation, which produce
feature volumes at the end of the encoder of size [64 × 64],
[64 × 32], and [64 × 16] respectively.
bilinear interpol 유무에 따른 결과 비교(1차 보간을 사용한 이유의 근거로 멘토님께서 설명해 주신 것 참고, projection 후 하나의 물체를 표현하는 데이터의 값의 범위가 비슷하다는 근거 제시 - histogram) 슬랙에 csv파일로 보간하기 전에의 프레임 하나를 저장해 올려 두었고 csv파일을 토대로 히스토그램 작성하면 근거가 될 수 있다 생각함. 추가로 라이다 센서의 분해능을 근거로 1차 interpolation을 이용할 경우 발생할 오차가 크지 않음을 들 수 있지 않을까 생각함
멘토님께서 말씀해주신 interpolation 내용 보기 https://paeton.tistory.com/entry/Upsampling-using-Interpolation-Filter https://darkpgmr.tistory.com/171
테스트 시트 https://docs.google.com/spreadsheets/d/1pvByw_wTB8b5LLG8WTnXxWs47CNf2Hy_uEEZLbYpOrA/edit?usp=sharing
환경 : ubuntu 18.04 LTS CPU : intel i7(8th) 시험 환경에 또 다른 정보가 필요할까요?
프레임의 비율과 크기에 따라 bilinear를 사용 유무를 제안할 수 있으며 192*1024의 프레임의 경우 가장 높은 ap을 볼 수 있었네요. 어떻게 잘 정리해서 써야 할지 고민해봐야 겠네요.
평균 정밀도, fps를 지표로 bilinear interpolation 유/무, spherical projection 프레임의 크기를 변경해가며 비교할 수 있도록 함.(테스트 시트 제작)
매 회마다 다른 결과가 나온다. 그래서 몇 개만 간략히 뽑아 보았을 때 위와 같은 경향을 보인다.(성능이 좋지 않아 다운 님께서 작업하시는 모델을 적용 후 다시 체크해보긴 해야 한다.) fps를 비슷하게 나오도록 수정할 수 있는 부분이 있는지 체크하려함.
추가로 bilinear interpolation 외 2차 식으로 interpolation을 하는 등 추가로 적용해 비교도 가능할 것으로 보임.