Open HumanAI-B opened 4 years ago
@HumanAI-B
안녕하세요.
테스트 데이터의 네이밍은 두 가지 타입으로 되어 있습니다.
{number}-{number}_cam{number}_{string}_{string}_{string}_{string}_{frame_id}.jpg
{number}_{number}_{frame_id}.jpg
입니다.
말씀주신대로 file name 에서 frame id 를 분리하려면
frame_id = file_name.split('.jpg')[0].split('_')[-1]
과 같은식으로 맨 뒤의 _
을 기준으로 앞은 {video_id}
뒤는 {frame_id}
로 나누시면 됩니다.
Frame_id 는 zero-padding (ex: {video_id}_0000.jpg, {video_id}_0123.jpg
) 가 되지 있지 않습니다.
즉, ({video_id}_0.jpg, {video_id}_123.jpg)
의 형태 입니다.
또한, README.md 에서 도시한 것과 같이 15fps 로 취득된 영상을 5 fps로 subsampling 하여 테스트 데이터로 활요하고 있는 점을 알려드립니다.
즉, [{video_id_1}_0.jpg, {video_id_1}_3.jpg, {video_id_1}_6.jpg, ..., {video_id_n}_0.jpg, {video_id_n}_3.jpg, ... ]
이라는 점 유의하시면 좋을 것 같습니다.
@sangdooyun 결국엔 _infer() 함수에서 정의해놓은 return 형태로 output을 만들어주면 되는거죠?
@G-Bong 네 그렇습니다.
트랙 1의 README를 보니 35,000장이 아닌 34,822장의 이미지로 구성되어 있다고 해서, 혹시 규칙에 수정이 있었나 해서 확인차 문의드립니다.
각 영상에 해당하는 이미지를 묶어 행동인지모델에 입력하고자 하는데, 세부 문제정의서에 공개된 대로 't1_cam1_0001.jpg' 과 같은 규칙을 정확하게 따르고 있는것인지요?
다시말해 ['t1_cam1_0001.jpg', 't1_cam1_0002.jpg' ... 't1_cam350_0099.jpg', 't1_cam350_0100.jpg']으로 구성된 것인지 확인 부탁드립니다.