AutonomicMachineLearning / MLFramework

1 stars 1 forks source link

COCO dataset for object detection #14

Open chatterboy opened 5 years ago

chatterboy commented 5 years ago
rhlwkdlsrks commented 5 years ago

CoCo DataSet

  1. 데이터 갯수 및 크기(용량)

    • Train : 118,287개 (17.9GB)
    • Val : 5,000개 (776MB)
    • Test : 40,670개 (6.18GB)
    • 각 데이터별 크기 : 20~330KB (평균 151KB)
  2. 데이터 포맷 : JPG

  3. 각 데이터의 크기(사이즈)

    • 640×480, 480×640, 640×424, 600×600, 448×336, etc.
    • 가로세로 비율 최대 1.33, 최대 크기 640 이내
  4. 채널

    • 대부분이 RGB 3채널, 간혹 흑백 채널 사진 포함되어있음
  5. 데이터셋 정보

    • 각 데이터 셋(Train, Validation, Test)은 각 디렉토리별로 구분되어 저장됨
  6. 타겟 정보

    • 타겟에 대한 정보는 각각의 Task에 따라 서로 다른 디렉토리 내에, 각각의 데이터셋 별로 .Json파일로 작성됨

전반부에는 다음과 같은 형식으로 각 데이터 파일의 기본 정보가 작성되어 있음

"images": [ {"license": 3,"file_name": "000000391895.jpg","coco_url": "http://images.cocodataset.org/train2017/000000391895.jpg","height": 360,"width": 640,"date_captured": "2013-11-14 11:18:45","flickr_url": "http://farm9.staticflickr.com/8186/8119368305_4e622c8349_z.jpg","id": 391895}, {"license": 4,"file_name": "000000522418.jpg","coco_url": "http://images.cocodataset.org/train2017/000000522418.jpg","height": 480,"width": 640,"date_captured": "2013-11-14 11:38:44","flickr_url": "http://farm1.staticflickr.com/1/127244861_ab0c0381e7_z.jpg","id": 522418},

license : 사용 가능 라이센스 증명번호로 생각됨(정확한 의미 불명) file_name: 디렉토리에 저장되어 있는 실제 파일 이름 coco_url : 해당 이미지의 디렉토리 height, weidth : 이미지의 크기 date_captured : 이미지가 생성된 날짜 fickr_url : 이미지 출처 id : 뒤에서 사용할 해당 이미지의 ID

후반부에는 각 Task별로 작성 형태는 다르나 각 Task에 맞는 Target정보가 작성되어있음. 예를 들어

"annotations": [ {"segmentation": [[239.97,260.24,222.04,270.49,199.84,253.41,213.5,227.79,259.62,200.46,274.13,202.17,277.55,210.71,249.37,253.41,237.41,264.51,242.54,261.95,228.87,271.34]],"area": 2765.1486500000005,"iscrowd": 0,"image_id": 558840,"bbox": [199.84,200.46,77.71,70.88],"category_id": 58,"id": 156},

{"segmentation": [[247.71,354.7,253.49,346.99,276.63,337.35,312.29,333.49,364.34,331.57,354.7,327.71,369.16,325.78,376.87,333.49,383.61,330.6,379.76,321.93,365.3,320.0,356.63,317.11,266.02,331.57,260.24,334.46,260.24,337.35,242.89,338.31,234.22,338.31,234.22,348.92,239.04,353.73,248.67,355.66,252.53,353.73]],"area": 1545.4213000000007,"iscrowd": 0,"image_id": 200365,"bbox": [234.22,317.11,149.39,38.55],"category_id": 58,"id": 509},

형태로 segmentation에 필요한 X, Y 좌표 값 등 image_id : 전반부에 작성된 각 이미지 파일의 파일의 ID area, bbox, category_id, id : 기타 타겟에 대한 정보

chatterboy commented 5 years ago

http://www.aihub.or.kr/