boostcampaitech3 / level2-data-annotation_cv-level2-cv-16

[부스트캠프 AI Tech 3기 / CV-16] 글자 검출 대회 Data Annotation (22.04.11 - 22.04.22)
1 stars 3 forks source link

[Data] 데이터셋 concat #45

Closed sodabeans closed 2 years ago

sodabeans commented 2 years ago

What

ICDAR + camper 데이터 concat

Why

더 많은 데이터로 모델 학습

How

    train_dataset1 = SceneTextDataset(
        PATH_TO_DATASET1, # FIXME
        split="train", image_size=image_size, crop_size=input_size
    )
    train_dataset1 = EASTDataset(train_dataset1)

    train_dataset2 = SceneTextDataset(
        PATH_TO_DATASET2, # FIXME
        split="train", image_size=image_size, crop_size=input_size
    )
    train_dataset2 = EASTDataset(train_dataset2)
    concat_dataset = torch.utils.data.ConcatDataset([train_dataset1, train_dataset2])

    num_batches = math.ceil(len(concat_dataset) / batch_size)
    train_loader = DataLoader(
        concat_dataset, batch_size=batch_size, shuffle=True, num_workers=num_workers
    )
sodabeans commented 2 years ago
├── Dataset1
│ ├── image
│ └── ufo
└── Dataset2
  ├── image
  └── ufo

이렇게 데이터셋 디렉토리가 구성되어 있고, json 파일은 ufo 폴더 안에 있다.