Open jinmang2 opened 3 years ago
google drive에 standard.csv 파일을 만들어서 올렸습니다.
standard.csv
001720
003113
006504
95%
5%
900
18,900
50
18
아래 코드로 재현 가능함
import random import numpy as np import pandas as pd seed = 8 random.seed(seed) np.random.seed(8) df = pd.read_csv("labeled_train_v2.csv", index_col="id") rand_ind = [] for i in range(18): rand_ind += df.groupby("label").get_group(i).sample(50).index.tolist() rand_ind = sorted(rand_ind) df["train"] = np.zeros(len(df), dtype=np.int32) df.loc[rand_ind, "train"] = 1 df.to_csv("standard.csv")
google drive에
standard.csv
파일을 만들어서 올렸습니다.001720
,003113
,006504
도 추가! (female to male)95%
:5%
비율로 validation set 제작5%
의 validation set은 총900
장의 이미지로 구성 (전체18,900
장)900
장은 각 클래스 별50
장으로 구성됨 (총18
개 class)아래 코드로 재현 가능함