Closed Dongwoo-Im closed 2 years ago
stratified_5fold.py
class별 category_id 수
stratified_5fold_group.py
class별 category_id 수
확인 코드 (jupyter)
for mode in ['train', 'val']:
for i in range(5):
with open(f'/opt/ml/input/data/stratified_5fold/{mode}_fold{i}.json', "r") as file:
data = json.load(file)
output = []
annot_list = [ann['category_id'] for ann in data['annotations']]
for cls in range(1, 11):
output.append(annot_list.count(cls))
if mode=='train' and i==0:
df = pd.DataFrame({f"{mode}_fold{i}": output})
else:
df = pd.concat([df, pd.DataFrame({f"{mode}_fold{i}": output})], axis=1)
df
What is this PR?
Cross validation 적용을 위한 PR입니다.
Changes
aistages의 토론게시판 참고하여 작성하였습니다. ref : https://stages.ai/competitions/191/discussion/talk/post/1330
To reviewers
중요! stratified_kfold.py 실행을 위해 라이브러리 설치가 필요합니다.
pip install iterative-stratification
폴더 이름에
args.n_split
를 반영하여 stratified_5fold, stratified_5fold_group과 같은 식으로 생성됩니다.반복해도 동일 결과를 얻는 것으로 확인했는데, 돌려보시고 아래의 category_id 수로 cross-check 해보셔도 좋을 듯 합니다.