sangmandu / 2022-DCC

0 stars 1 forks source link

멘토링 ( 1 / 3 ) #15

Open git-ThLee opened 2 years ago

git-ThLee commented 2 years ago

10월 15일 (토) DSS 멘토링 1회차

  1. 멘토 : 유승룡 멘토님

  2. 사전학습 모델 사용 여부 : 중복이미지 제거에 사용되는(미션1,2) 사전학습된 모델은 사용해도 무관함

  3. 중간에 성능을 측정할 수 있는가? : 안줌, 미션과정 중간에는 성능을 안알려줌(리더보드 제공X) , 변동사항있으면 알려주신다고함

  4. 중복이미지란 완전 똑같은 이미지 vs argumetation 포함한 이미지인가 : (멘토님)완전 똑같은 이미지만 중복이미지로 판단(argumetation 정도에 따라 중복이미지 판단이 어려움)

  5. 만약 argumentation이미지를 일부 제거했는데, 성능이 좋으면 제거해도 되는가? : Yes , 유독 하나의 이미지에 argumentation이 많으면 오버피팅 될수도잇음

  6. 차량운송 카테고리에서 "버스", "기차", "자전거" 가 있을때, [버스, 기차, 자전거]의 이미지 개수의 비율이 동일하면 성능이 좋을까 : 실험을 해봐야함, 또한 (?시맨틱 예시) 운송수단 밑에 suv(1만), 트럭(100장), 버스(10만) 있다면, suv,트럭,버스의 이미지 특징(바퀴)을 겹쳐야 성능이 높아질 수 있음

  7. 데이터 제출 형식(형태) : 모델 + 성능(f1)

  8. test 구조가 같은가? : train과 같음, 즉, 20개의 클래스가 같음

  9. 성능보단 논리적으로 실험했는가가 점수가 높음 : 예를들어, batch사이즈를 1024를 줫을때, 왜 1024를 줬는가에 대한 설명을 하면 좋음, 그냥 1024가 성능이 좋더라 X 예시 문장 : 특정 실험을 "0~100"까지 햇을때, 무작정 0~100까지의 일일히 실험과정을 사용하는 것보다 "특정 실험을 [0~100]까지 실험해본 결과 성능이 미미했다" 라고 하는게 더 좋음 예시 문장 : 만약 성능이 미미했을때, 무작정 성능이 미미했다고 보고서에 쓰는 것보다, "OO논문을 보고 OO 실험을 했을 때, 성능이 미미했다. 그 이유는 OOO인거 떄문인거 같다" 라고 쓰는게 더 좋다고 하심

  10. 오토인코더 + PCA : 상민님한테 물어볼 것 (첨언) 오토인코더를 학습하는 과정에서 일러스트랑 실사를 어떻게 구분할까? (첨언) 인코더는 디스???.(이)가 안좋음,

  11. 내가 직접 사전학습 시킨 모델 사용하기(프리트레이닝) : 상관없음. 프리트레이닝을 하게되면 특정 태스크만 수행하기 위해, 많은 정보를 손실할 수 잇음 (첨언)프리트레이닝 100에폭 ~ 200 에폭 잡고 하기(시간부족문제), 튜닝 후에 800~1000에폭하기

  12. 업샘플링, 다운샘플링 : 크게 불균형 문제로 인식해야하며, 학습과정에서 불균형을 어떻게 처리해야할 것이지를 해결해야함. 즉, 업샘플링, 다운샘플링으로 문제를 해결하려고 하면 안됨.