da-analysis / asac_4_dataanalysis

ASAC 4기 Data Analysis Project
0 stars 1 forks source link

이미지/텍스트 데이터 활용 (모델 따로 나눠서) #27

Open syleeie2310 opened 2 months ago

syleeie2310 commented 2 months ago

-형섭님이 만드는 데이터 1억개 > co-review 데이터 평가는 민종님이 하시고 -지윤님이 몇개 만들지? >> 어떻게 할지?? 데이터가 너무 크면 안됨... 기준이 있어야 할지?? 어떻게 할지?? ㄴ 다큐먼트 길이가 어느정도 있는 애들만 30만개 > 1만개로 줄여서 한다.

syleeie2310 commented 2 months ago

최종 모델의 형태는...?

  1. co-review (민종님이 만든 기본적인 피쳐 만든것, 민종님)
  2. 이미지 1억개 짜리 모델 (형섭>민종님)
  3. 텍스트 1억개 짜리 모델 (지윤님)
  4. 1~3번 하이브리드. 1번 데이터에서 텍스트 또는 이미지 피쳐를 추가한것 (지윤님)

1~4번 streamlit에서 보여주는것이 목표로 하는게 좋을 듯???

imhs94 commented 2 months ago

프로토타입에서 위의 모델형태에 해당되는 3번 ( 텍스트1억개짜리 모델) 만 텍스트 요약을 보여주는건지 아니면 모든 모델에 나온 추천시스템 상품에 대해 클릭을 하면 메타정보와 함께 텍스트 요약을 보여주게 하는지 궁금합니다.

syleeie2310 commented 2 months ago

3번만 하면 될듯 해요 그리고 프로토타입 용은 저번에 말한것처럼 데이터는 조금 줄여서 보여줘도 될듯 해요.

1번 페이지 ㄴ 2(이미지),3(텍스트),4(하이브리드) 추천 모델의 결과 비교하는 페이지 (전에 보여주셨던 페이지)

2번 페이지 ㄴ 상품 메타 정보 보여주는 페이지 (상품 클릭했을 때 보여주는 메타 정보)

3번 페이지 ㄴ 3번 모델만 별도 기획 필요 (@JIYUN0710 님과 이야기 필요)

우선 이전에 말한 1,2번 페이지 개발이 완료된 다음에 3번 이야기 하는게 좋을 듯 합니다.

imhs94 commented 2 months ago