HyunjoonCho / CS492I-IntroToDL-project

Team project repo for CS 492 I <Introduction to Deep Learning>
0 stars 0 forks source link

Project Proposal Day #1

Open HyunjoonCho opened 2 years ago

HyunjoonCho commented 2 years ago

각 주제에 대해 세밀한 검토를 하기 전 우선 아이디어 중심으로 제안

HyunjoonCho commented 2 years ago

Proposal report guideline

HyunjoonCho commented 2 years ago

TODOs

두 개씩 나눠서 조사, 내일 저녁 8시 미팅

HyunjoonCho commented 2 years ago

Buy the rumor, Sell the news

Objective

주식 시장에서 통용되는 문구
뉴스가 공개되기 이전부터 주요 시장 참여자(기관, 외인 등)들은 해당 소식을 파악
뉴스의 공개와 동시에 유입되는 투자 주체들(주로 개인)에게 물량을 떠넘기고 빠진다(혹은 반대로 물량을 쓸어담음)는 이야기
위 명제가 참인지 검증하고 나아가 새로운 기사를 바탕으로 주가 움직임을 예측

Approach

결국 변동성에 대한 문제 - 학습 결과를 일반화할 수 있는가?

archive-cs-minhyuk commented 2 years ago

패션 커뮤니티 기반 올해의 트렌드 예측

Project Objective

과거의 스키니진, 아디다스 트랙세트 등 한 시대를 풍미했던 아이템들 현재의 남성 패션은 유래없는 춘추전국시대를 맞이하고 있다. 그 안에서 어떻게 현재 남성 패션의 트렌드를 읽어낼 수 있을까? 이 프로젝트는 대한민국 남성들 사이 많이 이용되는 패션 커뮤니티를 이용해 각 커뮤니티 별 유행하는 패션과 종합적인 트렌드를 예측하는 것을 목표로 한다.

Approach/Baselines

Plan for training

Plan for evaluation

NER model의 결과는 f1-score로 평가하는 것이 일반적인듯?

Risk Management

  1. '야상','항공점퍼' 등 키워드 검출을 위한 개체명이 모호함
  2. '나이키','구찌'처럼 유명한 브랜드가 아닌 국내 브랜드의 경우 기업명으로 인식될지
  1. 네이버 카페가 크롤링 지원하는지, 본문 태깅은 잘 되어 있는지 알 수 없음
  1. 학습을 위한 dataset 부족? 실제로 label 가진 dataset 어떻게 만들건지
HyunjoonCho commented 2 years ago

text2nn

Objective

Text to Neural Network: Automated Neural Network builder based on paper/architecture description/diagram
딥개 과제와 유사한 형태 - 특정 NN 구조가 text/table/diagram으로 주어졌을 때 PyTorch 코드로 반환

Reference

archive-cs-minhyuk commented 2 years ago

Annual Report Summarization(+Paper Summarization)

Project Objective

대한민국에 분 주식 열풍(가계 보유 주식 1000조원 돌파 등 뉴스) 우리는 기업에 대해 얼마나 알고 투자하고 있는가? 이 프로젝트는 기업의 연간 보고서를 input으로 받아 사람들이 쉽게 읽을 수 있는 요약문을 생성하는 것을 목표로 한다.

Approach/Baselines

Text summarization 기술들 - 추출 요약과 생성 요약

BERT를 기반으로 fine-tuning하는 방식으로(BERTSUM?)

Text summarization의 역사와 BERT+transformer를 적용한 summarization

Fine-tune BERT for Extractive Summarization

Text Summarization with Pretrained Encoders (추출 요약과 생성 요약 모두)

Plan for training

다양한 본문과 요약문 (질문: 꼭 Annual Report 여야 하는가?) WIP

Plan for evaluation

압축률 ROUGE Score: 문서 요약, 기계 번역 등 모델의 성능을 평가하기 위한 지표

Text Summarization에 대한 지표들

Risk Management

HyunjoonCho commented 2 years ago

1011 미팅