BOAZ 10th Adv project
에어비앤비 리뷰 분석
강민 소현 찬규
Did List
- [18.09.26] gitHub repo 생성, 일부 자료 정리
- [18.09.27] 프로젝트 회의
- [18.10.04] 프로젝트 회의: 각자 주제 선정
- [18.10.15] 프로젝트 회의: 주제 아이디어 추가
- [18.10.20] 주제 아이디어 확정
- [18.10.21] 회의 : 데이터 수집 시작
- [18.10.25] 회의 : 일부 데이터 수집 및 전반적인 시스템 구상 & 리뷰 based RS 관련 논문
- [18.11.01] 정리 : 리뷰 데이터 crawler & LDA 개념
- [18.11.06] 회의 : 크롤러 완성, 데이터수집
- [18.11.08] 정리 : RNN기반 감성분석, LDA 공부
- [18.11.15] 회의 : LARA,LDA 이용 세부 rating 도출 방법 정리, BOAZ 수료자 피드백
- [18.11.19] 정리 : 데이터수집(서울,부산,제주) 완료, 영어 외 언어 번역작업(파파고) 수행 중
- [18.11.22] 회의 : [What Airbnb Reviews can Tell us?] 논문 리뷰
- [18.11.24] 회의 : 한국어 번역 전 전처리 시도
- [18.11.29] 회의 : 파파고 이용 번역 완료
- [18.12.03] 회의 : 텍스트 전처리 완료. LDA 모델링 중. LARA 논문 리뷰
- [18.12.06] 회의 : LARA segmentation 알고리즘 구현 완료
- [18.12.08] 정리 : LDA 최적화 중, LRR 구현 중
- [18.12.14] 회의 : elastic net 기반 감성사전 구축 논의, 스케쥴조정
- [19.01.13] 정리 : doc2vec, 평점 0-3인 방에 대해 LDA 후 aspect별 elastic net , LDA 전처리 완료, 전체 LDA
To Do List
[18.01.13]
- doc2vec 내일까지 parameter 조정
- 내륙 / 바다 지역 LDA
- 방에 대한 워드클라우드 만들어보기
- aspect별로 긍부정 워드클라우드 만들어보기 (ppt용)
- DTM으로 행렬곱, 부정적인 aspect에 대해서 score 구해보기 -> 다른방과 비교해서 표정으로 시각화
- LARA는 motivatation
- 포토샵으로 사이트 구성 다시해보기
Review Based Airbnb Recommender System
강의
NLP
-
블로그 등 자료
Embeddings
Sentence Classification
Aspects Detection
LDA
- 블로그 등 자료
- 관련 논문
- usin R
- usin Python
RS
ETC
후보 주제 리스트업
0) Review Based Cosmetics Recommender System
1) 스포일러성 리뷰 분류
2) 개발자 커뮤니티 QA
5) 일베 스크리닝
6) 인스타 이미지 태깅