섹션2 머신러닝 배울 때, 파이프라인을 제대로 이해하지 못하고 사용했던 것 같은데, 이번 스프린트 과제 및 스프린트챌린지에서 파이프라인의 구성요소들을 직접 작성해보면서 좀 더 활용하는 법을 익힌 것 같음.
word2vec을 통한 모델링의 유용성을 직접 데이터를 모델에 넣고, 결과를 보면서 체감하게 됨. (이커머스 리뷰 데이터에서 단어만 분석해내는 것이 아닌 문맥을 통해 해당 단어와 리뷰 내용 전체가 분석되어서 유사한 리뷰들을 예측하는 것을 알게 됨)
어려웠던 부분/더 알고 싶은 부분:
단어를 벡터화하고, 모델에 넣고, 새로운 분석데이터로 다시 해당 모델에 넣어 시각화 그래프로 비교하고 결과를 해석하는 과정이 아직은 다 체득이 되지 않음.
키워드:
배운 것:
어려웠던 부분/더 알고 싶은 부분:
느낀 점: