수행내용
문서를 분류하는 모델 만들기
문서 내의 의미있는 topic 도출하기위해 SVD(특이값 분해)를 사용하여 문서나 단어를 차원축소시켜
Latent Semantic Analysis(잠재의미분석)하기
오늘의 한마디
선형대수를 활용한 이론을 완벽하게 이해하기가 어려워 일단 사용할 줄 알게끔 하는 것에 초점 맞추는 중.
사용하는 것 자체는 어렵지 않은 것 같으나 진행하다보면 판다스 시리즈는 입력받을 수 없다 혹은
판다스 데이터프레임은 입력될 수 없다 등의 오류를 많이 보게 된다.
코드의 파라미터로 넣을 수 있는 데이터타입 등은 관련문서를 찾아보면 되는데 내가 가지고 있는 타입을
어떻게 파라미터로 넣을 수 있게끔 만드는지에 대한 방법을 찾는 것이 어렵다.
기본기가 부족하니 이런 문제에서 벗어나질 못하는중..
[x] NLP
[x] Document Classification
[x] Latent Semantic Analysis
수행내용 문서를 분류하는 모델 만들기 문서 내의 의미있는 topic 도출하기위해 SVD(특이값 분해)를 사용하여 문서나 단어를 차원축소시켜 Latent Semantic Analysis(잠재의미분석)하기
오늘의 한마디 선형대수를 활용한 이론을 완벽하게 이해하기가 어려워 일단 사용할 줄 알게끔 하는 것에 초점 맞추는 중. 사용하는 것 자체는 어렵지 않은 것 같으나 진행하다보면 판다스 시리즈는 입력받을 수 없다 혹은 판다스 데이터프레임은 입력될 수 없다 등의 오류를 많이 보게 된다. 코드의 파라미터로 넣을 수 있는 데이터타입 등은 관련문서를 찾아보면 되는데 내가 가지고 있는 타입을 어떻게 파라미터로 넣을 수 있게끔 만드는지에 대한 방법을 찾는 것이 어렵다. 기본기가 부족하니 이런 문제에서 벗어나질 못하는중..