Open syleeie2310 opened 4 months ago
형태소 분석을 할지말지
그대로 쓸지?
태그 값들을 제거해서 쓸지?
==? 소문자 변환/ 불용어 처리(i,he,she,is,am,the 등)/ 특수문자제거( :) 이런거는 가져가도 좋을듯
고민? 어떻게 할지?
허깅페이스 토크나이저 방식 리서치 필요 https://wikidocs.net/99893
Spark NLP
https://towardsdatascience.com/introduction-to-spark-nlp-foundations-and-basic-components-part-i-c83b7629ed59
형태소 분석을 할지말지
그대로 쓸지?
태그 값들을 제거해서 쓸지?
==? 소문자 변환/ 불용어 처리(i,he,she,is,am,the 등)/ 특수문자제거( :) 이런거는 가져가도 좋을듯
고민? 어떻게 할지?