Closed gil6301 closed 4 years ago
추가적으로
twitter$tw <- str_replace_all(twitter$tw, "\W", "")
head(twitter$tw) [1] "민주당의ISD관련주장이전부거짓으로속속드러나고있다미국이ISD를장악하고있다고주장하지만중재인123명가운데미국인은10명뿐이라고한다"
[2] "말로만미제타도사실은미제환장김정일운구차가링컨컨티넬탈이던데북한의독재자나우리나라종북들이나겉으로는노동자서민을대변한다면서고급외제차아이팟에자식들미국유학에환장하는위선자들인거죠"
[3] "한나라당이보수를버린다네요뭔가착각하는모냥인에국민들이보수를싫어하는게아니라뻘짓거리하는분들을싫어하는겁니다야당이진보어쩌고저쩌고한다고해서그들을조아한다고생각하면대착각"
[4] "FTA를대하는현명한자세사실자유주의경제의가장큰수해자는한국이죠농어업분야피해를줄이는정부대안을최대한보완하고일자리창출등실익을최대화해나가는게현실적인대처자세일듯"
[5] "곽노현씨갈수록가관입니다뇌물질에아들병역의혹까지도대체아이들이뮐보고배우겠습니까이래도자리연연하시겠습니까"
[6] "과거집권시한미FTA를적극추진하던세력이이제집권하면폐기하겠다고주장합니다어이없어말도안나오네요표만얻을수있다면국가안보나경제가어떻게되든상관없다는무책임한행태들우리정치의후진성을드러내는거죠"
이런식으로 띄어쓰기가 다 사라졌습니다.
csv파일 확인해보았는데 글자가 깨져있어서 한국어로 인코딩을 하려 했는데 한국어가 깨진상태로 밖에 인코딩되지 않는 상황입니다.
안녕하세요?
str_replace_all()
에 특수 기호를 입력할 때는 \
를 두 번 써야 하고, 빈칸으로 변환하도록 띄어쓰기 " "
를 삽입하셔야 합니다.
twitter$tw <- str_replace_all(twitter$tw, "\\W", " ")
궁금한 사항은 아래 데이터 분석 커뮤니티에 질문 올려 주시면 더 빠르게 답변을 받아보실 수 있습니다.
데이터 분석 커뮤니티 https://www.facebook.com/groups/datacommunity/
제가 띄어쓰기를 안해서 그렇군요..ㅎㅎ 감사합니다!!
안녕하세요 우선 매번 올리는 질문에 항상 답변 달아주셔서 정말로 감사드립니다.
텍스트 마이닝 중 오류가 계속 생겨서 질문 드립니다.![Screen Shot 2020-07-13 at 5 19 49 pm](https://user-images.githubusercontent.com/66740186/87288523-0a49d600-c52e-11ea-9a10-bfb2364d7aed.png)
nouns <- extractNoun(twitter$tw) 상단의 명령어를 입력했더니 아래 콘솔에 java.lang.ArrayIndexOutOfBoundsException 이 멈추지 않고 계속 생겨나고 있습니다.
웬만한 패키지는 이미 실행한 상태인데 제가 잊은것이 있는지 알 수가 없네요.
확인 해주시면 정말 감사드리겠습니다.