youngwoos / Doit_R

<Do it! 쉽게 배우는 R 데이터 분석> 저장소
212 stars 438 forks source link

extractNoun("대한민국의 영토는 한반도와 그 부속도서로 한다") 에러문제 #28

Closed pyk707 closed 4 years ago

pyk707 commented 4 years ago

Do it! 쉽게 배우는 R데이터를 공부하는 도중 오류가 있어 도움요청 드립니다.

Mac OS 에서 R-studio사용중이고, 다음과 같이 코드 작성시 책에서 나온 결과값이 달라서 도움요청드립니다.

extractNoun("대한민국의 영토는 한반도와 그 부속도서로 한다")를 실행하면, 하기와 같은 오류가 뜹니다.

Warning message:

In value[3L] :

can't processing '대한민국의 영토는 한반도와 그 부속도서로 한다'.

→코드입력


txt <- readLines(file("hiphop.txt", encoding = "EUC-KR"))

head(txt)

txt <- str_replace_all(txt, "\W"," ")

extractNoun("대한민국의 영토는 한반도와 그 부속도서로 한다")


→결과창


txt <- readLines(file("hiphop.txt", encoding = "EUC-KR"))

Warning messages:

1: In for (i in seq_along(specs)) { :

closing unused connection 3 (hiphop.txt)

2: In readLines(file("hiphop.txt", encoding = "EUC-KR")) :

incomplete final line found on 'hiphop.txt'

head(txt)

[1] "\"보고 싶다" "이렇게 말하니까 더 보고 싶다" "너희 사진을 보고 있어도"

[4] "보고 싶다" "너무 야속한 시간" "나는 우리가 밉다"

txt <- str_replace_all(txt, "\W"," ")

extractNoun("대한민국의 영토는 한반도와 그 부속도서로 한다")

[1] "대한민국의 영토는 한반도와 그 부속도서로 한다"

Warning message:

In value[3L] :

can't processing '대한민국의 영토는 한반도와 그 부속도서로 한다'.


Mac OS 환경에서는 한글 인코딩 문제가 있다고 하여 F/B참고하여 txt에 저장하였고, 띄어쓰기도 유의하여 특수문제 제거도 하였습니다. 데이터마이닝 오면서 에러가 너무 많아서 버거움을 느끼고 있는 뉴비입니다 ㅠㅠ

pyk707 commented 4 years ago

패키지 지우고 재설치하면서 해결되었습니다.