PinkWink / DataScience

책) 파이썬으로 데이터 주무르기 - 소스코드 및 데이터 공개
http://pinkwink.kr/1070
246 stars 503 forks source link

8장. 자연어 처리 p314 #80

Open sophi1127 opened 4 years ago

sophi1127 commented 4 years ago

안녕하세요, pinkwink님의 '파이썬으로 데이터 주무르기'를 통해 Data Science에 조금 더 감을 잡아가고 있는 독자입니다.

자연어처리를 공부하던 중 질문이 생겼는데요, p314에서 In[63]과정을 돌렸을 때 tokenize(test_sentence[0])과정이 생략되어서 그런지 test_sent_features를 실행하였을 때 모두 'False'가 나오는데요, 저는 test_docs = tokenize(test_sentence[0])를 실행하고 classifier.classify(test_sent_features)를 실행하였더니 여전히 'neg'가 나오는 것을 확인했습니다.

혹시 제 코드가 이상한 걸까요?

test_docs = tokenize(test_sentence[0]) test_docs test_sentence_features = {word: (word in tokens) for word in test_docs} test_sentence_features classifier.classify(test_sentence_features)