ko-nlp / Korpora

Korean corpus repository
Creative Commons Attribution 4.0 International
694 stars 80 forks source link

KorpusData yiels their attributes (fix#19) #20

Closed lovit closed 4 years ago

lovit commented 4 years ago

Usage example

from Korpora import NSMC

nsmc = NSMC(root_dir='./Korpora/')
for i, row in enumerate(nsmc.train):
    if i > 10:
        break
    print(row)
('아 더빙.. 진짜 짜증나네요 목소리', 0)
('흠...포스터보고 초딩영화줄....오버연기조차 가볍지 않구나', 1)
('너무재밓었다그래서보는것을추천한다', 0)
('교도소 이야기구먼 ..솔직히 재미는 없다..평점 조정', 0)
('사이몬페그의 익살스런 연기가 돋보였던 영화!스파이더맨에서 늙어보이기만 했던 커스틴 던스트가 너무나도 이뻐보였다', 1)
('막 걸음마 뗀 3세부터 초등학교 1학년생인 8살용영화.ㅋㅋㅋ...별반개도 아까움.', 0)
('원작의 긴장감을 제대로 살려내지못했다.', 0)
('별 반개도 아깝다 욕나온다 이응경 길용우 연기생활이몇년인지..정말 발로해도 그것보단 낫겟다 납치.감금만반복반복..이드라마는 가족도없다 연기못하는사람만모엿네', 0)
('액션이 없는데도 재미 있는 몇안되는 영화', 1)
('왜케 평점이 낮은건데? 꽤 볼만한데.. 헐리우드식 화려함에만 너무 길들여져 있나?', 1)
('걍인피니트가짱이다.진짜짱이다♥', 1)
lovit commented 4 years ago

commit c1c451e 의 usage case

len(nsmc.train.get_all_texts())  # 150000
ratsgo commented 4 years ago

마스터와 컨플릭트 나는 부분을 수정하였습니다