Open TeorinKim opened 2 years ago
불러오기
import numpy as np import pandas as pd voc_raw = pd.read_excel("d:/ML/voc_lab/통합_VOC.xlsx") voc_all = voc_raw
행별 글자 수 세기
countvoc = [] for i in range(len(voc_all)): year = voc_all['year'][i] voc = str(voc_all['voc'][i]) voc = voc.replace(" ","") count = len(voc.encode('utf=8')) countvoc.append(count) voc_all['count']=countvoc
글자 수 데이터프레임에 넣기
voc_count=voc_all.loc[:,['year','part','voc','count']] voc_1921=voc_count.loc[voc_count['year']>2018]
그룹별 글자수 평균 계산
voc_1921.groupby(['year'],as_index=False).mean()
불러오기
행별 글자 수 세기
글자 수 데이터프레임에 넣기
그룹별 글자수 평균 계산