TeorinKim / NetworkAnalysis

0 stars 0 forks source link

글자수 세기 + 연도별 평균 #17

Open TeorinKim opened 2 years ago

TeorinKim commented 2 years ago

불러오기

import numpy as np
import pandas as pd

voc_raw = pd.read_excel("d:/ML/voc_lab/통합_VOC.xlsx")
voc_all = voc_raw

행별 글자 수 세기

countvoc = []

for i in range(len(voc_all)):
    year = voc_all['year'][i]
    voc = str(voc_all['voc'][i])
    voc = voc.replace(" ","")
    count = len(voc.encode('utf=8'))
    countvoc.append(count)

voc_all['count']=countvoc

글자 수 데이터프레임에 넣기

voc_count=voc_all.loc[:,['year','part','voc','count']]
voc_1921=voc_count.loc[voc_count['year']>2018]

그룹별 글자수 평균 계산

voc_1921.groupby(['year'],as_index=False).mean()