for i,j in zip(dataset['subject_entity'], dataset['object_entity']):
i = i[1:-1].split(',')[0].split(':')[1]
j = j[1:-1].split(',')[0].split(':')[1]
split(',') 때문에 글자가 6,000명 이런글자의 경우 '6'으로 읽어오더라구요
그래서
for i,j in zip(dataset['subject_entity'], dataset['object_entity']):
i = i[i.find('word')+8: i.find('start_idx')-4]
j = j[j.find('word')+8: j.find('start_idx')-4]
for i, j in zip(dataset["subjectentity"], dataset["objectentity"]):
i=eval(i)['word']
j=eval(j)['word']
Ai stages 토론보다가 발견한건데 기존 데이터 불러오는 방식이 이런식이였는데
split(',') 때문에 글자가 6,000명 이런글자의 경우 '6'으로 읽어오더라구요
그래서
이렇게 수정하셨다는데 조금 중요한 이슈같은데 어떻게 생각하시나요?
참고 링크 : https://stages.ai/competitions/75/discussion/talk/post/641