Open lawliet62 opened 4 days ago
현재 기계 평가의 단위는 전체 데이터셋이어야 하지만, 현재 코드에서는 서브 데이터셋 단위로만 텍스트 파일을 저장하고 있습니다.
서브 데이터셋의 목적은 모든 데이터를 대상으로 인간 평가를 진행할 수 없으므로, 일부 데이터를 선별하여 인간 평가를 수행하기 위함이었습니다.
하지만 이제 인간 평가가 완료되었으므로, #file:main.py를 수정하여 전체 데이터셋을 텍스트 파일로 저장하는 기능을 구현해야 합니다. 이 과정에서 #file:dataset_to_txt.py 파일도 수정이 필요할 것으로 보입니다.
#file:main.py
#file:dataset_to_txt.py
CNN 데이터 병합 작업
cnn.csv
cnn_highlight.csv
수정이 필요한 모듈
#file:calculate_taaco_score.py
main.py
dataset_to_txt.py
taaco_score
calculate_taaco_score.py
bug
enhancement
help wanted
data processing
최종 스코어 계산할 때, 예를 들면 taaco의 가중치가 0.4면 cnn의 경우만 cnn과 cnn_highlight로 0.2식 나누어서 계산해야 될 듯. 자세한 내용은 회의 때.
문제 설명
현재 기계 평가의 단위는 전체 데이터셋이어야 하지만, 현재 코드에서는 서브 데이터셋 단위로만 텍스트 파일을 저장하고 있습니다.
서브 데이터셋의 목적은 모든 데이터를 대상으로 인간 평가를 진행할 수 없으므로, 일부 데이터를 선별하여 인간 평가를 수행하기 위함이었습니다.
하지만 이제 인간 평가가 완료되었으므로,
#file:main.py
를 수정하여 전체 데이터셋을 텍스트 파일로 저장하는 기능을 구현해야 합니다. 이 과정에서#file:dataset_to_txt.py
파일도 수정이 필요할 것으로 보입니다.추가 요청 사항
CNN 데이터 병합 작업
cnn.csv
와cnn_highlight.csv
파일의 데이터를 병합해야 합니다.수정이 필요한 모듈
#file:calculate_taaco_score.py
: 병합된 데이터 기반으로 최종 점수 계산을 구현해야 합니다.기대 결과
main.py
및dataset_to_txt.py
를 수정.taaco_score
를 올바르게 계산할 수 있도록 코드 수정.요청 사항
main.py
및dataset_to_txt.py
에서 전체 데이터셋을 텍스트 파일로 저장하는 기능 구현.calculate_taaco_score.py
수정.레이블
bug
enhancement
help wanted
data processing