jeongukjae / tfds-korean

A collection of Korean Text Datasets ready to use using Tensorflow-Datasets.
https://jeongukjae.github.io/tfds-korean/
Apache License 2.0
20 stars 3 forks source link

[Dataset Request] 세종코퍼스 #22

Open jeongukjae opened 3 years ago

jeongukjae commented 3 years ago

Dataset Information

Additional Context

세종 코퍼스: https://ithub.korean.go.kr/user/total/database/corpusManager.do 세종 코퍼스 - 병렬: https://ithub.korean.go.kr/user/total/database/etcManager.do

라이선스가 상업적 이용이 어렵더라도 이용하기에 좋은 말뭉치라 생각해서 일단은 추가하는 게 좋을 것 같아요.