jeongukjae / tfds-korean

A collection of Korean Text Datasets ready to use using Tensorflow-Datasets.
https://jeongukjae.github.io/tfds-korean/
Apache License 2.0
20 stars 3 forks source link

현재 wikitext의 문제점을 카탈로그에 적어두기 #19

Closed jeongukjae closed 3 years ago

jeongukjae commented 3 years ago

https://github.com/jeongukjae/tfds-korean/issues/12#issuecomment-826358469

위와 같은 이유로 "필터를 해서 사용해라" 혹은 "중간에 빈 example이 있다" 정도는 적어두는 편이 좋은 듯