Closed goobdqwe closed 4 years ago
废话里面有一些是前半句的,单独分一类比较好,段尾有时候有句号重复的问题,还有就是tmp可以分段占用,整篇文章占用太大了,分段占用实现百万字文也是可能的,数据库的字符替换建议前面加个/,这样英文名言也能导入。我稍微改了一下,希望可以提供个参考。
changed.txt
废话里面有一些是前半句的,单独分一类比较好,段尾有时候有句号重复的问题,还有就是tmp可以分段占用,整篇文章占用太大了,分段占用实现百万字文也是可能的,数据库的字符替换建议前面加个/,这样英文名言也能导入。我稍微改了一下,希望可以提供个参考。
changed.txt