Open swy0915 opened 4 years ago
Synthetic_Chinese_String_Dataset的数据集是用什么代码生成的数据,作者能分享下代码吗,我猜测是SynthText_Chinese_version的那个代码,但是不知道作者有没有修改过
还是说SynthText_Chinese_version的代码只是简单的换了生成的语料?
我有点奇怪,这个数据集有360W+的数量,其标签文件中的内容是字符转换成的编码。。我怎么知道每个编码数字对应的文字呢??求指点
标签文件里面比如后面有个编码数字是29,就代表这个字在txt索引文件里面的第30行
Synthetic_Chinese_String_Dataset的数据集是用什么代码生成的数据,作者能分享下代码吗,我猜测是SynthText_Chinese_version的那个代码,但是不知道作者有没有修改过