brightmart / text_classification

all kinds of text classification models and more with deep learning
MIT License
7.83k stars 2.57k forks source link

您好!我想用自己的数据来训练TxtCNN的模型,请给我一些建议,谢谢 #104

Open li74531 opened 5 years ago

li74531 commented 5 years ago

你好! 我想用自己的数据来训TxtCNN的多标签的模型,除了按照要求的格式来替换sample_multiple_label.txt文件,还需要修改那些代码。我看到load_data里面用读的是h5格式的文件,是否只要替换成load sample_multiple_label.txt文件格式代码,另外load_data读出来的数据格式满足什么要求才能直接用您的代码做模型训练呢?

li74531 commented 5 years ago

还有如果我希望通过pre-processing生成h5格式的文件,如果已经有了和sample_multiple_label.txt格式一样的文件,需要做哪些修改,最终用来生成h5文件的数据,需要什么样的格式,才能保证训练程序能正确的执行呢?

yoonjae5 commented 5 years ago

我也在头疼这个问题,用自己的数据集我看了看data_untils的代码,改了改,但是验证集不知道怎么处理

qianc62 commented 4 years ago

同问,希望提供一下数据预处理的接口。

VVesley commented 3 years ago

我也希望有数据预处理的接口,谢谢