Open guocxian opened 11 months ago
数据集的问题吧,质量太差了,你自己再筛选一下,看看是不是特征太不明显。 我用的也是长文本,100-800都有,并且中英文混杂,最起码在测试集上效果还是可以的 precision recall f1-score support
3c-hardware 0.9207 0.9457 0.9331 479 cloud 1.0000 0.9703 0.9849 538 algo 0.9919 0.9871 0.9895 4866 ai 0.9375 0.9629 0.9500 997
accuracy 0.9794 6880
macro avg 0.9625 0.9665 0.9644 6880 weighted avg 0.9797 0.9794 0.9795 6880
换成自己的数据,300左右的文字,但是效果很差,为什么呢