PaddlePaddle / PaddleHub

Awesome pre-trained models toolkit based on PaddlePaddle. (400+ models including Image, Text, Audio, Video and Cross-Modal with Easy Inference & Serving)【安全加固,暂停交互,请耐心等待】
https://www.paddlepaddle.org.cn/hub
Apache License 2.0
12.72k stars 2.08k forks source link

bert文本分类评估指标问题 #1475

Open mengjing12332 opened 3 years ago

mengjing12332 commented 3 years ago

欢迎您对PaddleHub提出建议,非常感谢您对PaddleHub的贡献! 在留下您的建议时,辛苦您同步提供如下信息:

KPatr1ck commented 3 years ago

你好,目前bert-wwm模型的文本分类任务的评估指标是acc,如果需要修改的话,需要自行修改module里的评价指标。

https://github.com/PaddlePaddle/PaddleHub/blob/933284b048b115efab2420519f9bc8010546272a/modules/text/language_model/chinese_bert_wwm/module.py#L114-L122

上面116行的probs可以获取样本的软标签,119-120行可以自行更改为想要的指标,计算后在121以dict形式返回。

wj-Mcat commented 3 years ago

@KPatr1ck 可是仅仅是Acc的指标对于真实场景下的应用往往不太够,我建议给出对应的混淆矩阵,这样acc/precision/recall/f1score都可以计算出来。

如果你们觉得需要的话,我可以来update这个feature。