yhcc / CNN_Nested_NER

105 stars 7 forks source link

损失函数问题咨询 #23

Open wuxiaohui0 opened 5 months ago

wuxiaohui0 commented 5 months ago

为什么要基于sigmoid函数和给定的0.5阈值进行预测呢,这个多分类任务不应该是基于softmax吗?因为有个数据集存在一个span同时属于了两个entity类别,索性就都用了sigmoid。如果我们处理的是特定的领域的都是平面实体,我们使用softmax的话,我们还用对代码中decode里面的内容进行修改吗

yhcc commented 4 months ago

使用softmax的话,需要改的,因为相当于判断这个地方是不是实体的方式会改变。

houyuchao commented 3 months ago

使用softmax的话,需要改的,因为相当于判断这个地方是不是实体的方式会改变。

您好我还想问一下问什么损失函数要用二元交叉熵?这不是一个多分类问题吗?不应该是交叉熵损失函数吗

houyuchao commented 3 months ago

为什么要基于sigmoid函数和给定的0.5阈值进行预测呢,这个多分类任务不应该是基于softmax吗?因为有个数据集存在一个span同时属于了两个entity类别,索性就都用了sigmoid。如果我们处理的是特定的领域的都是平面实体,我们使用softmax的话,我们还用对代码中decode里面的内容进行修改吗

您好请问,sigmod在程序里的哪里呢?我只看到了论文中R+R''得分的位置,实在linear中使用了sigmoid吗?我也没找到啊?求解 image