Open rentainhe opened 3 years ago
假设目前有一个二分类问题,有十个点,我们为这十个点分配红色和绿色的标签 我们现在分类的问题转换为:给一个值,预测其为红色或者绿色
这个条形图表示,每个点与自己真实类别对应的概率
负对数是因为0到1之间的Log为负,我们需要再取一次负,才能得到一个正值的Loss
我们最终得到的Loss如下,其中可以看到与真实标签越接近,Loss越小
参考
问题假设
假设目前有一个二分类问题,有十个点,我们为这十个点分配红色和绿色的标签 我们现在分类的问题转换为:给一个值,预测其为红色或者绿色
损失函数:Binary Cross-Entropy / Log Loss
可视化Loss
根据正负样本,分开所有点
根据样本,拟合一条Logistic Regression回归曲线来进行二分类
对于所有正类,我们分类器给出的预测概率为(相当于模型输出)
对于所有负类,我们分类器给出的预测概率为(相当于模型输出)
放在一起得到的结果如下
这个条形图表示,每个点与自己真实类别对应的概率
使用二值交叉熵/对数损失来评估这个性能(相当于求损失函数)
此时采用预测出为真实值的概率的负对数很合适
负对数是因为0到1之间的Log为负,我们需要再取一次负,才能得到一个正值的Loss
我们最终得到的Loss如下,其中可以看到与真实标签越接近,Loss越小