datawhalechina / pumpkin-book

《机器学习》(西瓜书)公式详解
Other
23.8k stars 4.74k forks source link

【第2章模型评估与选择】待推导或待解析公式征集+答疑专区 #61

Closed Sm1les closed 3 months ago

Sm1les commented 5 years ago

在这里,你可以: 1.评论留下西瓜书第2章你觉得需要补充推导细节或者解析的公式编号,我们看到后会尽快进行补充; 2.评论留下你对南瓜书第2章里相关内容的疑问,我们看到后会尽快进行答疑。

Harvestning commented 3 years ago

@Sm1les 胖虎你好,我想问一个附录里的问题,文中这么一段话“对于此方程,通常不一定正好解得一个整数C使得方程成立,”请问下面一行的公式是什么含义啊(我自己还是了解一些假设检验的)

Sm1les commented 3 years ago

@Harvestning 同学你好,你看的应该是pdf版吧?我刚核对了一下, pdf里面的那个公式在第一个alpha后面少一个换行,近期我们会更新一下pdf,你可以先看实时更新的在线版本:https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ,谢谢你的反馈 :)

Harvestning commented 3 years ago

@Harvestning 同学你好,你看的应该是pdf版吧?我刚核对了一下, pdf里面的那个公式在第一个alpha后面少一个换行,近期我们会更新一下pdf,你可以先看实时更新的在线版本:https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ,谢谢你的反馈 :)

不客气,嘿嘿......

Harvestning commented 3 years ago

@Sm1les 您好,有个问题请求帮助。公式2.34上面(k+1)/2和(k^2-1)/12N是怎么来的呀?

haokong2048 commented 3 years ago

ROC曲线出现蓝色线段的原因,是有一个真正例和一个假正例等于取定的阈值,是这样吗?

Sm1les commented 3 years ago

@haokong2048 是的

ghost commented 3 years ago

在2.41的偏差方-方差分解的公式中,请问这里使用的期望泛化误差E(f;D)是否就等于训练误差(经验误差)的期望?因为泛化误差衡量的是模型在除开拿到的数据集之外,没见过的数据上的表现,但这里y_D只是拿到的数据集D里的标记,并不能代表全部的样本,(f(x;D)-y_D)^2是模型的训练误差。如果是的话,可不可以理解成因为现实情况中收集到全部数据样本是很罕见的,比如通过预测人的身高预测体重,不可能去收集全球几十亿人的信息,所以在计算的时候就通过在局部数据上的训练误差来近似代表在全局数据上的泛化误差?

bluesun98 commented 2 years ago

您好,想请问一下为什么5×2折交叉验证(2.32式那里)可以缓解测试错误率的非独立性呢

Aikoin commented 2 years ago

您好^^!想请教一下,书中“机器学习问题通常是NP难甚至更难,而学习算法必然是在多项式时间内运行完成,若可彻底避免过拟合,意味着证明了P=NP....”这段有些疑惑,用P时间算法解决NP难问题,为什么会说是解决了过拟合呢?为什么不是欠拟合呢?

Aikoin commented 2 years ago

您好!请问图2.5代价曲线与期望总体代价,为什么说“所有线段下界围成的面积即为在所有条件下学习器的期望总体代价”呢?

Aikoin commented 2 years ago

您好!请问图2.5代价曲线与期望总体代价,为什么说“所有线段下界围成的面积即为在所有条件下学习器的期望总体代价”呢?

我好像知道啦,为了怕以后有同学有同样的疑问就不删除了,自己回复一下:取下界就是取当前条件下的最优(总代价最小的分类策略),那么取所有线段下界就是对所有不同的条件都取最优,围成的面积其实就是一个所有条件下最优的期望代价,每个分段其实是对应了不同的分类策略(阈值的选择?),而不是同一个分类策略在不同正例概率(代价)下的期望。 (如果有误请大家指正!谢谢^^!)

Aikoin commented 2 years ago

您好 希望能补充一下2.30 查了t分布和卡方分布还是不太懂为什么这个变量服从t分布 TT

Aikoin commented 2 years ago

您好 希望能补充一下2.30 查了t分布和卡方分布还是不太懂为什么这个变量服从t分布 TT

我会啦