【第2章模型评估与选择】待推导或待解析公式征集+答疑专区

datawhalechina / pumpkin-book

《机器学习》（西瓜书）公式详解

Other

23.8k stars 4.74k forks source link

【第2章模型评估与选择】待推导或待解析公式征集+答疑专区 #61

Closed Sm1les closed 3 months ago

Sm1les commented 5 years ago

在这里，你可以： 1.评论留下西瓜书第2章你觉得需要补充推导细节或者解析的公式编号，我们看到后会尽快进行补充； 2.评论留下你对南瓜书第2章里相关内容的疑问，我们看到后会尽快进行答疑。

Harvestning commented 3 years ago

@Sm1les 胖虎你好，我想问一个附录里的问题，文中这么一段话“对于此方程，通常不一定正好解得一个整数C使得方程成立，”请问下面一行的公式是什么含义啊（我自己还是了解一些假设检验的）

Sm1les commented 3 years ago

@Harvestning 同学你好，你看的应该是pdf版吧？我刚核对了一下， pdf里面的那个公式在第一个alpha后面少一个换行，近期我们会更新一下pdf，你可以先看实时更新的在线版本：https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ，谢谢你的反馈 :)

Harvestning commented 3 years ago

@Harvestning 同学你好，你看的应该是pdf版吧？我刚核对了一下， pdf里面的那个公式在第一个alpha后面少一个换行，近期我们会更新一下pdf，你可以先看实时更新的在线版本：https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ，谢谢你的反馈 :)

不客气，嘿嘿......

Harvestning commented 3 years ago

@Sm1les 您好，有个问题请求帮助。公式2.34上面(k+1)/2和(k^2-1)/12N是怎么来的呀？

haokong2048 commented 3 years ago

ROC曲线出现蓝色线段的原因，是有一个真正例和一个假正例等于取定的阈值，是这样吗？

Sm1les commented 3 years ago

@haokong2048 是的

ghost commented 3 years ago

在2.41的偏差方-方差分解的公式中，请问这里使用的期望泛化误差E(f;D)是否就等于训练误差（经验误差）的期望？因为泛化误差衡量的是模型在除开拿到的数据集之外，没见过的数据上的表现，但这里y_D只是拿到的数据集D里的标记，并不能代表全部的样本，(f(x;D)-y_D)^2是模型的训练误差。如果是的话，可不可以理解成因为现实情况中收集到全部数据样本是很罕见的，比如通过预测人的身高预测体重，不可能去收集全球几十亿人的信息，所以在计算的时候就通过在局部数据上的训练误差来近似代表在全局数据上的泛化误差？