datawhalechina / pumpkin-book

《机器学习》(西瓜书)公式详解
Other
23.79k stars 4.74k forks source link

【第2章模型评估与选择】待推导或待解析公式征集+答疑专区 #61

Closed Sm1les closed 3 months ago

Sm1les commented 5 years ago

在这里,你可以: 1.评论留下西瓜书第2章你觉得需要补充推导细节或者解析的公式编号,我们看到后会尽快进行补充; 2.评论留下你对南瓜书第2章里相关内容的疑问,我们看到后会尽快进行答疑。

johnmaster commented 5 years ago

可以整理一下西瓜书的课后习题嘛?

Sm1les commented 5 years ago

@johnmaster 这个有在我们的计划当中,后期会整理进去:)

johnmaster commented 5 years ago

@Sm1les 第二章公式2.27这块希望能解释一下。

Sm1les commented 5 years ago

@johnmaster 好的,我们尽快补充上去 :)

Sm1les commented 5 years ago

@johnmaster 同学你好,公式2.27的推导已经补充上去了,请查阅 :)

johnmaster commented 5 years ago

@Sm1les 谢谢你 ^_^

LZL-CS commented 4 years ago

请问公式2.21中的描述“任何一条线段所对应的样例的预测值一定小于其左边和下边的线段所对应的样例的预测值,其中蓝色线段所对应的a+b个样例的预测值相等”可以解释一下具体含义吗?

Sm1les commented 4 years ago

@William-LZL 这个你看一下西瓜书34页图2.4下面的那一段话应该就能懂了

LZL-CS commented 4 years ago

@William-LZL 这个你看一下西瓜书34页图2.4下面的那一段话应该就能懂了

好的,谢谢

FuGang-cmd commented 4 years ago

@William-LZL 这个你看一下西瓜书34页图2.4下面的那一段话应该就能懂了 能解释下吗 还是不大明白

FuGang-cmd commented 4 years ago

@William-LZL 这个你看一下西瓜书34页图2.4下面的那一段话应该就能懂了 能解释下吗 还是不大明白

为什么小呢

Sm1les commented 4 years ago

@FuGang-cmd 那你看看这篇文章里面讲的ROC曲线画法能否看懂:https://www.cnblogs.com/dlml/p/4403482.html

LZL-CS commented 4 years ago

您好,请问公式2.41中,为什么考虑到噪声不依赖于f后,中间的公式就直接为0了??

Sm1les commented 4 years ago

@William-LZL 同学你好,2.41那个公式的推导中间有很多小细节,我后续抽空会给补充上来,你暂时先往后面 :)

LZL-CS commented 4 years ago

好的呢,谢谢你哈😀 2019年10月22日 +0100 11:05 :)s notifications@github.com,写道:

@William-LZL 同学你好,2.41那个公式的推导中间有很多小细节,我后续抽空会给补充上来,你暂时先往后面 :) — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

msterdb commented 4 years ago

2.41最后2步,为什么E[(f拔-y)^2] 变成了 (f拔-y)^2

Sm1les commented 4 years ago

@William-LZL @msterdb 同学你好,公式2.41的推导我已经补充上去了,请查阅 :)

yuruotong1 commented 4 years ago

请问,第二章,书中p29页的2.2公式,为什么没有Pi,即选中Xi的机率

Sm1les commented 4 years ago

@yuruotong1 同学你好,公式2.2算的是均方误差,不是在算期望值,所以也就不需要考虑选中x_i的概率。

yuruotong1 commented 4 years ago

@Sm1les 我懂了,回答的真及时,赞

yuruotong1 commented 4 years ago

请问,第二章,书中p32页的2.11公式,加权调和平均是怎么来的,为什么会有两个beta,按我自己理解,有一个beta足够表明查准率和查全率的偏好,还有,为什么是平方?

Sm1les commented 4 years ago

@yuruotong1 同学你好,你这就刁难到我胖虎了,我觉得这个就当定义来理解就好了 :)

hehuakun commented 4 years ago

请问一下,能解释一下PR曲线是如何绘制出来的吗?

Sm1les commented 4 years ago

@hehuakun 这是我前面给另一位同学发的ROC曲线画法:https://www.cnblogs.com/dlml/p/4403482.html,PR曲线思路一致

gitwbc commented 4 years ago

请问公式2.21中的描述“任何一条线段所对应的样例的预测值一定小于其左边和下边的线段所对应的样例的预测值,其中蓝色线段所对应的a+b个样例的预测值相等”可以解释一下具体含义吗?

有同样的疑问,能解答一下吗?

gitwbc commented 4 years ago

有关公式2.21的图,图中有蓝色线段,但是按西瓜书上的说法,一条线段或者平行于横轴(假正例),或者平行于纵轴(真正例),不可能出现蓝色线段的情况。

Sm1les commented 4 years ago

@gitwbc 同学你好,书上确实是没说这种情况,但是实际应用场景中确实存在这种情况,而且公式2.21也是有考虑到这种情形,所以我们才对公式2.21进行了解析。

PASSENGER128 commented 4 years ago

请问一下,能解释一下公式2.32是怎么推导出来的,不应该还有根号k吗?

Sm1les commented 4 years ago

@PASSENGER128 好的,这个公式我们补充完后会艾特你 :)

PASSENGER128 commented 4 years ago

请问公式2.34是怎么推导出来的,还有它的均值和方差为什么是(k + 1) / 2与(k^2 - 1)/ 12N 呢

Sm1les commented 4 years ago

@PASSENGER128 好的,已加入todolist

MooreAndMoore commented 4 years ago

请问公式2.33是怎么推导出来的呢?没太看懂

Sm1les commented 4 years ago

@MooreAndMoore 好的,我暂时先加入todolist,不过建议这些假设检验的公式在入门阶段不必深究,重点从第3章开始看 :)

XiaodanPan commented 4 years ago

@johnmaster 同学你好,公式2.27的推导已经补充上去了,请查阅 :)

公式2.27还是有些疑惑,最后推导出来的表达式和勘误后的式子不一样啊?

Sm1les commented 4 years ago

@XiaodanPan 同学你好,能截图说明一下哪里不一样吗?

XiaodanPan commented 4 years ago

在推导的结果中\epsilion和\epsilion_0的位置和原式子中的位置互换了一下。

--

XiaodanPan

在 2020-05-23 17:11:17,":)s" notifications@github.com 写道:

@XiaodanPan 同学你好,能截图说明一下哪里不一样吗?

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

Sm1les commented 4 years ago

@XiaodanPan 我勘误修正后的式子也互换了呀

XiaodanPan commented 4 years ago

看到了,感谢!

在 2020-05-23 18:44:39,":)s" notifications@github.com 写道:

@XiaodanPan 我勘误修正后的式子也互换了呀

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

XiaodanPan commented 4 years ago

不好意思 打扰了

在 2020-05-23 18:44:39,":)s" notifications@github.com 写道:

@XiaodanPan 我勘误修正后的式子也互换了呀

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

wanbachenxiao1992 commented 4 years ago

能否推导一下式2.26求偏导的过程

Sm1les commented 4 years ago

@wanbachenxiao1992 书里有这一步吗?

wanbachenxiao1992 commented 4 years ago

@wanbachenxiao1992 书里有这一步吗?

书里有,是为了证明符合二项分布,我已经推导了一下~感谢。

Sm1les commented 4 years ago

@wanbachenxiao1992 奥奥,看到了,在公式下方的小字里面,推导出来了就好~

JIANFANGLIU commented 4 years ago

为什么P-R曲线会有R=1,P=0或者R=0,P=1的情况出现

Sm1les commented 4 years ago

@JIANFANGLIU 为啥不能有这种情况出现呢?

Harvestning commented 3 years ago

@Sm1les 你好,我认为PumpkinBook在解释公式2.20时绘制的8个测试样本的ROC曲线的坐标轴数学符号不太准确,与书本P34最后一段的描述不相符。

Sm1les commented 3 years ago

@Harvestning 同学你好,之前的图确实画得确实有问题,前天我已修订了一版,你可以在repo里面的markdwon文档看到最新版 :)

Harvestning commented 3 years ago

@Harvestning 同学你好,之前的图确实画得确实有问题,前天我已修订了一版,你可以在repo里面的markdwon文档看到最新版 :)

我没有找到,不知道是不是打不开[捂脸]

Sm1les commented 3 years ago

@Harvestning 这是在线阅读的地址:https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ,我刚剪裁了一下图片,你看能看到吗?

Harvestning commented 3 years ago

@Harvestning 这是在线阅读的地址:https://datawhalechina.github.io/pumpkin-book/#/chapter2/chapter2 ,我刚剪裁了一下图片,你看能看到吗? 我的仍然看不到,可能是浏览器的问题,不知道其他的伙伴,没有关系,暂时这样吧