ccmoony / Stanford-CS231n

Assignments of Stanford CS231n CV course.
10 stars 0 forks source link

关于assignment1 中的 svm.ipynb 第一个需要代码填空部分 的一些疑惑? #2

Open cheng-lao opened 1 month ago

cheng-lao commented 1 month ago

大佬好,我是最近在做cs231n的一些作业,对作业1有些疑惑。

作业1 是首先要计算一下 dW 矩阵,也就是使用svm作为损失函数 计算 权重的梯度。(对应到 cs231n\classifiers\linear_svm.py 文件的svm_loss_naive函数)

但是我之前在看note的时候 ,上面没有讲到 怎么求这个梯度,很奇怪,按理来说作业是照着 note 的巩固的,但是应该是我漏了哪些部分,所以才不明白怎么求梯度?

我还想请问一下,想做作业1 的时候大概要看到哪里才可以做? 我现在是正在看Optimizer 这部分。

ccmoony commented 1 month ago

求dW梯度的时候需要矩阵求导的相关知识,包括后面的assignment也都会用到。但是这一部分的知识在课程中确实没有介绍,可能是231n默认在前置的数学课程中已经学习过了。所以在做作业之前可以先学习一下矩阵求导的相关知识,就可以完成后续的assignment了。

cheng-lao commented 1 month ago

oook, 谢谢你🙏 @ccmoony

求dW梯度的时候需要矩阵求导的相关知识,包括后面的assignment也都会用到。但是这一部分的知识在课程中确实没有介绍,可能是231n默认在前置的数学课程中已经学习过了。所以在做作业之前可以先学习一下矩阵求导的相关知识,就可以完成后续的assignment了。