关于lora_b矩阵的更新问题

cmnfriend / O-LoRA

MIT License

148 stars 18 forks source link

关于lora_b矩阵的更新问题 #30

Open bw-wang19 opened 4 months ago

bw-wang19 commented 4 months ago

作者您好，我想请教一下关于工作里面lora_b矩阵更新的问题。论文里只写了它也是由lora_a张成的子空间中的向量构成，但是在训练过程中是如何保证这一点并更新加权系数的呢？我在代码中只找到了这样的片段，没看明白具体是如何完成要求的

cmnfriend commented 3 months ago

可以看看uie_trainer里的正则化项？

bw-wang19 commented 3 months ago

一共是两项，第一项是论文里面提到保持> $A_i \ i\in[1,t-1]$与> $A_t$正交的项，第二项是限制了> $A_t,B_t$大小的项，但这个只能保证不要让loranew_a/b太大吧？而且A的列向量是d维，但是B中向量是k维吧，一个K维向量是怎么由几个d维向量加权得到的，这个我也没搞懂。

cmnfriend commented 3 months ago

一个新的任务的参数变化计算方式：C=AB，C的列向量可由A的列向量线性表示，C的列向量张成的空间是A的列向量张成空间的子空间，所以我们希望在优化时能让新的lora参数A’和旧的参数A正交（内积=0->每个列向量都正交->正交），这样使得新的参数C'与旧的参数C也正交，使得两个任务的参数变化发生在不同的空间里

bw-wang19 commented 3 months ago

哦哦我明白了，我理解错了，万分感谢！