Closed zhkzly closed 2 months ago
作者您好,我花了一些时间去阅读代码,想要了解具体的实现。但是当前我有一个疑问,在urbangpt/model/STLlama.py/STLlama.py中LLMs文本预测损失那里,似乎没有忽略IGNORE_INDEX,我没有看懂,想知道是否在某些位置处理了,或者我理解错了。十分感谢您。
您好,感谢您的关注。IGNORE_INDEX在vicuna/llama原本实现中会忽略的这部分loss的计算。
了解了,十分感谢!
作者您好,我花了一些时间去阅读代码,想要了解具体的实现。但是当前我有一个疑问,在urbangpt/model/STLlama.py/STLlama.py中LLMs文本预测损失那里,似乎没有忽略IGNORE_INDEX,我没有看懂,想知道是否在某些位置处理了,或者我理解错了。十分感谢您。