lss-1138 / SegRNN

The official repository of the SegRNN paper: "Segment Recurrent Neural Network for Long-Term Time Series Forecasting." This work is developed by the Lab of Professor Weiwei Lin (linww@scut.edu.cn), South China University of Technology; Peng Cheng Laboratory.
Apache License 2.0
84 stars 15 forks source link

问题求教! #10

Open hbwzj opened 1 month ago

hbwzj commented 1 month ago

这篇文章我记得开始的时候以l1为loss的,后面为什么要改以l2即mse为loss了?

lss-1138 commented 1 month ago

没改,目前默认还是以L1为loss的。只不过后面有读者问SegRNN在Lookback96和常用的L2 loss情况下的表现,所以我增加了这部分的内容(scripts/SegRNN/Lookback_96)。原来的脚本还是以mae为loss的(scripts/SegRNN)。

hbwzj commented 1 month ago

请问,您觉得用这两个损失感觉那个好点?如果要发论文对比需要将对比模型也用l1loss吗?

lss-1138 commented 1 month ago

两个损失感觉那个好点?

个人拙见,需要分情况来看:

  1. 周期性较弱、value抖动幅度较小、异常点较少 的数据集,MAE好点。
  2. 周期性较强、value抖动幅度较大、异常点较多 的数据集,MSE好点。 前者对应ETT、Weather这种数据集,后者对应Traffic这种数据集。 相对来说,可能第一种情况比较常见,所以MAE会好一点。不过大家主流用的都是MSE,所以从发论文的角度还是用MSE吧,免得审稿人质疑。

如果要发论文对比需要将对比模型也用l1loss吗?

最好是要的。不过实在没有也行,只要补充对loss的消融实验,能证明你的提升和优势不是损失函数带来的,而是你的其他模块的设计。

hbwzj commented 1 month ago

两个损失感觉那个好点?

个人拙见,需要分情况来看:

  1. 周期性较弱、value抖动幅度较小、异常点较少 的数据集,MAE好点。
  2. 周期性较强、value抖动幅度较大、异常点较多 的数据集,MSE好点。 前者对应ETT、Weather这种数据集,后者对应Traffic这种数据集。 相对来说,可能第一种情况比较常见,所以MAE会好一点。不过大家主流用的都是MSE,所以从发论文的角度还是用MSE吧,免得审稿人质疑。

如果要发论文对比需要将对比模型也用l1loss吗?

最好是要的。不过实在没有也行,只要补充对loss的消融实验,能证明你的提升和优势不是损失函数带来的,而是你的其他模块的设计。

非常感谢您的解答