关于代码的几点疑问

thuml / Autoformer

About Code release for "Autoformer: Decomposition Transformers with Auto-Correlation for Long-Term Series Forecasting" (NeurIPS 2021), https://arxiv.org/abs/2106.13008

MIT License

2k stars 429 forks source link

@wuhaixu2016 作者你好，我再拜读了您的论文和代码之后，产生了几点疑问。

我看您设置了随机数种子确保结果可以复现，但是为什么没有设置torch.cuda.manual_seed呢？
在划分数据集的时候减去seq_len，是为了保证拥有num_vali和num_test长度的数据来计算loss吗？
在Transformer_EncDec.py line12，downConv的padding为什么不是1而是2呢？
autocorrelation是不需要掩码是吗？虽然设置了参数，但是没有掩码操作。
在decoder部分，为什么是直接对趋势项相加，然后作用一个projection。这和论文叙述的不太一样，是为了减少参数量设计的吗？并且我不太理解为什么projection的kernel_size=3,这和之前FFN层设计的conv不太一样，为什么要这样做呢？
我看您在Autoformer_EncDec中保留了informer的conv_layer的设计，请问您有尝试过加上conv_layer效果会变好吗？

thuml / Autoformer

关于代码的几点疑问 #189