zhouhaoyi / Informer2020

The GitHub repository for the paper "Informer" accepted by AAAI 2021.
Apache License 2.0
5.27k stars 1.1k forks source link

关于data_loader中的__read_data__函数 #554

Open leoyinhaiqing opened 1 year ago

leoyinhaiqing commented 1 year ago

if self.features=='M' or self.features=='MS': cols_data = df_raw.columns[1:] df_data = df_raw[cols_data]

这里为什么让cols_data = df_raw.columns[1:]?这样的话不是把target也放到features里面了嘛?

数据进入模型之前计算出的 batch_x, batch_y, batch_x_mark, batch_y_mark这四个变量,batch_x中确实是包括了target,不知道后续的模型内部计算时是不是使用某种方法把batch_x的最后一列target给去掉了?

这个地方有些看不懂,期待解惑

leoyinhaiqing commented 1 year ago

更新:

target确实进入了batch_x,但其实是上一条的target,作为feature的一部分共同预测下一个target,这个地方的target如果是未来5日收益率这种时间序列相关的指标,那必然会暴露一部分未来数据

xiaolve commented 1 month ago

确实如此,所以你放弃了吗?还是改了代码?

leoyinhaiqing commented 1 month ago

确实如此,所以你放弃了吗?还是改了代码?

改动了代码,将target删掉,再新写代码单独计算target传送到model里进行训练

xiaolve commented 1 month ago

确实如此,所以你放弃了吗?还是改了代码?

改动了代码,将target删掉,再新写代码单独计算target传送到model里进行训练

6阿,能否请教一下代码该如何改呢?我一直疑惑transformer架构的,是运用于seq2seq,每次结果都是一个字一个字出来,似乎不能剥离target

leoyinhaiqing commented 1 month ago

把target换成不带未来信息的收益率就行了,但我实测效果相当一般

xiaolve commented 1 month ago

谢谢,可能架构不合适吧。我看了代码似乎没法改。我的实测效果也不好

leoyinhaiqing commented 1 month ago

我了解到的用这个框架预测收益率的似乎没有哪个说效果好的,可能就是不合适而已