whgaara / pytorch-soft-masked-bert

86 stars 22 forks source link

关于BiGRU的输入格式 #4

Open yaoleihxr opened 3 years ago

yaoleihxr commented 3 years ago

您好,关于BiGRU部分的数据格式有点疑惑,查了文档torch中GRU的input和output应该是 (seq_len, batch, input_size)的形式,但是代码中在处理这部分时是直接按 (batch, seq_len,input_size)来输入的,请问这样不会导致网络结构的错误么?

whgaara commented 3 years ago
font{
    line-height: 1.6;
}
ul,ol{
    padding-left: 20px;
    list-style-position: inside;
}

你好,非常感谢您认真的阅读,我在收到您的邮件后也抽空仔细确认过这件事。RNN计算单元具备“需要严格按照序列顺序计算”的特殊性,因此这里应该是需要转换成(seq_len, batch, input_size)的形式才符合GRU的计算逻辑。我会尽快对此进行修改,再次对您的宝贵建议表示感谢!

                            695509060

                                695509060@qq.com

    签名由
    网易邮箱大师
    定制

在2020年11月23日 17:28,yaoleihxr<notifications@github.com> 写道: 

您好,关于BiGRU部分的数据格式有点疑惑,查了文档torch中GRU的input和output应该是 (seq_len, batch, input_size)的形式,但是代码中在处理这部分时是直接按 (batch, seq_len,input_size)来输入的,请问这样不会导致网络结构的错误么?

—You are receiving this because you are subscribed to this thread.Reply to this email directly, view it on GitHub, or unsubscribe.