Closed nrnrk closed 2 months ago
コメントをいただきありがとうございます。 式2.16から $\mathbf{o}_i^{(m)}$ は $\mathbf{v}_j^{(m)}$ を足し合わせて得られます。また、式2.13から $\mathbf{v}_j^{(m)}$ は、 $\mathbf{h}_i$ に $\mathbf{W}_v^{(m)} \in \mathbb{R}^{(D/M) \times D}$ をかけることで計算されるため、 $D/M$ 次元です。このため $\mathbf{o}_i^{(m)}$ は $D/M$ 次元となり、このベクトルを $M$ 個連結したベクトルは $D$ 次元となるため、 $\mathbf{W}_o$は、 $D\times D$ 次元です。 紛らわしい説明となり恐縮ですが、よろしくお願いいたします。
ありがとうございます。私の勘違いだったようです。説明いただきありがとうございました。よくわかりました 🙇
概要
2.2.4 の 式(2.17) の $W_o$ の次元は $D \times D$ でなく $D \times MD$ が正しいのではないでしょうか? $\left[ \right]$ の記法は厳密には定義されていないですが、 $M$ 個の $D$ 次元ベクトル $o_i^{(j)}$ を縦に並べるものとすると、 $W_o$ は $MD$ 次元のベクトルを $D$ 次元のベクトルにマッピングする行列になるので $D \times MD$ 次元であるのではないかと思いました。
版情報
Kindle 版で読んでいます。巻末に下記の記載がありました。
電子版発行日: 2023年7月29日 初版 第1刷発行 電子版更新日: 2023年8月1日 初版 第2刷発行