Closed yamamoto-yuta closed 4 years ago
タイトル:WaveNet: A Generative Model for Raw Audio 著者: Aaron van den Oord, Sander Dieleman, Heiga Zen, Karen Simonyan, Oriol Vinyals, Alex Graves, Nal Kalchbrenner, Andrew Senior, Koray Kavukcuoglu
arXiv投稿日: 2016/9/12 学会/ジャーナル:
畳み込む際に,入力値を一定の間隔でスキップして畳み込む
これにより,たった数層で非常に大きな受容野を持つことが可能になる
受容野:CNN のある層の一つのユニットを考えるとき,このユニットの出力に影響を及ぼし得る入力画像平面の領域(画素の集合)のことを,受容野(receptive field)と呼ぶ参考
0. 論文
タイトル:WaveNet: A Generative Model for Raw Audio
著者: Aaron van den Oord, Sander Dieleman, Heiga Zen, Karen Simonyan, Oriol Vinyals, Alex Graves, Nal Kalchbrenner, Andrew Senior, Koray Kavukcuoglu
arXiv投稿日: 2016/9/12 学会/ジャーナル:
1. どんなもの?
2. 先行研究と比べてどこがすごい?
3. 技術や手法のキモはどこ?
畳み込む際に,入力値を一定の間隔でスキップして畳み込む
これにより,たった数層で非常に大きな受容野を持つことが可能になる
受容野:CNN のある層の一つのユニットを考えるとき,このユニットの出力に影響を及ぼし得る入力画像平面の領域(画素の集合)のことを,受容野(receptive field)と呼ぶ参考
4. どうやって有効だと検証した?
5. 議論はある?
6. 次に読むべき論文は?
キーワード