zepingyu0512 / srnn

sliced-rnn
470 stars 104 forks source link

您好,不知道能否请教下论文问题 #14

Open Canadalynx opened 5 years ago

Canadalynx commented 5 years ago

您好,我是一个刚入坑深度学习的新人,如果问得比较脑残请见谅。看了下模型的框架图有些不明白它的输出,传统RNN可以m对m或者m对1输出。这个SRNN是不是只能m对n(m>n)和m对1输出啊?因为看图第一层8个输入,第二层就取了h2,4,6,8,到顶层就1个输出了。请问是不是只能用来做分类或者问一个长串问题回答就两个字那种?如果想回答很多个字就不行?不知大佬能否解答一下,先谢谢了。

zepingyu0512 commented 5 years ago

这篇论文的结构是可以解决分类问题的,如果是像翻译等sequence to sequence模型(m->n)也可以,把srnn当作encoder,decoder从encoder的向量里面解就可以了。之前也有其它人用srnn做了text generation,github应该可以搜到。如果是像分词、命名实体识别等structure learning的问题(m->m),图中的结构应该是不能的,但也是有办法解决的,可以参考wavenet的结构:https://deepmind.com/blog/wavenet-generative-model-raw-audio/

Canadalynx commented 5 years ago

这么快就回复了!真的非常感谢!