jazzsaxmafia / show_attend_and_tell.tensorflow

BSD 2-Clause "Simplified" License
506 stars 191 forks source link

lstm 관련 #8

Open shmsw25 opened 8 years ago

shmsw25 commented 8 years ago

안녕하세요. 사소한 것이기는 하지만 lstm 부분에서 혹시 123줄에 h = o * tf.nn.tanh(new_c)가 아니라 h = o * tf.nn.tanh(c) 여야 하지 않나 해서 이슈를 남겨봅니다.

그리고 이건 제가 이해를 제대로 못한건지 모르겠는데... build_model과 build_generator에서 lstm 각 step에서 context_encode를 계속 더해나가는게 맞는건가요? for문 바깥에서 정의한 context_encode만 더하는게 아니라 각 for문의 step에서 계속 더하는게 맞는지.. 제가 이해하기론 for문 바깥에서 정의한 context_encode를 각 스텝에서 더하는 것이었는데, 확실하지가 않아서 이렇게 질문을 남겨봅니다.

감사합니다!

jazzsaxmafia commented 8 years ago

안녕하세요? 지금 확인해보니 h = o * tf.nn.tanh(c)가 맞습니다. context encoder도 말씀하신 것처럼 for 같은 변수에 여러번 값이 더해지고 있었네요. Attention visualization이 잘 안되는 이유가 여기에 있었네요 ㅠㅠ

버그를 발견해 주셔서 정말 감사합니다. -김택수