Open Ninekrad opened 6 years ago
Batch size를 Softmax 내부에서 고려한다는 것의 의미를 정확하게 이해하지 못하겠습니다.
Write code의 내부만 작성하여 나온 결과는 다음과 같습니다.
Twolayer와 Threelayer의 차이가 별로 없는지라, 주어진 조건에서의 예시 graph와 수행시간을 혹시 알려주실수 있는지 궁금합니다.(한번 돌리는데 분단위로 걸리는 것이 코드의 문제인지, 장비의 문제인지 확인하고 싶어서 그러합니다.)
input의 dimension이 (D,)가 아니라 (N, D)이니 N을 고려하라는 의미입니다.
제 환경에서는 Twolayer에서 epoch 한 번에 20초정도 걸립니다. 디버깅하는 단계에서는 X_tr을 [:1000]정도로 줄여서 하시는걸 추천합니다. 그래프 공개는 고려해보겠습니다.
감사합니다 :)
Batch size를 Softmax 내부에서 고려한다는 것의 의미를 정확하게 이해하지 못하겠습니다.
Write code의 내부만 작성하여 나온 결과는 다음과 같습니다.
Twolayer와 Threelayer의 차이가 별로 없는지라, 주어진 조건에서의 예시 graph와 수행시간을 혹시 알려주실수 있는지 궁금합니다.(한번 돌리는데 분단위로 걸리는 것이 코드의 문제인지, 장비의 문제인지 확인하고 싶어서 그러합니다.)