Feedforward Implementation

celsofranssa commented 5 years ago

@flaviovdf ao implementar o método feedforward da classe PerceptronLayer percebi que o shape de prev_a é (100, 784). Mas não deveria ser um vetor coluna, ao invés de uma matriz?

Pela definição, $z^l=w^la^{l-1}+b^{l}$ onde, $w^l$ é a matriz de pesos da camada l, $a^{l-1}$ é o vetor coluna de ativações da camada anterior. Lembrando que $a^{0}$ é o vetor de features $\bold{X} = (x_1, x_2, ... x_n)$ .

Obrigado, Celso.

leandrolcampos commented 5 years ago

O notebook usou uma definição de z[l] e a[l] diferente da que vimos em sala de aula.

Para adaptar a elas, usei o seguinte no método feedforward: self.z = np.dot(prev_a, self.w) + self.b e self.a = self.act_func(self.z).

E no método backpropagate, usei: der_w = np.dot(prev_a.T, delta), der_b = np.mean(delta, axis=0), prev_z = prev_layer.z.reshape(prev_a.shape) e prev_delta = np.dot(delta, self.w.T) * prev_layer.der_act_func(prev_z).

Aparentemente, funcionou. Mas acho bem confuso ficar mudando as definições e notações de um material para outro.

celsofranssa commented 5 years ago

Realmente, isso dificulta muito o aprendizado. A forma como você resolveu funcionou, mas (por ignorancia minha talvez) não consegui enxergar o porquê de usá-la.

deep-ufmg / praticas

Feedforward Implementation #2