HaraHeique / TCC-rede-neural-siamesa

Trabalho Conclusão de Curso com a implementação da Rede Neural Siamesa do Campus IFES Serra.
4 stars 0 forks source link

Realizar busca de melhores parâmetros/hiperparametros da rede usando hyperas #35

Open HaraHeique opened 3 years ago

HaraHeique commented 3 years ago
HaraHeique commented 3 years ago

Todo o código fonte foi implementado na branch hyperas-otimizacao-hiperparametros usando a ferramenta Jupyter Notebook. O código fonte do notebook criado no jupyter pode ser encontrado no pacote (diretório) chamado hyperparameters_optimization.

HaraHeique commented 3 years ago

@Fideliszan

Alguns resultados do processo de treinamento utilizando o otimizador de hiperparâmetros hyperas para as seguintes arquiteturas das subredes da rede siamesa foram:

LSTM Manhattan

history-graph-18_07_2021-15_55_56-WORD2VEC_GOOGLE_NEWS-LSTM-MANHATTAN-80-20-20-17

history-graph-19_07_2021-01_11_08-WORD2VEC_GOOGLE_NEWS-LSTM-MANHATTAN-80-20-20-17

history-graph-24_07_2021-22_40_26-WORD2VEC_GOOGLE_NEWS-LSTM-MANHATTAN-80-20-20-17

CNN

history-graph-19_07_2021-20_56_52-GLOVE_WIKIPEDIA_GIGAWORD-CNN-MANHATTAN-80-20-5-17

history-graph-19_07_2021-21_52_00-WORD2VEC_GOOGLE_NEWS-CNN-MANHATTAN-80-20-5-17

biLSTM

history-graph-24_07_2021-23_54_58-WORD2VEC_GOOGLE_NEWS-LSTM-MANHATTAN-80-20-10-17

Perceba que a partir dos gráficos a biLSTm tem o resultado mais coerente e estável que todas as outras. Logo pode ser uma candidata após um processo de melhoria/tuning de parâmetros/hiperparâmetros da rede siamesa.

OBS.: todos os testes foram feitos utilizando medida de similaridade Manhattan e o dataset cru (raw) usando a partição 70/30 ou 80/20.

HaraHeique commented 3 years ago

Uma melhoria que pode ser realizada no código do notebook que usa o hyperas, é na determinação do tipo de arquitetura através de funções internas da função _createmodel(). Pode-se passar como argumento o nome da arquitetura e seu modelo e retornar o modelo com a arquitetura em si. Entretanto o código implementado já resolve o problema que a tarefa (este card) pretende resolver, ficando o ajuste como uma melhoria futura.