Open sfohart opened 10 years ago
Uma vez que o AdaptiveLogisticRegression [1] esteja treinado com os dados informados pelos usuários, utilizar este modelo para inferir as notas de avaliações gerais, com base nos valores estimados para cada critério, a partir de algum método de recomendação.
Ainda é preciso escolher qual função de prioridade utilizar.
A L1 implementa uma função de prioridade Laplaciana (ou bi-exponencial). A L2 implementa uma função de prioridade Gaussiana. A ElasticBandPrior implementa uma mistura das duas acima. Ainda há a TPrior, que implementa uma distribuição T como função de prioridade
Como medir a qualidade do modelo gerado? O Mahout disponibiliza apenas a métrica AUC (Area Under Curve)
Implementar uma função de agregação utilizando Regressão Logística para descobrir a avaliação geral a partir dos critérios de avaliação.
https://blog.trifork.com/2014/02/04/an-introduction-to-mahouts-logistic-regression-sgd-classifier/
http://skife.org/mahout/2013/02/14/first_steps_with_mahout.html
O vetor de entrada deveria conter:
Sendo 10 os critérios atualmente, esse vetor teria tamanho 12. O alvo seria a avaliação geral dada manualmente pelo usuário, para fins de aprendizado supervisionado. Ainda não sei quantas fases de treinamento, nem quantas iterações utilizar para cada fase.
Após o treinamento, salvar o modelo. Extrair métricas do treinamento também.
@RobertoBittencourt