sfohart / mestrado-ufba-pesquisa-orientada

Pesquisa Orientada - Mestrado UFBA
1 stars 1 forks source link

[Mahout] Aprendizado de máquina para função de agregação #19

Open sfohart opened 10 years ago

sfohart commented 10 years ago

Implementar uma função de agregação utilizando Regressão Logística para descobrir a avaliação geral a partir dos critérios de avaliação.

https://blog.trifork.com/2014/02/04/an-introduction-to-mahouts-logistic-regression-sgd-classifier/

http://skife.org/mahout/2013/02/14/first_steps_with_mahout.html

O vetor de entrada deveria conter:

Sendo 10 os critérios atualmente, esse vetor teria tamanho 12. O alvo seria a avaliação geral dada manualmente pelo usuário, para fins de aprendizado supervisionado. Ainda não sei quantas fases de treinamento, nem quantas iterações utilizar para cada fase.

Após o treinamento, salvar o modelo. Extrair métricas do treinamento também.

onlinelogisticregression - como treinar

@RobertoBittencourt

sfohart commented 10 years ago

Uma vez que o AdaptiveLogisticRegression [1] esteja treinado com os dados informados pelos usuários, utilizar este modelo para inferir as notas de avaliações gerais, com base nos valores estimados para cada critério, a partir de algum método de recomendação.

[1] https://builds.apache.org/job/Mahout-Quality/javadoc/org/apache/mahout/classifier/sgd/AdaptiveLogisticRegression.html

onlinelogisticregression - onde aplicar

sfohart commented 10 years ago

Ainda é preciso escolher qual função de prioridade utilizar.

A L1 implementa uma função de prioridade Laplaciana (ou bi-exponencial). A L2 implementa uma função de prioridade Gaussiana. A ElasticBandPrior implementa uma mistura das duas acima. Ainda há a TPrior, que implementa uma distribuição T como função de prioridade

sfohart commented 10 years ago

Como medir a qualidade do modelo gerado? O Mahout disponibiliza apenas a métrica AUC (Area Under Curve)