Closed AdrianArnaiz closed 5 years ago
Realizados experimentos con características extraídas directamente de DISVOICE.
Sin añadir edad o sexo al conjunto de atributos. Sin estratificar la cross Validation por edad y sexo. Sin dividir los conjuntos de datos por edad o sexo.
Estos 3 apartados serán enfoques que daremos en el siguiente experimento.
Visiblemente peores que en el paper, no se acercan a la clasificación que obtienen los segmentos unvoiced (a las demás son algo más parecidos pero peores por lo general). El mejor resultado se ha tenido utilizando Variance Treshold(0.1) con atributos sin normalizar y AdaBoost por defecto para fon_rt con un auc de 0.88.
Se han utilizado:
Realizar experimentos con diferentes clasificadores con los diferentes conjuntos de datos obtenidos tras la extracción de características.
Se probará con mínimo un algoritmo de cada tipo (se especifican los tipos dentro de la documentación de scikitlearn). Se realizará una comparación entre algoritmos y entre diferentes subsets de datos.
Podrá realizarse utilizando ya sea Weka o Scikitlear (experimentador configurado)