AdrianArnaiz / TFG-Neurodegenerative-Disease-Detection

Uso de biomarcadores extraídos de la voz para la detección de la enfermedad del Parkinson
https://adrianarnaiz.github.io/TFG-Neurodegenerative-Disease-Detection/
2 stars 5 forks source link

Crear Datasets (tipo Bunch) con labels numéricas para regresión #51

Open AdrianArnaiz opened 4 years ago

AdrianArnaiz commented 4 years ago

Adición de labels numéricas.

Como los datasets fueron guardados en formato numpy, modificaremos para guardarlos en formato Bunch (tipo de diccionario) al igual que importa los datos sklearn.

Para ello utilizaremos los datos de Disvocice + Edad y Sexo y les añadiremos UPDRS, UPDRS_SPEECH y HY, 3 escalas de medición de severidad del Parkinson. También añadiremos esas labels a los Embeddings de VGGish.

Como en algunos conjuntos de datos originales había Nan y fueron eliminados, no sabemos a qué audio se corresponde cada instancia, por lo que habrá que volver a sacar en algunos casos las características.