IMAbril / TP_LaboDatos

Repositorio para los trabajos prácticos 1 y 2 del laboratorio de datos.
0 stars 0 forks source link

1- Análisis Exploratorio #12

Open IMAbril opened 8 months ago

IMAbril commented 8 months ago

Realizar un análisis exploratorio de los datos. Entre otras cosas, deben analizar la cantidad de datos, cantidad y tipos de atributos, cantidad de clases de la variable de interés (letras en lenguaje de señas) y otras características que consideren relevantes. Además se espera que con su análisis puedan responder las siguientes preguntas:

Importante: las respuestas correspondientes a los puntos 1.a, 1.b y 1.c deben ser justificadas en base a gráficos de distinto tipo.

IMAbril commented 8 months ago

Info del dataset

The American Sign Language letter database of hand gestures represent a multi-class problem with 24 classes of letters (excluding J and Z which require motion).

Formato de los datos: CSV format with labels and pixel values in single rows. The dataset format is patterned to match closely with the classic MNIST Info sobre MNIST Artículo explicativo

Letras que se representan con movimiento y no con imagenes: Each training and test case represents a label (0-25) as a one-to-one map for each alphabetic letter A-Z (and no cases for 9=J or 25=Z because of gesture motions).

The training data (27,455 cases) and test data (7172 cases) are approximately half the size of the standard MNIST but otherwise similar with a header row of label, pixel1,pixel2….pixel784 which represent a single 28x28 pixel image with grayscale values between 0-255.