MIguelC137 / An-lisis-de-Sentimientos-en-Tormenta-de-Espadas-de-George-R.R.-Martin

Análisis de sentimientos en "Tormenta de Espadas" de George R.R. Martin: Explora emociones y texto en esta novela épica.
Other
0 stars 0 forks source link

Comentarios sobre proyecto EDA #2

Open vcuspinera opened 10 months ago

vcuspinera commented 10 months ago

Hola, José Miguel. De forma global veo bien tu proyecto: el repositorio del proyecto tiene la estructura adecuada, realizaste el EDA en Jupyter notebook, compartiste el link del proyecto en el repositorio del curso, agregaste un issue con pendientes del proyecto, la entrega se realizó antes del deadline y compartiste la liga de la divulgación del proyecto a través de LinkedIn.

A continuación te comparto mis comentarios para algunas secciones, con mayor detalle.

Estructura del repositorio

La estructura es adecuada y seguiste las recomendaciones del paper Good Enough Practices in Scientific Computing.

En el archivo README.md en la carpeta principal del repositorio se incluyó la descripción general del proyecto, un breve resumen de resultados y el nombre y ubicación del Jupyter notebook con el análisis EDA.

En cada una de las carpetas (DATA, RESULTS y SRC) faltó incluir un archivo README con la descripción de la carpeta y su contenido.

En la carpeta RESULTS el archivo RESUME deberías añadirle la terminación .md para que pueda visualizarse como markdown en GitHub de forma adecuada.

Análisis EDA

Revisé el Jupyter notebook para buscar replicar tus resultados y estos son los comentarios que fueron surgiendo al correr el código:

Para llamar el archivo en PDF, con el texto del libro que es la base para tu análisis, deberías utilizar una ruta relativa que consulte la información que tienes en la carpeta DATA, podrías utilizar el siguiente código. Es decir, en vez de utilizar el código:

# Ruta del archivo PDF del libro 
pdf_path = 'tormenta_de_espadas_george_rr_martin.pdf'

…deberías utilizar:

# Ruta del archivo PDF del libro
pdf_path = '../DATA/tormenta_de_espadas_george_rr_martin.pdf'

Por otro lado, siempre que haya que instalarse una librería recomendaría dejarlo comenta con un símbolo # al inicio así como una explicación de para qué sirve la librería, esto le da la opción quien quiere replicar tu análisis a identificar y decidir si quiere instalar o no esas librerías. Esto aplica para los siguientes códigos que compartiste:

## Librerías a instalar: para instalar la librería quitar el símbolo "#" de las siguientes líneas:
# !pip install PyPDF2
# !pip install textblob
# !pip install matplotlib

Cuando haces el análisis de sentimiento del libro usando textblob, lo estás haciendo de TODO el libro y no por palabra o enunciado. Por lo anterior no es necesario hacer un histograma si sólo se tiene un valor (para todo el libro). Te recomendaría particionarlo para ver como va cambiando la polaridad conforme avanza el libro.

Por otro lado en varias ocasiones pones el path donde se encuentra el libro en PDF; podrías tener una sección inicial con las variables que utilizarás a lo largo del análisis, como esta variable.

Me da gusto que te haya interesado hacer análisis de texto y utilizaras herramientas como NLTK y Vader.

Comentarios finales

Me pareció interesante el análisis de sentimiento a un libro utilizando herramientas como NLTK y Vader, la visualización del análisis de sentimiento a lo largo del libro fue bastante buena y clara. ¡Muy buen esfuerzo, muchas felicidades!

Saludos, Víctor Cuspinera

vcuspinera commented 10 months ago

Link proyecto https://github.com/MIguelC137/An-lisis-de-Sentimientos-en-Tormenta-de-Espadas-de-George-R.R.-Martin

Divulgación por LinkedIn https://www.linkedin.com/feed/update/urn:li:activity:7116246223207944192/