IIC2413 / Syllabus-2021-1

81 stars 47 forks source link

Control 3 Duda Enunciado #366

Open jackyYam opened 3 years ago

jackyYam commented 3 years ago

Hola, Tengo varias preguntas respecto al Control 3:

Muchas gracias!

jackyYam commented 3 years ago

Tambien tengo unas consultas en la parte de mongDB

  1. En la pregunta 1, nos pide la cantidad de post y comentarios, hay algun diferenciador entre post y comentarios? Revise 50 datos y no observe diferencias. Aparece numeros de comentarios, entonces si hay un post que contiene lo que se solicita, al contador tambien lo sumamos la cantidad de comentarios que tiene?
  2. Buscar con nombre de la empresa es buscar con "Apple" en vez de "Apple Inc"?
  3. Las busquedas deben ser parciales o imparciales? case sensitive o case insensitive? Podria aparecer en titulo o en selftext? O solo realizamos la busqueda en el titulo?
  4. En la pregunta 3, el grafico de comparacion es entre cantidad de post y comentarios? Y la correlacion basta solo una tabla de correlacion entre los valores mencionados?
ironcadiz commented 3 years ago

Sobre lo primero

ironcadiz commented 3 years ago

Sobre mongo:

  1. ver #369
  2. Ver como hacer esto es decisión de ustedes. Hagan consultas que tengan sentido con posts que escriben personas aleatorias en internet. Ir haciendo consultas exploratorias para ir leyendo los textos es probablemente buena idea.
  3. El índice de texto en mongo es para ambos campos (title y self text) así que no tienen qué preocuparse del campo, buscar cómo lo hicimos en la guía de mongo basta. Decidir cómo hacer la búsqueda es parte del control así que no te puedo soplar eso jeje.
  4. Entre esas dos y las tres series mencionadas en la pregunta. Cómo mostrar las correlaciones queda a criterio de ustedes.
jackyYam commented 3 years ago

Sobre lo primero

  • Queda a criterio suyo eso. Háganlo como crean que se ve mejor
  • Si, una correlación para cada par, a partir de eso sacar el máximo positivo y negativo. No, los gráficos son solo para los pares que dieron correlaciones máximas.
  • En la guía hicimos un scatter plot. Un linechart es un gráfico de linea como el que esta en el link del enunciado.
  • No, la idea del control es hacer un análisis de lo que pasó. Ese análisis no sería muy legible si se habla todo el rato de IDs y no con los nombres de las acciones.

Hola, no entiendo muy bien como se puede representar un grafico de correlacion con line chart.

Y en cuales consultas es necesario explicitar el nombre de la accion?

ironcadiz commented 3 years ago

Hay que hacer un linechart de las series de tiempo por fecha, no de la correlación. La idea es visualizar en el linechart como los precios de las acciones están correlacionados.

Y sobre lo del nombre/símbolo te recomiendo siempre tenerlo a mano para printearlo/mostrarlo en el dataframe. Quedan más amigables y fáciles de entender los resultados. Todas las preguntas del control en que se pregunta por acciones en particular (ej: ¿Cuales acciones tienen mayor bla bla....?) deben responderlas con el nombre / símbolo.