adrianacoca / Predictweet

0 stars 0 forks source link

Tarea / Revisar Doc Grafana y cómo integrarlo #3

Open olmocorell opened 4 years ago

olmocorell commented 4 years ago

https://grafana.com/ El aspecto es flipante, pero para que saque todos esos gráficos, habría que pasarle muchísimos datos, tipo, a lo largo del día entero ¿no? Y me preocupa la limitación de twitter....aunque de eso ahora mismo sabes más tú. Pensamos cómo podemos integrarlo para que si le pides a la api un user/hashtag te saque las métricas de positividad/negatividad durante la última semana, por ejemplo ¿tendríamos muchos problemas con recopilar esos datos? Lanzo ideas, ¿eh? me dices...

adrianacoca commented 4 years ago

Por lo que he visto se pueden request 200 tweets cada 15 mins, podría sacar el analysis de esos 200, que serían los últimos. Pero son pocos para ver como ha evolucionado. Puedo empezar desarrollando la idea de que te saque la positividad hacia ese usuario y si no tengo suficiente info para hacer ese proceso me puedo meter con más detalle en el analisis de sentimiento con spacy y que analice mas alla de positivo/negativo

olmocorell commented 4 years ago

Perfect idea! Podemos meter otro tipo de gráficos que muestren cosas interesantes y queden chulos si no tenemos suficiente info. Pienso, investigo y te digo.

adrianacoca commented 4 years ago

Podria usar sklearn.feature_extraction para sacar los topics en los que se menciona a cada usuario no?

olmocorell commented 4 years ago

Creo que te refieres a esto... https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html#sklearn.feature_extraction.text.CountVectorizer

El jue., 23 jul. 2020 a las 15:54, Adriana Coca (notifications@github.com) escribió:

Podria usar sklearn.feature_extraction para sacar los topics en los que se menciona a cada usuario no?

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/adrianacoca/Predictweet/issues/3#issuecomment-663020799, or unsubscribe https://github.com/notifications/unsubscribe-auth/ANZXQK3RE5C7JAJILYQCJCTR5A6KTANCNFSM4PFXPUQQ .

olmocorell commented 4 years ago

Esto es una frikada máxima, pero déjatelo en "loqueadas" Es wordtovec, que es la red neuronal de la que te he hablado, que te clusteriza las palabras de un texto. No le des importancia ni te satures, solo te lo dejo por si nos da tiempo a llegar más allá. O incluso por si fuera del bootcamp te motiva el NLP (a mí me flipa) https://medium.com/@gruizdevilla/introducci%C3%B3n-a-word2vec-skip-gram-model-4800f72c871f

El jue., 23 jul. 2020 a las 16:24, Amanda Gálvez Corell (< agalvezcorell@gmail.com>) escribió:

Creo que te refieres a esto...

https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html#sklearn.feature_extraction.text.CountVectorizer

El jue., 23 jul. 2020 a las 15:54, Adriana Coca (notifications@github.com) escribió:

Podria usar sklearn.feature_extraction para sacar los topics en los que se menciona a cada usuario no?

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/adrianacoca/Predictweet/issues/3#issuecomment-663020799, or unsubscribe https://github.com/notifications/unsubscribe-auth/ANZXQK3RE5C7JAJILYQCJCTR5A6KTANCNFSM4PFXPUQQ .

adrianacoca commented 4 years ago

Lo de feature_extraction, sii me refiero a eso. Lo uso Marc en w6-d1-recommender-systems.ipynb, pero en mi caso en vez de usarlo para relacionar topics entre dos personas para recomendar, lo puedo usar para los 200 tweets que saque por usuario para ver de que hablan.

olmocorell commented 4 years ago

perfect!

El jue., 23 jul. 2020 a las 16:33, Adriana Coca (notifications@github.com) escribió:

Lo de feature_extraction, sii me refiero a eso. Lo uso Marc en w6-d1-recommender-systems.ipynb, pero en mi caso en vez de usarlo para relacionar topics entre dos personas para recomendar, lo puedo usar para los 200 tweets que saque por usuario para ver de que hablan.

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/adrianacoca/Predictweet/issues/3#issuecomment-663041944, or unsubscribe https://github.com/notifications/unsubscribe-auth/ANZXQK3H446QIQ3JXKKV5LLR5BC3TANCNFSM4PFXPUQQ .