andompesta / MassiveDataAnal

0 stars 0 forks source link

Serializing preprocess.py #2

Open manoet opened 10 years ago

manoet commented 10 years ago

Mi chiedo quale sia lo scopo di serializzare la classe. Pensavo che tu facessi l'elaborazione e poi serializzassi, in modo da calcolare il tutto solo una volta e limitarti a caricare dal disco le volte successive. Ho scoperto, invece, che tu serializzi la classe appena creata e elabori solo quando deserializzi. In pratica e' come se salvassi soltanto i parametri con cui costruisci la classe. Quale e' il senso di questa cosa?

paolomorettin commented 10 years ago

come dicevo su skype un po' di volte fa, non credo ci sia veramente una logica dietro a questa scelta. è una scelta artistica, tipo, ma volendo si può tranquillamente creare un'istanza dentro il summarizer, come volete!

manoet commented 10 years ago

francamente mi sembra inutile per come e' strutturata in questo modo. Io gestirei l'intero progetto in modo da avere solo due eseguibili: 1 - prende i tweet, li elabora e salva qualcosa 2 - prende l'elaborato dello script 1 e lo usa per processare le news e ricavare la migliore.