andompesta / MassiveDataAnal

0 stars 0 forks source link

Experiencing crash #3

Open manoet opened 10 years ago

manoet commented 10 years ago

Traceback (most recent call last): File "tweetsSummary.py", line 81, in summarizeTweets(tweetsFolder,infoFolder,pp,outputFilename,kTerms) File "tweetsSummary.py", line 49, in summarizeTweets texts.append( pp.processDoc(contr['text']) ) KeyError: 'text'

the keys of contr for different loop iterations are: ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] ['text', u'cValue', u'timeEnd', u'cType', u'timeBegin'] [u'cValue', u'timeEnd', u'cType', u'timeBegin']

I tried to investigate this matter, but the contradictionList is such complex! Isn't there a way to simplify everything?

paolomorettin commented 10 years ago

Sicuramente si può cambiare la struttura di contradictionList, ma il vantaggio di tenerla così è che la salvi as-it-is in un json e hai tutto.

Ho provato a riprodurre l'errore, ma niente, devi darmi più informazioni. Io ho semplicemente preso le informazioni e i tweet dalla cartella MDA_GraphAnalyzer, rimuovendo alcuni file come i '_directory' e un file di info che si chiama 'Sherlock Holmes.json' (anche se c'è già 'SherlockHolmes.json')

manoet commented 10 years ago

eccoti un esempio di environment in cui ho il crash: http://bit.ly/1xN21j6 si riferisce al commit 47000c2e45db511c9916d923891dd46e8e0b2e64 il comando che eseguo e' python2 tweetsSummary.py ../tweetsArchive/contradiction-tweet/ ../tweetsArchive/contradiction-info dump tweetsSummary 30