TextyML / texty.ml

Text Classification by Machine Learning.
http://texty.ml
0 stars 0 forks source link

Word2Vec #12

Open Bomberus opened 7 years ago

Bomberus commented 7 years ago
ScientiaEtVeritas commented 7 years ago

Paragraph Vectors scheinen ein guter Weg zu sein: https://cs.stanford.edu/~quocle/paragraph_vector.pdf http://nlp.stanford.edu/~socherr/EMNLP2013_RNTN.pdf Vector Averging wird auch erwähnt, also auch mal ausprobieren.

Bomberus commented 7 years ago

Clientprogramm nutzt Sockets um mit Server zu kommunizieren und Client + Server belegen ~ 5.1 GB RAM. Die Daten können im folgenden Schema aufgrufen werden:

from word2vec import Word2Vec

word2vec = Word2Vec()

word2vec.connect()

print(word2vec.similar_by_word(word="la"))

word2vec.close()

Werde am Sonntag Projekt in Github pushen und auf den Server aufspielen.

Bomberus commented 7 years ago

Analyse: https://gist.github.com/Bomberus/36dbfb3266551d2332fd33bae44ecd7c