piskvorky / gensim

Topic Modelling for Humans
GNU Lesser General Public License v2.1
15.48k stars 4.37k forks source link

Doc2Vec training hangs #1701

Closed tarun-t closed 6 years ago

tarun-t commented 6 years ago


Hi, I tried training a model, with

from gensim.models import Doc2Vec

model = Doc2Vec(min_count=1, window=10, size=100, sample=1e-4, negative=5, workers=7)
model.train(tagged_docs, total_examples=model.corpus_count, epochs=10)

but I'm getting the following exception (after which Python hangs):

Actual Results

01:03:25 PM INFO gensim.models.doc2vec:collecting all words and their counts
01:03:25 PM INFO gensim.models.doc2vec:PROGRESS: at example #0, processed 0 words (0/s), 0 word types, 0 tags
01:03:26 PM INFO gensim.models.doc2vec:PROGRESS: at example #10000, processed 3433858 words (6104765/s), 76029 word types, 10000 tags
01:03:26 PM INFO gensim.models.doc2vec:PROGRESS: at example #20000, processed 6635183 words (5692429/s), 103582 word types, 20000 tags
01:03:27 PM INFO gensim.models.doc2vec:PROGRESS: at example #30000, processed 10021476 words (5520268/s), 126018 word types, 30000 tags
01:03:28 PM INFO gensim.models.doc2vec:PROGRESS: at example #40000, processed 13649301 words (5489036/s), 145348 word types, 40000 tags
01:03:28 PM INFO gensim.models.doc2vec:collected 157200 word types and 47050 unique tags from a corpus of 47050 examples and 16232493 words
01:03:28 PM INFO gensim.models.word2vec:Loading a fresh vocabulary
01:03:29 PM INFO gensim.models.word2vec:min_count=1 retains 157200 unique words (100% of original 157200, drops 0)
01:03:29 PM INFO gensim.models.word2vec:min_count=1 leaves 16232493 word corpus (100% of original 16232493, drops 0)
01:03:29 PM INFO gensim.models.word2vec:deleting the raw counts dictionary of 157200 items
01:03:29 PM INFO gensim.models.word2vec:sample=0.0001 downsamples 686 most-common words
01:03:29 PM INFO gensim.models.word2vec:downsampling leaves estimated 13004737 word corpus (80.1% of prior 16232493)
01:03:29 PM INFO gensim.models.word2vec:estimated required memory for 157200 words and 100 dimensions: 223180000 bytes
01:03:30 PM INFO gensim.models.word2vec:resetting layer weights
01:03:31 PM INFO gensim.models.word2vec:training model with 7 workers on 157200 vocabulary and 100 features, using sg=0 hs=0 sample=0.0001 negative=5 window=10
Exception in thread Thread-8:
Traceback (most recent call last):
  File "/usr/lib/python2.7/threading.py", line 810, in __bootstrap_inner
  File "/usr/lib/python2.7/threading.py", line 763, in run
    self.__target(*self.__args, **self.__kwargs)
  File "/home/tarun/.local/lib/python2.7/site-packages/gensim/models/word2vec.py", line 884, in job_producer
    for sent_idx, sentence in enumerate(sentences):
  File "/home/tarun/.local/lib/python2.7/site-packages/gensim/utils.py", line 692, in __iter__
    for document in self.corpus:
TypeError: 'NoneType' object is not iterable


('Python', '2.7.6 (default, Oct 26 2016, 20:30:19) \n[GCC 4.8.4]') ('NumPy', '1.13.1') ('SciPy', '0.19.1') ('gensim', '2.3.0') ('cython', '0.27.3')

Thanks for the help in advance.

menshikh-iv commented 6 years ago

Thanks for report @tarun-t, can you share your tagged_docs (needed to reproduce your error)?

tarun-t commented 6 years ago

Since tagged_docs is very large, I'm pasting a small chunk of the list (length 10). It still results in the same error though.

[TaggedDocument(words=[u'editor', u'note', u'behind', u'scenes', u'series', u'cnn', u'correspondents', u'share', u'experiences', u'covering', u'news', u'analyze', u'stories', u'behind', u'events', u'soledad', u'brien', u'takes', u'users', u'inside', u'jail', u'many', u'inmates', u'mentally', u'ill', u'inmate', u'housed', u'forgotten', u'floor', u'many', u'mentally', u'ill', u'inmates', u'housed', u'miami', u'trial', u'miami', u'florida', u'cnn', u'ninth', u'floor', u'miami', u'dade', u'pretrial', u'detention', u'facility', u'dubbed', u'forgotten', u'floor', u'inmates', u'severe', u'mental', u'illnesses', u'incarcerated', u'ready', u'appear', u'court', u'often', u'face', u'drug', u'charges', u'charges', u'assaulting', u'officer', u'charges', u'judge', u'steven', u'leifman', u'says', u'usually', u'avoidable', u'felonies', u'says', u'arrests', u'often', u'result', u'confrontations', u'police', u'mentally', u'ill', u'people', u'often', u'told', u'police', u'arrive', u'scene', u'confrontation', u'seems', u'exacerbate', u'illness', u'become', u'paranoid', u'delusional', u'less', u'likely', u'follow', u'directions', u'according', u'leifman', u'end', u'ninth', u'floor', u'severely', u'mentally', u'disturbed', u'getting', u'real', u'help', u'jail', u'toured', u'jail', u'leifman', u'well', u'known', u'miami', u'advocate', u'justice', u'mentally', u'ill', u'even', u'though', u'exactly', u'welcomed', u'open', u'arms', u'guards', u'given', u'permission', u'shoot', u'videotape', u'tour', u'floor', u'inside', u'forgotten', u'floor', u'first', u'hard', u'determine', u'people', u'prisoners', u'wearing', u'sleeveless', u'robes', u'imagine', u'cutting', u'holes', u'arms', u'feet', u'heavy', u'wool', u'sleeping', u'bag', u'kind', u'look', u'like', u'designed', u'keep', u'mentally', u'ill', u'patients', u'injuring', u'also', u'shoes', u'laces', u'mattresses', u'leifman', u'says', u'one', u'third', u'people', u'miami', u'dade', u'county', u'jails', u'mentally', u'ill', u'says', u'sheer', u'volume', u'overwhelming', u'system', u'result', u'see', u'ninth', u'floor', u'course', u'jail', u'supposed', u'warm', u'comforting', u'lights', u'glare', u'cells', u'tiny', u'loud', u'see', u'two', u'sometimes', u'three', u'men', u'sometimes', u'robes', u'sometimes', u'naked', u'lying', u'sitting', u'cells', u'son', u'president', u'need', u'get', u'one', u'man', u'shouts', u'absolutely', u'serious', u'convinced', u'help', u'way', u'could', u'reach', u'white', u'house', u'leifman', u'tells', u'prisoner', u'patients', u'often', u'circulate', u'system', u'occasionally', u'stabilizing', u'mental', u'hospital', u'return', u'jail', u'face', u'charges', u'brutally', u'unjust', u'mind', u'become', u'strong', u'advocate', u'changing', u'things', u'miami', u'meal', u'later', u'talk', u'things', u'got', u'way', u'mental', u'patients', u'leifman', u'says', u'years', u'ago', u'people', u'considered', u'lunatics', u'locked', u'jails', u'even', u'charges', u'considered', u'unfit', u'society', u'years', u'says', u'public', u'outcry', u'mentally', u'ill', u'moved', u'jails', u'hospitals', u'leifman', u'says', u'many', u'mental', u'hospitals', u'horrible', u'shut', u'patients', u'nowhere', u'streets', u'became', u'many', u'cases', u'homeless', u'says', u'never', u'got', u'treatment', u'leifman', u'says', u'half', u'million', u'people', u'state', u'mental', u'hospitals', u'today', u'number', u'reduced', u'percent', u'people', u'mental', u'hospitals', u'judge', u'says', u'working', u'change', u'starting', u'many', u'inmates', u'would', u'otherwise', u'brought', u'forgotten', u'floor', u'instead', u'sent', u'new', u'mental', u'health', u'facility', u'first', u'step', u'journey', u'toward', u'long', u'term', u'treatment', u'punishment', u'leifman', u'says', u'complete', u'answer', u'start', u'leifman', u'says', u'best', u'part', u'win', u'win', u'solution', u'patients', u'win', u'families', u'relieved', u'state', u'saves', u'money', u'simply', u'cycling', u'prisoners', u'leifman', u'justice', u'served', u'mail', u'friend'], tags=[0]), TaggedDocument(words=[u'london', u'england', u'reuters', u'harry', u'potter', u'star', u'daniel', u'radcliffe', u'gains', u'access', u'reported', u'million', u'million', u'fortune', u'turns', u'monday', u'insists', u'money', u'cast', u'spell', u'daniel', u'radcliffe', u'harry', u'potter', u'harry', u'potter', u'order', u'phoenix', u'disappointment', u'gossip', u'columnists', u'around', u'world', u'young', u'actor', u'says', u'plans', u'fritter', u'cash', u'away', u'fast', u'cars', u'drink', u'celebrity', u'parties', u'plan', u'one', u'people', u'soon', u'turn', u'suddenly', u'buy', u'massive', u'sports', u'car', u'collection', u'something', u'similar', u'told', u'australian', u'interviewer', u'earlier', u'month', u'think', u'particularly', u'extravagant', u'things', u'like', u'buying', u'things', u'cost', u'pounds', u'books', u'cds', u'dvds', u'radcliffe', u'able', u'gamble', u'casino', u'buy', u'drink', u'pub', u'see', u'horror', u'film', u'hostel', u'part', u'currently', u'six', u'places', u'number', u'one', u'movie', u'box', u'office', u'chart', u'details', u'mark', u'landmark', u'birthday', u'wraps', u'agent', u'publicist', u'comment', u'plans', u'definitely', u'sort', u'party', u'said', u'interview', u'hopefully', u'none', u'reading', u'radcliffe', u'earnings', u'first', u'five', u'potter', u'films', u'held', u'trust', u'fund', u'able', u'touch', u'despite', u'growing', u'fame', u'riches', u'actor', u'says', u'keeping', u'feet', u'firmly', u'ground', u'people', u'always', u'looking', u'say', u'kid', u'star', u'goes', u'rails', u'told', u'reporters', u'last', u'month', u'try', u'hard', u'way', u'would', u'easy', u'latest', u'outing', u'boy', u'wizard', u'harry', u'potter', u'order', u'phoenix', u'breaking', u'records', u'sides', u'atlantic', u'reprise', u'role', u'last', u'two', u'films', u'watch', u'reporter', u'give', u'review', u'potter', u'latest', u'life', u'beyond', u'potter', u'however', u'londoner', u'filmed', u'movie', u'called', u'boy', u'jack', u'author', u'rudyard', u'kipling', u'son', u'due', u'release', u'later', u'year', u'also', u'appear', u'december', u'boys', u'australian', u'film', u'four', u'boys', u'escape', u'orphanage', u'earlier', u'year', u'made', u'stage', u'debut', u'playing', u'tortured', u'teenager', u'peter', u'shaffer', u'equus', u'meanwhile', u'braced', u'even', u'closer', u'media', u'scrutiny', u'legally', u'adult', u'think', u'going', u'sort', u'fair', u'game', u'told', u'reuters', u'mail', u'friend', u'copyright', u'reuters', u'rights', u'reserved', u'material', u'may', u'published', u'broadcast', u'rewritten', u'redistributed'], tags=[1]), TaggedDocument(words=[u'minneapolis', u'minnesota', u'cnn', u'drivers', u'minneapolis', u'bridge', u'collapsed', u'told', u'harrowing', u'tales', u'survival', u'whole', u'bridge', u'one', u'side', u'mississippi', u'completely', u'gave', u'way', u'fell', u'way', u'survivor', u'gary', u'babineau', u'told', u'cnn', u'probably', u'foot', u'free', u'fall', u'cars', u'water', u'cars', u'fire', u'whole', u'bridge', u'said', u'back', u'injured', u'determined', u'could', u'move', u'around', u'realized', u'school', u'bus', u'right', u'next', u'couple', u'guys', u'went', u'started', u'lifting', u'kids', u'bridge', u'yelling', u'screaming', u'bleeding', u'think', u'broken', u'bones', u'watch', u'driver', u'describe', u'narrow', u'escape', u'home', u'heard', u'disaster', u'john', u'hink', u'emergency', u'room', u'physician', u'jumped', u'car', u'rushed', u'scene', u'minutes', u'arrived', u'south', u'side', u'bridge', u'stood', u'riverbank', u'saw', u'dozens', u'people', u'lying', u'dazed', u'expansive', u'deck', u'middle', u'mississippi', u'river', u'churning', u'fast', u'way', u'getting', u'went', u'north', u'side', u'easier', u'access', u'people', u'ambulances', u'also', u'hard', u'time', u'driving', u'river', u'get', u'closer', u'scene', u'working', u'feverishly', u'volunteers', u'emts', u'officials', u'managed', u'get', u'people', u'ambulances', u'less', u'two', u'hours', u'occasionally', u'pickup', u'truck', u'medic', u'inside', u'would', u'drive', u'get', u'injured', u'person', u'bring', u'back', u'even', u'ground', u'hink', u'told', u'cnn', u'rescue', u'effort', u'controlled', u'organized', u'said', u'opposite', u'lightning', u'quick', u'collapse', u'could', u'see', u'whole', u'bridge', u'going', u'falling', u'babineau', u'said', u'gave', u'rumble', u'real', u'quick', u'gave', u'way', u'fell', u'completely', u'way', u'ground', u'dust', u'everywhere', u'like', u'everyone', u'saying', u'like', u'movies', u'babineau', u'said', u'rear', u'pickup', u'truck', u'dangling', u'edge', u'broken', u'section', u'bridge', u'said', u'several', u'vehicles', u'slid', u'past', u'water', u'stayed', u'car', u'one', u'two', u'seconds', u'saw', u'couple', u'cars', u'fall', u'said', u'stayed', u'car', u'cars', u'quit', u'falling', u'second', u'got', u'real', u'quick', u'ran', u'front', u'truck', u'behind', u'truck', u'hole', u'helped', u'woman', u'bridge', u'wanted', u'bridge', u'ran', u'school', u'bus', u'started', u'grabbing', u'kids', u'handing', u'complete', u'chaos', u'said', u'children', u'crying', u'screaming', u'rescuers', u'set', u'ground', u'told', u'run', u'river', u'bank', u'needed', u'carried', u'injuries', u'see', u'rescuers', u'clamber', u'rubble', u'babineau', u'said', u'rescue', u'training', u'knew', u'moment', u'melissa', u'hughes', u'minneapolis', u'told', u'associated', u'press', u'driving', u'home', u'western', u'edge', u'bridge', u'collapsed', u'know', u'free', u'fall', u'feeling', u'felt', u'twice', u'hughes', u'said', u'pickup', u'landed', u'top', u'car', u'hurt', u'idea', u'vehicle', u'car', u'told', u'really', u'surreal', u'babineau', u'told', u'minneapolis', u'star', u'tribune', u'way', u'thought', u'dead', u'literally', u'thought', u'dead', u'truck', u'completely', u'face', u'pointed', u'toward', u'ground', u'truck', u'got', u'ripped', u'half', u'folded', u'half', u'believe', u'alive', u'see', u'hear', u'eyewitness', u'accounts', u'bernie', u'toivonen', u'told', u'cnn', u'american', u'morning', u'vehicle', u'part', u'bridge', u'ended', u'tilted', u'degree', u'angle', u'knew', u'deck', u'going', u'question', u'thought', u'going', u'die', u'said', u'bridge', u'settled', u'car', u'remained', u'upright', u'put', u'park', u'turned', u'key', u'said', u'alive', u'said', u'mail', u'friend'], tags=[2]), TaggedDocument(words=[u'baghdad', u'iraq', u'cnn', u'dressed', u'superman', u'shirt', u'year', u'old', u'youssif', u'held', u'sister', u'hand', u'friday', u'seemingly', u'unaware', u'millions', u'people', u'across', u'world', u'touched', u'story', u'nearby', u'parents', u'talked', u'new', u'future', u'hope', u'boy', u'potential', u'recovery', u'severe', u'burns', u'youssif', u'holds', u'sister', u'hand', u'friday', u'wearing', u'facial', u'mask', u'often', u'used', u'help', u'burn', u'victims', u'best', u'birthday', u'present', u'iraqi', u'family', u'could', u'ever', u'imagined', u'boy', u'youssif', u'turns', u'next', u'friday', u'happy', u'know', u'mother', u'zainab', u'told', u'cnn', u'broad', u'smile', u'across', u'face', u'think', u'reaction', u'would', u'big', u'father', u'said', u'roof', u'house', u'cnn', u'called', u'news', u'outpouring', u'support', u'son', u'want', u'thank', u'everyone', u'come', u'forward', u'said', u'knew', u'kindness', u'like', u'wife', u'stop', u'smiling', u'talked', u'tried', u'vain', u'get', u'help', u'son', u'baghdad', u'leaving', u'stone', u'unturned', u'mission', u'help', u'boy', u'many', u'trips', u'ministry', u'health', u'says', u'even', u'put', u'request', u'iraq', u'parliament', u'help', u'family', u'eventually', u'told', u'cnn', u'story', u'youssif', u'grabbed', u'masked', u'men', u'outside', u'home', u'january', u'doused', u'gasoline', u'set', u'fire', u'simply', u'coming', u'forward', u'parents', u'put', u'incredible', u'danger', u'one', u'arrested', u'held', u'accountable', u'youssif', u'case', u'watch', u'cnn', u'arwa', u'damon', u'describe', u'truly', u'phenomenal', u'outpouring', u'shortly', u'youssif', u'story', u'aired', u'wednesday', u'children', u'burn', u'foundation', u'nonprofit', u'organization', u'based', u'sherman', u'oaks', u'california', u'provides', u'support', u'burn', u'victims', u'locally', u'nationally', u'internationally', u'agreed', u'pay', u'transportation', u'youssif', u'family', u'come', u'united', u'states', u'set', u'fund', u'donations', u'make', u'donation', u'foundation', u'site', u'clicking', u'drop', u'menu', u'general', u'donation', u'area', u'marked', u'youssif', u'fund', u'foundation', u'says', u'cover', u'medical', u'costs', u'surgeries', u'youssif', u'housing', u'costs', u'social', u'rehabilitation', u'might', u'needed', u'surgeries', u'performed', u'peter', u'grossman', u'plastic', u'surgeon', u'affiliated', u'grossman', u'burn', u'center', u'donating', u'services', u'youssif', u'cause', u'officials', u'still', u'trying', u'get', u'appropriate', u'visas', u'family', u'travels', u'prepared', u'come', u'set', u'housing', u'situation', u'provide', u'support', u'begin', u'treatment', u'said', u'barbara', u'friedman', u'executive', u'director', u'children', u'burn', u'foundation', u'expect', u'treatment', u'six', u'months', u'year', u'many', u'surgeries', u'added', u'getting', u'absolute', u'best', u'care', u'available', u'youssif', u'parents', u'said', u'know', u'going', u'lengthy', u'difficult', u'process', u'adjusting', u'stay', u'america', u'may', u'easy', u'none', u'matters', u'getting', u'help', u'boy', u'first', u'foremost', u'anything', u'youssif', u'father', u'said', u'pulling', u'son', u'closer', u'child', u'everything', u'mother', u'tried', u'coax', u'youssif', u'talk', u'day', u'want', u'mother', u'says', u'shy', u'outside', u'home', u'biggest', u'obstacle', u'getting', u'visas', u'leave', u'serious', u'security', u'risks', u'face', u'every', u'day', u'hour', u'remain', u'iraq', u'family', u'saw', u'worst', u'humanity', u'january', u'day', u'new', u'hope', u'world', u'partly', u'due', u'tens', u'thousands', u'cnn', u'com', u'users', u'moved', u'story', u'wanted', u'act', u'cnn', u'iraqi', u'staff', u'central', u'bringing', u'story', u'together', u'also', u'overwhelmed', u'generosity', u'coming', u'people', u'outside', u'border', u'nation', u'largely', u'feels', u'abandoned', u'rest', u'world', u'refreshing', u'realization', u'mail', u'friend', u'cnn', u'com', u'senior', u'producer', u'wayne', u'drash', u'contributed', u'report', u'atlanta'], tags=[3]), TaggedDocument(words=[u'washington', u'cnn', u'doctors', u'removed', u'five', u'small', u'polyps', u'president', u'bush', u'colon', u'saturday', u'none', u'appeared', u'worrisome', u'white', u'house', u'spokesman', u'said', u'polyps', u'removed', u'sent', u'national', u'naval', u'medical', u'center', u'bethesda', u'maryland', u'routine', u'microscopic', u'examination', u'spokesman', u'scott', u'stanzel', u'said', u'results', u'expected', u'two', u'three', u'days', u'small', u'less', u'centimeter', u'half', u'inch', u'diameter', u'said', u'bush', u'good', u'humor', u'stanzel', u'said', u'resume', u'activities', u'camp', u'david', u'procedure', u'vice', u'president', u'dick', u'cheney', u'assumed', u'presidential', u'power', u'bush', u'reclaimed', u'presidential', u'power', u'two', u'hours', u'doctors', u'used', u'monitored', u'anesthesia', u'care', u'stanzel', u'said', u'president', u'asleep', u'deeply', u'unconscious', u'true', u'general', u'anesthetic', u'spoke', u'first', u'lady', u'laura', u'bush', u'midland', u'texas', u'celebrating', u'mother', u'birthday', u'procedure', u'stanzel', u'said', u'afterward', u'president', u'played', u'scottish', u'terriers', u'barney', u'miss', u'beazley', u'stanzel', u'said', u'planned', u'lunch', u'camp', u'david', u'briefings', u'national', u'security', u'adviser', u'stephen', u'hadley', u'white', u'house', u'chief', u'staff', u'josh', u'bolten', u'planned', u'take', u'bicycle', u'ride', u'saturday', u'afternoon', u'cheney', u'meanwhile', u'spent', u'morning', u'home', u'maryland', u'eastern', u'shore', u'reading', u'playing', u'dogs', u'stanzel', u'said', u'nothing', u'occurred', u'required', u'take', u'official', u'action', u'president', u'bush', u'reclaimed', u'presidential', u'power', u'procedure', u'supervised', u'richard', u'tubb', u'bush', u'physician', u'conducted', u'team', u'national', u'naval', u'medical', u'center', u'bethesda', u'maryland', u'white', u'house', u'said', u'bush', u'last', u'colonoscopy', u'june', u'abnormalities', u'found', u'white', u'house', u'spokesman', u'tony', u'snow', u'said', u'president', u'doctor', u'recommended', u'repeat', u'procedure', u'five', u'years', u'colonoscopy', u'sensitive', u'test', u'colon', u'cancer', u'rectal', u'cancer', u'polyps', u'small', u'clumps', u'cells', u'become', u'cancerous', u'according', u'mayo', u'clinic', u'small', u'polyps', u'may', u'removed', u'procedure', u'snow', u'said', u'friday', u'bush', u'polyps', u'removed', u'colonoscopies', u'becoming', u'president', u'snow', u'undergoing', u'chemotherapy', u'cancer', u'began', u'colon', u'spread', u'liver', u'watch', u'snow', u'talk', u'bush', u'procedure', u'colon', u'cancer', u'president', u'wants', u'encourage', u'everybody', u'use', u'surveillance', u'snow', u'said', u'american', u'cancer', u'society', u'recommends', u'people', u'without', u'high', u'risk', u'factors', u'symptoms', u'begin', u'getting', u'screened', u'signs', u'colorectal', u'cancer', u'age', u'mail', u'friend'], tags=[4]), TaggedDocument(words=[u'cnn', u'national', u'football', u'league', u'indefinitely', u'suspended', u'atlanta', u'falcons', u'quarterback', u'michael', u'vick', u'without', u'pay', u'officials', u'league', u'said', u'friday', u'nfl', u'star', u'michael', u'vick', u'set', u'appear', u'court', u'monday', u'judge', u'final', u'say', u'plea', u'deal', u'earlier', u'vick', u'admitted', u'participating', u'dogfighting', u'ring', u'part', u'plea', u'agreement', u'federal', u'prosecutors', u'virginia', u'admitted', u'conduct', u'illegal', u'also', u'cruel', u'reprehensible', u'team', u'nfl', u'nfl', u'fans', u'hurt', u'actions', u'nfl', u'commissioner', u'roger', u'goodell', u'said', u'letter', u'vick', u'goodell', u'said', u'would', u'review', u'status', u'suspension', u'legal', u'proceedings', u'papers', u'filed', u'friday', u'federal', u'court', u'virginia', u'vick', u'also', u'admitted', u'two', u'conspirators', u'killed', u'dogs', u'fight', u'well', u'falcons', u'owner', u'arthur', u'blank', u'said', u'vick', u'admissions', u'describe', u'actions', u'unacceptable', u'suspension', u'makes', u'strong', u'statement', u'conduct', u'tarnishes', u'good', u'reputation', u'nfl', u'tolerated', u'said', u'statement', u'watch', u'led', u'vick', u'suspension', u'goodell', u'said', u'falcons', u'could', u'assert', u'claims', u'remedies', u'recover', u'million', u'vick', u'signing', u'bonus', u'year', u'million', u'contract', u'signed', u'according', u'associated', u'press', u'vick', u'said', u'would', u'plead', u'guilty', u'one', u'count', u'conspiracy', u'travel', u'interstate', u'commerce', u'aid', u'unlawful', u'activities', u'sponsor', u'dog', u'animal', u'fighting', u'venture', u'plea', u'agreement', u'filed', u'district', u'court', u'richmond', u'virginia', u'charge', u'punishable', u'five', u'years', u'prison', u'fine', u'full', u'restitution', u'special', u'assessment', u'years', u'supervised', u'release', u'plea', u'deal', u'said', u'federal', u'prosecutors', u'agreed', u'ask', u'low', u'end', u'sentencing', u'guidelines', u'defendant', u'plead', u'guilty', u'defendant', u'fact', u'guilty', u'charged', u'offense', u'plea', u'agreement', u'said', u'additional', u'summary', u'facts', u'signed', u'vick', u'filed', u'agreement', u'vick', u'admitted', u'buying', u'pit', u'bulls', u'property', u'used', u'training', u'fighting', u'dogs', u'statement', u'said', u'bet', u'fights', u'receive', u'money', u'bad', u'newz', u'kennels', u'operations', u'gambling', u'monies', u'provided', u'vick', u'official', u'summary', u'facts', u'said', u'gambling', u'wins', u'generally', u'split', u'among', u'conspirators', u'tony', u'taylor', u'quanis', u'phillips', u'sometimes', u'purnell', u'peace', u'continued', u'vick', u'gamble', u'placing', u'side', u'bets', u'fights', u'vick', u'receive', u'proceeds', u'purses', u'bad', u'newz', u'kennels', u'vick', u'also', u'agreed', u'collective', u'efforts', u'two', u'others', u'caused', u'deaths', u'least', u'six', u'dogs', u'around', u'april', u'vick', u'peace', u'phillips', u'tested', u'dogs', u'fighting', u'sessions', u'vick', u'property', u'virginia', u'statement', u'said', u'peace', u'phillips', u'vick', u'agreed', u'killing', u'approximately', u'dogs', u'perform', u'well', u'testing', u'sessions', u'moonlight', u'road', u'dogs', u'killed', u'various', u'methods', u'including', u'hanging', u'drowning', u'vick', u'agrees', u'stipulates', u'dogs', u'died', u'result', u'collective', u'efforts', u'peace', u'phillips', u'vick', u'summary', u'said', u'peace', u'virginia', u'beach', u'virginia', u'phillips', u'atlanta', u'georgia', u'taylor', u'hampton', u'virginia', u'already', u'accepted', u'agreements', u'plead', u'guilty', u'exchange', u'reduced', u'sentences', u'vick', u'scheduled', u'appear', u'monday', u'court', u'expected', u'plead', u'guilty', u'judge', u'see', u'timeline', u'case', u'vick', u'judge', u'case', u'final', u'say', u'plea', u'agreement', u'federal', u'case', u'vick', u'focused', u'interstate', u'conspiracy', u'vick', u'admission', u'involved', u'killing', u'dogs', u'could', u'lead', u'local', u'charges', u'according', u'cnn', u'legal', u'analyst', u'jeffrey', u'toobin', u'sometimes', u'happens', u'often', u'state', u'follow', u'federal', u'prosecution', u'charging', u'crimes', u'exactly', u'behavior', u'toobin', u'said', u'friday', u'risk', u'vick', u'makes', u'admissions', u'federal', u'guilty', u'plea', u'state', u'virginia', u'could', u'say', u'hey', u'look', u'admitted', u'violating', u'virginia', u'state', u'law', u'well', u'going', u'introduce', u'charge', u'court', u'plea', u'deal', u'vick', u'agreed', u'cooperate', u'investigators', u'provide', u'information', u'may', u'criminal', u'activity', u'testify', u'necessary', u'vick', u'also', u'agreed', u'turn', u'documents', u'submit', u'polygraph', u'tests', u'vick', u'agreed', u'make', u'restitution', u'full', u'amount', u'costs', u'associated', u'dogs', u'held', u'government', u'costs', u'may', u'include', u'limited', u'costs', u'associated', u'care', u'dogs', u'involved', u'case', u'including', u'necessary', u'long', u'term', u'care', u'humane', u'euthanasia', u'animals', u'prosecutors', u'support', u'animal', u'rights', u'activists', u'asked', u'permission', u'euthanize', u'dogs', u'dogs', u'could', u'serve', u'important', u'evidence', u'cases', u'vick', u'admitted', u'conspirators', u'judge', u'henry', u'hudson', u'issued', u'order', u'thursday', u'telling', u'marshals', u'service', u'arrest', u'seize', u'defendant', u'property', u'use', u'discretion', u'whatever', u'means', u'appropriate', u'protect', u'maintain', u'said', u'defendant', u'property', u'judge', u'order', u'vick', u'filing', u'refer', u'approximately', u'pit', u'bull', u'dogs', u'vick', u'indictment', u'last', u'month', u'goodell', u'ordered', u'quarterback', u'report', u'falcons', u'training', u'camp', u'league', u'reviewing', u'case', u'blank', u'told', u'nfl', u'network', u'monday', u'could', u'speculate', u'vick', u'future', u'falcon', u'least', u'seen', u'statement', u'facts', u'case', u'mail', u'friend', u'cnn', u'mike', u'phelan', u'contributed', u'report'], tags=[5]), TaggedDocument(words=[u'baghdad', u'iraq', u'cnn', u'women', u'afraid', u'ashamed', u'show', u'faces', u'real', u'names', u'used', u'driven', u'sell', u'bodies', u'put', u'food', u'table', u'children', u'little', u'day', u'suha', u'mother', u'three', u'says', u'husband', u'thinks', u'cleaning', u'houses', u'leaves', u'home', u'people', u'criticize', u'women', u'talk', u'badly', u'says', u'year', u'old', u'suha', u'adjusts', u'light', u'colored', u'scarf', u'wears', u'days', u'avoid', u'extremists', u'insist', u'women', u'cover', u'say', u'lost', u'way', u'never', u'ask', u'take', u'path', u'mother', u'three', u'wears', u'light', u'makeup', u'gold', u'pendant', u'iraq', u'around', u'neck', u'unexpected', u'air', u'elegance', u'money', u'take', u'kid', u'doctor', u'anything', u'preserve', u'child', u'mother', u'says', u'explaining', u'prostitutes', u'anger', u'frustration', u'rise', u'voice', u'speaks', u'matter', u'else', u'may', u'matter', u'path', u'may', u'mother', u'watch', u'woman', u'describe', u'turning', u'prostitution', u'save', u'child', u'clasped', u'hands', u'clench', u'unclench', u'nervously', u'suha', u'husband', u'thinks', u'cleaning', u'houses', u'goes', u'away', u'karima', u'family', u'start', u'cleaning', u'homes', u'making', u'much', u'matter', u'hard', u'worked', u'enough', u'says', u'karima', u'clad', u'black', u'adds', u'husband', u'died', u'lung', u'cancer', u'nine', u'months', u'ago', u'left', u'nothing', u'five', u'children', u'ages', u'eldest', u'son', u'could', u'work', u'afraid', u'life', u'let', u'streets', u'preferring', u'sacrifice', u'risk', u'child', u'solicited', u'first', u'time', u'cleaning', u'office', u'took', u'advantage', u'says', u'softly', u'first', u'rejected', u'realized', u'suha', u'karima', u'clients', u'call', u'couple', u'times', u'week', u'women', u'resort', u'trips', u'market', u'find', u'potential', u'clients', u'flag', u'vehicles', u'prostitution', u'choice', u'iraqi', u'women', u'making', u'survive', u'increasing', u'suha', u'says', u'found', u'thing', u'friend', u'another', u'friend', u'predicament', u'mine', u'circumstance', u'forced', u'things', u'violence', u'increased', u'cost', u'living', u'lack', u'sort', u'government', u'aid', u'leave', u'women', u'like', u'options', u'according', u'humanitarian', u'workers', u'point', u'population', u'women', u'sell', u'bodies', u'order', u'keep', u'children', u'alive', u'says', u'yanar', u'mohammed', u'head', u'founder', u'organization', u'women', u'freedom', u'iraq', u'taboo', u'one', u'speaking', u'adds', u'huge', u'population', u'women', u'victims', u'war', u'sell', u'bodies', u'souls', u'lost', u'crushes', u'see', u'work', u'started', u'team', u'women', u'activists', u'team', u'pounds', u'streets', u'baghdad', u'looking', u'victims', u'often', u'humiliated', u'come', u'forward', u'women', u'find', u'hospitals', u'tried', u'commit', u'suicide', u'involved', u'prostitution', u'said', u'basma', u'rahim', u'member', u'mohammed', u'team', u'team', u'aim', u'compile', u'information', u'specific', u'cases', u'present', u'iraq', u'political', u'parties', u'mohammed', u'puts', u'come', u'tell', u'going', u'rahim', u'tells', u'heartbreaking', u'story', u'one', u'woman', u'found', u'lives', u'room', u'three', u'children', u'sex', u'three', u'children', u'room', u'makes', u'stand', u'separate', u'corners', u'according', u'rahim', u'mohammed', u'women', u'encounter', u'say', u'driven', u'prostitution', u'desperate', u'desire', u'survival', u'dangerously', u'violent', u'unforgiving', u'circumstances', u'iraq', u'took', u'path', u'pleased', u'rahim', u'says', u'karima', u'says', u'sees', u'children', u'food', u'table', u'able', u'convince', u'worth', u'everything', u'children', u'beauty', u'life', u'without', u'cannot', u'live', u'says', u'would', u'never', u'allow', u'daughter', u'would', u'rather', u'marry', u'karima', u'last', u'happy', u'memory', u'late', u'husband', u'family', u'able', u'shoulder', u'hardships', u'life', u'today', u'iraq', u'together', u'suha', u'says', u'young', u'girl', u'dreamed', u'doctor', u'mom', u'boasting', u'potential', u'career', u'life', u'taken', u'dream', u'like', u'born', u'ever', u'blood', u'says', u'family', u'survive', u'eats', u'away', u'lay', u'pillow', u'brain', u'spinning', u'comes', u'back', u'watching', u'movie', u'mail', u'friend'], tags=[6]), TaggedDocument(words=[u'washington', u'cnn', u'white', u'house', u'press', u'secretary', u'tony', u'snow', u'undergoing', u'treatment', u'cancer', u'step', u'post', u'september', u'replaced', u'deputy', u'press', u'secretary', u'dana', u'perino', u'white', u'house', u'announced', u'friday', u'white', u'house', u'press', u'secretary', u'tony', u'snow', u'step', u'post', u'september', u'president', u'bush', u'told', u'reporters', u'friday', u'sadly', u'accept', u'snow', u'resignation', u'flanked', u'snow', u'perino', u'white', u'house', u'press', u'room', u'president', u'spoke', u'warmly', u'departing', u'press', u'secretary', u'joy', u'watch', u'spar', u'bush', u'told', u'reporters', u'watch', u'announcement', u'snow', u'leaving', u'bush', u'said', u'certain', u'two', u'things', u'regard', u'snow', u'battle', u'cancer', u'win', u'bush', u'said', u'solid', u'contributor', u'society', u'turning', u'snow', u'president', u'said', u'love', u'wish', u'best', u'snow', u'speaking', u'bush', u'start', u'daily', u'white', u'house', u'news', u'conference', u'said', u'leaving', u'earn', u'money', u'took', u'big', u'pay', u'cut', u'said', u'left', u'previous', u'jobs', u'anchor', u'political', u'analyst', u'fox', u'news', u'according', u'washington', u'post', u'snow', u'makes', u'white', u'house', u'spokesman', u'family', u'took', u'loan', u'started', u'job', u'loan', u'gone', u'job', u'really', u'dream', u'blast', u'enormous', u'amount', u'fun', u'satisfaction', u'snow', u'said', u'said', u'would', u'continue', u'speak', u'issues', u'would', u'radio', u'anticipate', u'full', u'time', u'anchor', u'duties', u'snow', u'said', u'received', u'great', u'satisfaction', u'talking', u'people', u'illness', u'snow', u'cancer', u'diagnosed', u'first', u'time', u'february', u'colon', u'removed', u'six', u'months', u'treatment', u'doctors', u'said', u'cancer', u'remission', u'perino', u'announced', u'march', u'snow', u'cancer', u'recurred', u'doctors', u'removed', u'growth', u'abdomen', u'day', u'sources', u'told', u'cnn', u'two', u'weeks', u'ago', u'snow', u'planning', u'leave', u'job', u'possibly', u'early', u'september', u'bush', u'tapped', u'snow', u'replace', u'scott', u'mcclellan', u'april', u'snow', u'anchor', u'fox', u'news', u'sunday', u'political', u'analyst', u'fox', u'news', u'channel', u'joined', u'also', u'hosted', u'tony', u'snow', u'show', u'fox', u'news', u'radio', u'thursday', u'snow', u'told', u'cnn', u'health', u'improving', u'citing', u'two', u'medical', u'tests', u'month', u'found', u'cancer', u'spread', u'tumors', u'stable', u'growing', u'snow', u'said', u'results', u'mri', u'cat', u'scan', u'new', u'growths', u'health', u'good', u'press', u'secretary', u'whose', u'hair', u'turned', u'gray', u'chemotherapy', u'treatment', u'said', u'black', u'hair', u'expected', u'grow', u'back', u'month', u'also', u'putting', u'weight', u'said', u'returning', u'day', u'vacation', u'actually', u'feel', u'good', u'health', u'situation', u'snow', u'said', u'friday', u'see', u'oncologist', u'decide', u'minor', u'forms', u'chemotherapy', u'start', u'maintenance', u'treatment', u'mail', u'friend'], tags=[7]), TaggedDocument(words=[u'washington', u'cnn', u'awaits', u'crucial', u'progress', u'report', u'iraq', u'president', u'bush', u'try', u'put', u'twist', u'comparisons', u'war', u'vietnam', u'invoking', u'historical', u'lessons', u'conflict', u'argue', u'pulling', u'president', u'bush', u'pauses', u'tuesday', u'news', u'conference', u'north', u'american', u'leaders', u'summit', u'canada', u'wednesday', u'kansas', u'city', u'missouri', u'bush', u'tell', u'members', u'veterans', u'foreign', u'wars', u'people', u'argued', u'real', u'problem', u'america', u'presence', u'would', u'withdraw', u'killing', u'would', u'end', u'according', u'speech', u'excerpts', u'released', u'tuesday', u'white', u'house', u'three', u'decades', u'later', u'legitimate', u'debate', u'got', u'vietnam', u'war', u'left', u'bush', u'say', u'whatever', u'position', u'debate', u'one', u'unmistakable', u'legacy', u'vietnam', u'price', u'america', u'withdrawal', u'paid', u'millions', u'innocent', u'citizens', u'whose', u'agonies', u'would', u'add', u'vocabulary', u'new', u'terms', u'like', u'boat', u'people', u'education', u'camps', u'killing', u'fields', u'president', u'say', u'president', u'also', u'make', u'argument', u'withdrawing', u'vietnam', u'emboldened', u'today', u'terrorists', u'compromising', u'credibility', u'citing', u'quote', u'qaeda', u'leader', u'osama', u'bin', u'laden', u'american', u'people', u'would', u'rise', u'iraq', u'war', u'way', u'rose', u'war', u'vietnam', u'according', u'excerpts', u'home', u'argue', u'withdrawal', u'vietnam', u'carried', u'price', u'american', u'credibility', u'terrorists', u'see', u'things', u'differently', u'bush', u'say', u'tuesday', u'democratic', u'senate', u'majority', u'leader', u'harry', u'reid', u'said', u'president', u'bush', u'attempt', u'compare', u'war', u'iraq', u'past', u'military', u'conflicts', u'east', u'asia', u'ignores', u'fundamental', u'difference', u'two', u'nation', u'misled', u'bush', u'administration', u'effort', u'gain', u'support', u'invasion', u'iraq', u'false', u'pretenses', u'leading', u'one', u'worst', u'foreign', u'policy', u'blunders', u'history', u'president', u'continues', u'stay', u'course', u'failed', u'strategy', u'iraq', u'paid', u'taxpayers', u'american', u'lives', u'lost', u'still', u'political', u'solution', u'within', u'iraqi', u'government', u'time', u'change', u'direction', u'iraq', u'congress', u'work', u'fall', u'white', u'house', u'billing', u'speech', u'along', u'another', u'address', u'next', u'week', u'american', u'legion', u'effort', u'provide', u'broader', u'context', u'debate', u'upcoming', u'iraq', u'progress', u'report', u'gen', u'david', u'petraeus', u'top', u'military', u'commander', u'ryan', u'crocker', u'ambassador', u'baghdad', u'president', u'bush', u'frequently', u'asked', u'lawmakers', u'american', u'people', u'withhold', u'judgment', u'troop', u'surge', u'iraq', u'report', u'comes', u'september', u'watch', u'bush', u'criticize', u'iraqi', u'government', u'closely', u'watched', u'capitol', u'hill', u'particularly', u'republicans', u'nervous', u'political', u'fallout', u'increasingly', u'unpopular', u'war', u'earlier', u'month', u'defense', u'secretary', u'robert', u'gates', u'said', u'would', u'wait', u'report', u'deciding', u'drawdown', u'troops', u'iraq', u'might', u'begin', u'bush', u'speeches', u'wednesday', u'next', u'week', u'latest', u'series', u'attempts', u'white', u'house', u'try', u'reframe', u'debate', u'iraq', u'public', u'support', u'war', u'continues', u'sag', u'recent', u'cnn', u'opinion', u'research', u'corporation', u'poll', u'found', u'almost', u'two', u'thirds', u'americans', u'percent', u'oppose', u'iraq', u'war', u'percent', u'say', u'even', u'petraeus', u'reports', u'progress', u'change', u'opinion', u'poll', u'also', u'found', u'great', u'deal', u'skepticism', u'report', u'percent', u'said', u'trust', u'petraeus', u'give', u'accurate', u'assessment', u'situation', u'iraq', u'addition', u'analogy', u'vietnam', u'bush', u'wednesday', u'speech', u'invoke', u'historical', u'comparisons', u'asia', u'including', u'defeat', u'occupation', u'japan', u'world', u'war', u'korean', u'war', u'according', u'excerpts', u'aftermath', u'japan', u'surrender', u'many', u'thought', u'naive', u'help', u'japanese', u'transform', u'democracy', u'critics', u'argued', u'people', u'simply', u'fit', u'freedom', u'bush', u'say', u'today', u'defiance', u'critics', u'japan', u'stands', u'one', u'world', u'great', u'free', u'societies', u'speaking', u'korean', u'war', u'bush', u'note', u'time', u'critics', u'argued', u'war', u'futile', u'never', u'sent', u'troops', u'america', u'intervention', u'divisive', u'home', u'true', u'korean', u'war', u'share', u'challenges', u'america', u'never', u'broke', u'word', u'bush', u'say', u'without', u'america', u'intervention', u'war', u'willingness', u'stick', u'south', u'koreans', u'war', u'millions', u'south', u'koreans', u'would', u'living', u'brutal', u'repressive', u'regime', u'mail', u'friend'], tags=[8]), TaggedDocument(words=[u'washington', u'cnn', u'remaining', u'hope', u'finding', u'six', u'men', u'trapped', u'almost', u'month', u'utah', u'coal', u'mine', u'alive', u'federal', u'official', u'said', u'saturday', u'isaac', u'arellano', u'holds', u'candle', u'sings', u'fundraiser', u'miners', u'tuesday', u'price', u'utah', u'past', u'days', u'mine', u'safety', u'health', u'administration', u'exhausted', u'known', u'options', u'attempt', u'reach', u'six', u'miners', u'richard', u'stickler', u'head', u'agency', u'said', u'statement', u'thoughts', u'prayers', u'dedicated', u'professionals', u'msha', u'families', u'sympathy', u'failed', u'efforts', u'also', u'came', u'saturday', u'white', u'house', u'last', u'night', u'difficult', u'decision', u'made', u'end', u'search', u'president', u'bush', u'said', u'statement', u'laura', u'deeply', u'saddened', u'tragedy', u'continue', u'pray', u'families', u'men', u'labor', u'secretary', u'elaine', u'chao', u'called', u'ordeal', u'heartbreaking', u'grueling', u'around', u'clock', u'rescue', u'operation', u'claimed', u'three', u'lives', u'injured', u'six', u'others', u'also', u'taken', u'tremendous', u'toll', u'many', u'brave', u'rescuers', u'local', u'community', u'thoughts', u'prayers', u'chao', u'said', u'statement', u'drilling', u'seven', u'holes', u'mine', u'tunnels', u'mountaintop', u'sign', u'miners', u'microphones', u'picked', u'sound', u'men', u'see', u'timeline', u'rescue', u'efforts', u'tests', u'showed', u'underground', u'oxygen', u'levels', u'low', u'sustain', u'human', u'life', u'basically', u'told', u'families', u'point', u'time', u'run', u'options', u'stickler', u'said', u'news', u'conference', u'late', u'friday', u'consulted', u'people', u'consulted', u'technical', u'support', u'pittsburgh', u'consulted', u'private', u'consultants', u'terms', u'said', u'basically', u'information', u'gleaned', u'past', u'nearly', u'four', u'weeks', u'terms', u'conditions', u'found', u'terms', u'air', u'readings', u'found', u'everything', u'else', u'know', u'else', u'put', u'hole', u'get', u'information', u'see', u'photos', u'rescue', u'mission', u'public', u'statements', u'saturday', u'bob', u'murray', u'president', u'ceo', u'murray', u'mining', u'owner', u'crandall', u'canyon', u'mine', u'outspoken', u'face', u'rescue', u'operation', u'first', u'three', u'weeks', u'largely', u'disappeared', u'public', u'view', u'federal', u'officials', u'became', u'spokesmen', u'one', u'murray', u'mining', u'present', u'friday', u'news', u'conference', u'done', u'finished', u'attorney', u'families', u'said', u'according', u'saturday', u'edition', u'salt', u'lake', u'tribune', u'hard', u'bitter', u'pill', u'families', u'quite', u'tears', u'shed', u'newspaper', u'quotes', u'colin', u'king', u'saying', u'men', u'trapped', u'collapse', u'august', u'known', u'whether', u'survived', u'cave', u'efforts', u'reach', u'suspended', u'days', u'later', u'two', u'rescuers', u'federal', u'mining', u'official', u'killed', u'six', u'people', u'injured', u'second', u'collapse', u'tried', u'tunnel', u'horizontally', u'toward', u'area', u'men', u'working', u'murray', u'said', u'last', u'week', u'search', u'effort', u'would', u'stop', u'signs', u'life', u'found', u'sixth', u'hole', u'pressure', u'families', u'however', u'agreed', u'try', u'one', u'time', u'families', u'wanted', u'officials', u'drill', u'hole', u'large', u'enough', u'send', u'rescue', u'capsule', u'effort', u'lower', u'robotic', u'device', u'seventh', u'hole', u'called', u'long', u'shot', u'official', u'msha', u'stickler', u'said', u'hole', u'drilled', u'crandall', u'canyon', u'mine', u'thursday', u'problems', u'robotic', u'camera', u'teams', u'trying', u'lower', u'work', u'resumed', u'friday', u'time', u'fourth', u'hole', u'camera', u'could', u'descend', u'feet', u'said', u'basically', u'saw', u'really', u'much', u'quite', u'bit', u'mud', u'water', u'coming', u'hole', u'really', u'farther', u'seven', u'feet', u'said', u'latest', u'try', u'addition', u'roof', u'sagging', u'families', u'asked', u'many', u'many', u'questions', u'answered', u'best', u'could', u'basically', u'coming', u'conclusion', u'run', u'options', u'murray', u'said', u'last', u'saturday', u'already', u'filed', u'paperwork', u'federal', u'regulators', u'permanently', u'close', u'seal', u'crandall', u'canyon', u'mine', u'never', u'come', u'back', u'evil', u'mountain', u'said', u'friends', u'family', u'identified', u'six', u'missing', u'miners', u'luis', u'hernandez', u'manuel', u'sanchez', u'kerry', u'allred', u'carlos', u'payan', u'brandon', u'phillips', u'erickson', u'mail', u'friend'], tags=[9])]```
tarun-t commented 6 years ago

Hi @menshikh-iv, the error came from using

from random import shuffle
model.train(shuffle(tagged_docs),  total_examples=model.corpus_count, epochs=10)

The below usage doesn't cause any issue.

model.train(tagged_docs, total_examples=model.corpus_count, epochs=10)

I apologize for the above mistake.

menshikh-iv commented 6 years ago

@tarun-t :+1: