Open HuidaQ opened 6 years ago
Perhaps, something is wrong with your dataset. This doesn't look good:
Input : Ce morceau de code fournit un aperçu de votre travail , une brève description , et un bouton > Achetez maintenant . </S>
Target: This bit of code provides a preview of your work , a brief description , and a > Buy Now button . </S>
Sample: information taxi that It to <UNK> to <UNK> while work . </S>
Sample cost: 230.718
I tried the default dataset in the prepare_data.py script (parallel-nc-v10), got the same thing.
I'm trying to train a NMT model on commoncrawl data (from http://www.statmt.org/wmt15/translation-task.html). The training seems to be doing fine. A paste of the partial log:
But when I use the translation mode (from https://github.com/mila-udem/blocks-examples/pull/43/files#r62537666), even if I pick a sentence from the training data itself, it'll give me a sequence of '', or 'the', or '' alway. Here's the translation log:
'my_test.fr.tok' file only has 1 line:
Sur la baie de San Antonio vous avez tous commerces , bars et restaurants .
Appreciate any help. Thanks.