model Helsinki-NLP/opus-mt-en-uk translates some sentences into Russian instead of Ukrainian

Helsinki-NLP / OPUS-MT-train

Training open neural machine translation models

MIT License

323 stars 40 forks source link

code to reproduce:

model_name = "Helsinki-NLP/opus-mt-en-uk" model = MarianMTModel.from_pretrained(model_name) tokenizer = MarianTokenizer.from_pretrained(model_name) batch = tokenizer(["What are you doing?", "Good news for you."], return_tensors="pt", padding=True) gen = model.generate(**batch) result = tokenizer.batch_decode(gen, skip_special_tokens=True) print(result)

Expected output (Ukranian): ['Що ти робиш?', 'Гарні новини для тебе.']

Actual output (Russian): ['Что ты делаешь?', 'Хорошая новость для тебя.']

Helsinki-NLP / OPUS-MT-train

model Helsinki-NLP/opus-mt-en-uk translates some sentences into Russian instead of Ukrainian #66