NO Chinese and Japanese in 12 languages aligned Parallel corpus data （Sentences : 349049）

ajinkyakulkarni14 / TED-Multilingual-Parallel-Corpus

TED parallel Corpora is growing collection of Bilingual parallel corpora, Multilingual parallel corpora and Monolingual corpora extracted from TED talks www.ted.com for 109 world languages.

242 stars 80 forks source link

NO Chinese and Japanese in 12 languages aligned Parallel corpus data （Sentences : 349049） #6

Open zhang-jinyi opened 4 years ago

zhang-jinyi commented 4 years ago

Hi，Mr. Ajinkya Kulkarni,

Thank you for your work. And I find that there are NO Chinese and Japanese in 12 languages aligned Parallel corpus data （Sentences : 349049, [https://github.com/ajinkyakulkarni14/TED-Multilingual-Parallel-Corpus/blob/master/Multilingual_Parallel_Corpus/Multi_lingual_Parallel_corpus_1.zip]）. Please confirm it.

ziyanyang commented 4 years ago

They are in Multi_lingual_Parallel_corpus_2.zip

zhang-jinyi commented 4 years ago

They are in Multi_lingual_Parallel_corpus_2.zip

No, that's not the part I'm talking about.

ajinkyakulkarni14 commented 3 years ago

In the coming six months, this repo will be moved to https://zenodo.org/ with documentation and the addition of more modality in dataset