Ezhil-Language-Foundation / open-tamil

Open Source Tamil NLP Tools - தமிழ் இயற்கை மொழி பகுப்பாய்வு நிரல்தொகுப்பு
http://tamilpesu.us
MIT License
264 stars 80 forks source link

Unigram data from Project Madurai, Wikipedia #173

Open arcturusannamalai opened 6 years ago

arcturusannamalai commented 6 years ago

Collect Unigram data from Project Madurai, Wikipedia

arcturusannamalai commented 6 years ago

First commit b9b368545f70b5b0c7d894cb66349b8baa5a5679 using data from உளிவீரன் https://github.com/Ezhil-Language-Foundation/uliveeran