Ezhil-Language-Foundation / open-tamil

Open Source Tamil NLP Tools - தமிழ் இயற்கை மொழி பகுப்பாய்வு நிரல்தொகுப்பு
http://tamilpesu.us
MIT License
266 stars 82 forks source link

Syllable extractor for word #214

Open arcturusannamalai opened 4 years ago

arcturusannamalai commented 4 years ago

Tamil letter extraction is available in Open-Tamil: tamil.utf8.get_letters, or tamil.tace16.get_letters; however we need a API method to extract syllables from Tamil word for homophone, TTS processing, spelling checker applications.

This could use SOUNDEX algorithm, rule-based list etc.

e.g.

கல்வி = கல்-வி அறிவியல் = அறி - வி - யல் குத்தாட்டம் = குத்-தாட்-டம்