KaniyamFoundation / ProjectIdeas

A Place to write down the project ideas and to plan them
37 stars 3 forks source link

Tamil Text Analysis - Tamilcorpus.com #180

Open IngersolNorway opened 2 years ago

IngersolNorway commented 2 years ago

நண்பர்கள் அனைவருக்கும் வணக்கம்

தமிழ் சொற்களை இடமிருந்து வலம் படிப்பதற்கு பதிலாக வலமிருந்து இடம் படித்தால் அரபி சொற்கள் நிறைய இருக்கிறது என்று நீயா-நானா நிகழ்வில் ஒருவர் கூறியிருந்தார்.

அதனை அடிப்படையாக வைத்து ஒரு சொல்லை பின்புறத்திலிருந்து முன்புறம் படித்து அந்த சொல்லுக்கு அதே பொருள் இருக்கும் பிறமொழி சொற்களை பட்டியலிடுவது மிகப்பெரிய ஆய்வுக்கு உரிய செயல் இதனை நாம் இப்போது முன்னெடுத்து இருக்கும் சொல் பகுப்பாய்வு திட்டத்தில் செய்யலாம்

இதனை போல பல பகுப்பாய்வு கீழே இருக்கும் படத்தில் கட்டப்பட்டுள்ளது இவைகள் அனைத்தும் டெக்ஸ்ட் அனாலிசிஸ் டாட் காம் எனும் இணையதளத்தில் ஆங்கிலத்தில் இருக்கிறது. அதனை அப்படியே தமிழுக்கு பயன்படுத்த முடியாது காரணம் தமிழ் எழுத்துரு பல பகுப்பாய்வில் உடைந்துவிடும்.

இவைகளுக்கான பைத்தான் நிரல்கள் இணையத்தில் இலவசமாக கிடைக்கின்றது அவற்றை தமிழுக்கு சற்று மாற்ற வேண்டும். பைத்தான் நிரல் எழுத தெரிந்த நண்பர்கள் எங்களுடன் இணைந்து செயலாற்ற வாருங்கள்

இதில் எதை நீங்கள் எடுத்து செய்யப் போகின்றீர்கள் என்ற எண்களை மட்டும் கூறவும்

  1. Convert Spaces to Tabs
  2. Convert Tabs to Spaces
  3. Remove All Whitespace
  4. Remove All Punctuation
  5. Generate N-grams
  6. Mirror Text
  7. Find All Email Addresses
  8. Find All Web Addresses
  9. Find All Numbers
  10. Split Text
  11. Join Text
  12. Repeat Text
  13. Reverse Text
  14. Truncate Text
  15. Trim Text
  16. Add a Prefix to Text
  17. Add a Suffix to Text
  18. Remove All Empty Lines
  19. Remove All Duplicate Lines
  20. Filter Text Lines
  21. Extract a Text Fragment
  22. Find and Replace Text
  23. Find the Length of Text
  24. Create an Image from Text
  25. Count Text Lines
  26. Add Line Numbers
  27. Quickly create an image from text.
  28. Generate Zalgo Text
  29. Remove Zalgo
  30. Create a Palindrome
  31. Check if Text is a Palindrome
  32. Convert Spaces to Newlines
  33. Convert Newlines to Spaces
  34. Extract Text from HTML
  35. Extract Text from XML
  36. Extract Text from BBCode
  37. Extract Text from JSON
  38. JSON Stringify Text
  39. JSON Unstringify Text
  40. Slash-escape Text
  41. Slash-unescape Text
  42. Increment each letter by next alphabet letter.
  43. Decrement each letter by previous alphabet letter.
  44. Generate Text from a RegExp
  45. Extract RegExp Matches from Text
  46. Test Text with a RegExp
  47. Printf Text
  48. Rotate Text
  49. Flip Text Vertically
  50. Convert Text to Nice Columns
  51. Convert Nice Columns to Text
  52. Generate Text Unigrams
  53. Generate Text Bigrams
  54. Generate Text N-grams
  55. Convert Text to Morse Code
  56. Convert Morse Code to Text
  57. URL-encode Text
  58. URL-decode Text
  59. HTML-encode Text
  60. HTML-decode Text
  61. Base64-encode Text
  62. Base64-decode Text
  63. Convert Text to Binary
  64. Convert Binary to Text
  65. Convert Text to Octal
  66. Convert Octal to Text
  67. Convert Text to Decimal
  68. Convert Decimal to Text
  69. Convert Text to Hex
  70. Convert Hex to Text
  71. Lemmatize Text
  72. Tokenize Text
  73. Create ZigZag Text
  74. Reverse every sentence
  75. Create a Word Cloud

Volunteers Wanted For Tamil Text Analysis, Django Python Postgresql Bootstrap Developers

Forward This To Your Friends

Join Us In Telegram https://t.me/tamilpython

நன்றி

இவண் மின்னச்சன் திரு.இங்கர்சால், நார்வே வள்ளுவர் வள்ளலார் வட்டம் valluvar.vallalar.vattam@gmail.com

mrprajesh commented 2 years ago

If all fine and I can contribute remaining in my free time. Thanks. Some of the above text is used as an input. :smiley:

tshrinivasan commented 2 years ago

அருமை. நன்றி @mrprajesh பிற செயல்களுக்கான நிரல்களும் தருக.

naveenatmit commented 2 years ago

Looks interesting, I'm wondering how much github copilot can solve. I could try sometime later. Any of you have github copilot access already?