KaniyamFoundation / ProjectIdeas

A Place to write down the project ideas and to plan them
37 stars 3 forks source link

தமிழ் செய்தித்தாள்களில் இருந்து படங்களை இயந்திரக் கற்றல் கொண்டு பிரித்தல் #188

Open Natkeeran opened 1 year ago

Natkeeran commented 1 year ago

செய்தித்தாள்கள் பல வகையான வரலாற்றுத் தகவல்களை கொண்டு இருக்கின்றன. பல பயனர்களுக்கு, குறிப்பாக வரலாற்றுத் தகவல்களைப் பயன்படுத்துகிறவர்களுக்கு (ஆய்வாளர்கள், ஊடகவியலாளர்கள், செயற்பாட்டாளர்கள்) அவை முக்கிய வளமாக அமைகின்றன. செய்தித்தாள்களில் வரும் படங்களை, அவற்றின் captions உடன் தனியே கால வரிசைப்படி தொகுத்து தருவது, அவற்றின் பயன்பாட்டை மேம்படுத்தும்.

அந்த நோக்கில், பின்வரும் கருவிகள் உருவாக்கப்பட்டுள்ளன: https://github.com/Islandora-Image-Segmentation/Newspaper-Navigator-API https://github.com/LibraryOfCongress/newspaper-navigator

இந்த issue வின் நோக்கி, பின்வரும் கருவிகளை தமிழ் செய்தித்தாள்களுக்கு (எ.கா noolaham.org உள்ள செய்தித்தாள்கள்) பரிசோதித்து பார்க்க வேண்டும். தமிழ் செய்தித்தாள்களுக்கு ஏற்ற மாதிரி நாம் dataset உருவாக்கி, model ஐ மேலும் மேம்படுத்தவேண்டி இருக்கலாம். அதுவும் ஒரு நல்ல பணியாக அமையும்.

இது ஒரு நல்ல மாணவர் செயற்திட்டம் (a good student project).