Potrebno je detektovati šaku sa video kamere i prepoznati koje je to slovo alfabeta ili je razmak,
zatim ispisati reci na ekranu ili u fajl.
Motivacija problema:
Rešenje problema može biti korisno za sporazumevanje gluvo-nemih osoba, koje koriste sign-language
i osoba koje ovaj jezik ne znaju i samim tim pruži ovim osobama više poslovnih mogucnosti i omoguci im lakši život.
Skup podataka:
Skup podataka ce biti ručno napravljen pomoću kamere laptopa. Biće napravljen skup fotografija šake,
koje predstavljaju po jedno slovo alfabeta. Za svako slovo 300-400 fotografija. Takodje, biće napravljen skup fotografija koje predstavljaju razmak i koje ne predstavljaju ništa. Fotografije ce biti učitane i prosedjene neuronskoj mrezi za treniranje(80%) i testiranje(20%).
Metodologija:
Za implementaciju koristiće se Python i njegova biblioteka OpenCV
Za treniranje koristice se Convolution Neural Network
Radi će se prepoznavanje boje koze sa videa priemenom maske sa skin color range-om,
kako bi se detektovala šaka i izdvojila od pozadine. Zatim ce se vršiti predikcija koje je slovo alfabeta
pokazano i formiranje slova i reci.
Metod evaluacije:
Validacija rešenja pomocu testnog skupa slika koje predstavljaju jedan znak, tj jedno slovo azbuke.
Koristice se mera tacnosti(Accurancy) za ocenjivanje kvalitetć modela.
Takodje biće odradjeni i manualani testovi gde će se meriti procenat ispravno prepoznatih slova i procenat uspešno prepoznatih reci.
Primena projektnog resenja:
Projektno rešenje se može primeniti u sistemima za komunikaciju nemih osoba i onih koje to nisu.
Autor:
Definicija problema:
Potrebno je detektovati šaku sa video kamere i prepoznati koje je to slovo alfabeta ili je razmak, zatim ispisati reci na ekranu ili u fajl.
Motivacija problema:
Rešenje problema može biti korisno za sporazumevanje gluvo-nemih osoba, koje koriste sign-language i osoba koje ovaj jezik ne znaju i samim tim pruži ovim osobama više poslovnih mogucnosti i omoguci im lakši život.
Skup podataka:
Skup podataka ce biti ručno napravljen pomoću kamere laptopa. Biće napravljen skup fotografija šake, koje predstavljaju po jedno slovo alfabeta. Za svako slovo 300-400 fotografija. Takodje, biće napravljen skup fotografija koje predstavljaju razmak i koje ne predstavljaju ništa. Fotografije ce biti učitane i prosedjene neuronskoj mrezi za treniranje(80%) i testiranje(20%).
Metodologija:
Za implementaciju koristiće se Python i njegova biblioteka OpenCV
Za treniranje koristice se Convolution Neural Network
Radi će se prepoznavanje boje koze sa videa priemenom maske sa skin color range-om, kako bi se detektovala šaka i izdvojila od pozadine. Zatim ce se vršiti predikcija koje je slovo alfabeta pokazano i formiranje slova i reci.
Metod evaluacije:
Validacija rešenja pomocu testnog skupa slika koje predstavljaju jedan znak, tj jedno slovo azbuke. Koristice se mera tacnosti(Accurancy) za ocenjivanje kvalitetć modela.
Takodje biće odradjeni i manualani testovi gde će se meriti procenat ispravno prepoznatih slova i procenat uspešno prepoznatih reci.
Primena projektnog resenja:
Projektno rešenje se može primeniti u sistemima za komunikaciju nemih osoba i onih koje to nisu.
Git:
https://github.com/becejacM/SOFT-project