ftn-ai-lab / ori-2017-siit

Materijali za predmet Osnovi računarske inteligencije
0 stars 2 forks source link

Prepoznavanje teksta sa slike i njegovo citanje #5

Open becejacM opened 7 years ago

becejacM commented 7 years ago

@ivan7792 Becejac Milana, SW10/2014 (grupa 2)

Opis problema: Data je slika na kojoj se nalazi tekst u vise redova. Potrebno je razdvojiti redove, a zatim svaki red razdvojiti na slova. Slova se, potom, grupisu u reci(stringove) koje se izgovaraju.

Algoritmi koji ce se koristiti:

  1. Za prepoznavanje slova sa slike:
    • Neural Network
  2. Za izdvajanje slova sa slike:
    • Rucno napravljen algoritam
  3. Za razdvajanje reci:
    • K means

Metrike za poredjenje performansi algoritma:

  1. procenat tacnosti pogadjanja slova sa slike na osnovu rucno napravljenih testnih podataka
  2. procenat tacno izgovorenih reci. Procenat se odredjuje tako sto postoji testni skup sa pravilno napisanim recima iz teksta koji se poredi sa skupom reci koje su detektovane iz teksta. Ovo ujedno predstvalja nacin validacije resenja.

Dataset-ovi za treniranje i testiranje ce biti rucno napravljeni. Dataset-ovi ce imati slike velikih slova enegleske abecede.

GitHub repozitorijum: https://github.com/becejacM/ORIProject

ivan7792 commented 7 years ago

Tema može biti dosta obimna, ali je istu rešavao veliki broj studenata prethodnih godina, dok rešenja postoje i na javnim repozitorijumima drugih predmeta (recimo https://github.com/ftn-ai-lab/sc-2015/blob/master/v4/v4-reseno.ipynb).

Zbog toga je predlog da odradite samo prepoznavanje slova na slici, tako što ćete ručno napisati samu proceduru pretrage regiona, a ne da koristite openCV (obična pretraga matrice). Kada izdvojite slovo sa slike, možete ga poslati na neurosnku mrežu (može i ona sa vežbi) i prepoznati koje je slovo u pitanju. Pretpostavljam da ćete se na ovakvoj temi mnogo bolje snaći i da će biti manje komplikovano. Ulazna slika može odmah biti crno-bela tako da ne morate da vršite obradu slike. Ali ako ipak želite da odradite ono što ste specificirali, može i to, ali vodite računa da ne kopirate sav kod sa drugih repozitorijuma da ne bi rizikovali da isti bude detektovan kao plagiran. Razmislite šta ćete raditi i odgovorite mi u naredna 24h.

becejacM commented 7 years ago

Radicu onda rucno prepoznavanje regiona. Samo, da li to znaci da redove razdvajam rucno, pa njih na slova ili ste mislili da imam samo 1 red pa njega razdvajam na slova?