ftn-ai-lab / nm-2023

Neuronske mreže 2023/2024
MIT License
1 stars 0 forks source link

Image inpainting #20

Open BoKna031 opened 8 months ago

BoKna031 commented 8 months ago

Tim: Božidar Arsić E2 82/2021

Github repozitorijum: https://github.com/BoKna031/Image_inpainting

Definicija problema: Image inpainting je proces digitalne obrade slika u kojem se oštećene ili nedostajuće delove slike obnavljaju na temelju okolnih informacija ili referenci. Cilj je obnoviti nedostajuće dijelove slike na način koji je vizualno dosledan i koji zadržava kontekst i strukturu originalne slike. Oštećenja mogu biti rezultat različitih problema poput oštećenja na fotografijama, uklanjanja objekata iz slike ili bilo kakvih drugih vrsta nedostataka. Algoritmi za image inpainting koriste se u različitim područjima, uključujući računarski vid, digitalnu obradu slika i grafiku.

Skup podataka: Za skup podataka se korsiti https://www.kaggle.com/datasets/amanara/photos

U navedenom skupu se nalaze odvojeni trening I test skup slika. Test skup sadrži oko 210 slika, dok trening skup sadrži po 1750 za svaku od 4 klase životinja (mačka, pas, slon I tigar). Skup podataka sadrži originalne slike, maskirane slike I pozicije na kojima se maska nalazi.

Metodologija: U projektu će se uporediti rezultati dva modela CNN I RNN tako što će se prvobitno određeni delovi slike maskirati.

Metod evaluacije: Poređenje se radi koristeći dve vrste funkcija gubitka, obe se računaju piksel po piksel za područje koje treba popuniti. Koriste se Euclidean Loss I Softmax Loss

Link do rada na koji se oslanjamo: http://cs231n.stanford.edu/reports/2016/pdfs/211_Report.pdf

vdragan1993 commented 8 months ago
  1. Neki delovi prijave su pisani u množini. Da li projekat radi jedna ili više osoba?
  2. Da li će se CNN i RNN modeli razvijati od nule ili će biti oslanjanje na neke postojeće modele? Ako je u pitanju ovo drugo, potrebno ih je navesti.
  3. U evaluaciji nije jasno šta će se porediti.
bozidararsic-accelex commented 7 months ago
  1. Radi jedna osoba
  2. Modeli ce se kreirati od nule
  3. Porede se pikseli izgenerisanog dela slike sa istim delom originalne slike koristeci Euclidean Loss i Softmax Loss (koristice se po dva razlicita pristupa za oba modela kao sto je to opisano u radu na koji se oslanjam)
vdragan1993 commented 7 months ago

Tema odobrena. Srećan rad.