Detekcija klas dijagrama, odnosno detekcija klasa, veza između klasa, metoda, atributa unutar klase i na osnovu toga bi generisali java kod. Tekst koji bi se nalazio na slikama bio bi ispisan štampanim slovima engleske latinice.
3. Skup podataka
Klas dijagrami koje ćemo sami skicirati i nakon toga uslikati, vršili bi transformacije na slikama kako bi skup podataka bio što obimniji i kako modeli ne bi overfitovali.
4. Metodologija
Za detekciju klasa i veza izmedju njih na skici bi pokušali sa više metoda:
1. piramida slika + sliding window + HOG + SVM + NMS
2. piramida slika + sliding window + CNN koju bi obučili nad našim skupom podataka + NMS
3. R-CNN ili neku od njenih varijacija
Nakon detekcije klasa nad svakim RoI koji predstavlja klasu bismo primenili tehnike OCR-a
kako bi prikupili neophodne podatke za generisanje atributa i metoda.
Pokušali bismo sa više obučenih modela sa Kaggle i Tensorflow Hub-a.
Zatim bismo na osnovu tipa za svaku od detektovanih veza na skici dopunili podatke o klasama.
5. Evaluacija
Skup podataka će se deliti na trening, validacioni i test skup.
Kao meru performansi za detekciju klasa bismo koristili IoU.
Tačnost generisanog koda ćemo proveravati tako što ćemo porediti fajlove sa dobijenim generisanim kodom sa fajlovima u kojima se nalazi generisani kod koji se očekuje.
Time bismo proverili tačnost OCR-a.
1. Tim
2. Definicija problema
3. Skup podataka
4. Metodologija
5. Evaluacija