Problem koji se rješava:
Cilj je pretpostaviti cijenu telefona na osnovu karakteristika poput jačine baterije,količine interne memorije,broj jezgara procesora...
Dakle, imamo 20 obilježja za svaki telefon. U datasetu posljednja kolona predstavlja price_range, tj. opseg cijene telefona koji uzima vrijednosti {0,1,2,3} u zavisnosti od svoje cijene. U našem problemu ovo će da bude izlaz koji pokušavamo da predvidimo tj. da klasifikujemo kom opsegu cijena pripada.
Podaci:
Skup podataka koji će biti korišćen za treniranje je Mobile price classification i nalazi se na linku - https://www.kaggle.com/datasets/iabhishekofficial/mobile-price-classification .
Na početku će biti odradjeno pretprocesiranje podataka i podjela na skup za treniranje i testiranje podataka, gdje će se za testiranje podataka koristiti 10%, a za treniranje 90% podataka.
Metrike:
Metrike koja će se koristiti za poređenje dobijenih rezultata su tačnost, preciznost, osjetljivost i F1 score.
Validacija rješenja:
Za validaciju rješenja koristiće se testirajući skup podataka i vršiće se poređenje uspješnosti algoritama.
Članovi tima: SW 7/2019 Ivana Kašiković (grupa 1)
Asistent: Branislav Andjelić
Problem koji se rješava: Cilj je pretpostaviti cijenu telefona na osnovu karakteristika poput jačine baterije,količine interne memorije,broj jezgara procesora... Dakle, imamo 20 obilježja za svaki telefon. U datasetu posljednja kolona predstavlja price_range, tj. opseg cijene telefona koji uzima vrijednosti {0,1,2,3} u zavisnosti od svoje cijene. U našem problemu ovo će da bude izlaz koji pokušavamo da predvidimo tj. da klasifikujemo kom opsegu cijena pripada.
Algoritmi:
Logistička regresija Naivni Bayes-ov klasifikator K- najbližih susjeda (KNN)
Podaci: Skup podataka koji će biti korišćen za treniranje je Mobile price classification i nalazi se na linku - https://www.kaggle.com/datasets/iabhishekofficial/mobile-price-classification . Na početku će biti odradjeno pretprocesiranje podataka i podjela na skup za treniranje i testiranje podataka, gdje će se za testiranje podataka koristiti 10%, a za treniranje 90% podataka.
Metrike: Metrike koja će se koristiti za poređenje dobijenih rezultata su tačnost, preciznost, osjetljivost i F1 score.
Validacija rješenja: Za validaciju rješenja koristiće se testirajući skup podataka i vršiće se poređenje uspješnosti algoritama.