Problem koji se rešava: Klasifikovanje transakcija kreditnih kartica kao validnih ili nevalidnih sa što većim stepenom uspešnosti
Algoritmi:
Za učenje modela biće korišćeno nekoliko klasifikacionih algoritama:
1) Decision tree
2) Random forest
3) SVM
4) Naive Bayes
Pored klasifikacionih algoritama, biće korišćen i jedan algoritam baziran na konvolucionim neuronskim mrežama (sekvencijalni CNN model).
Podaci:
Izabrani skup podataka koji će biti korišćen za treniranje modela je Credit Card Fraud Detection (https://www.kaggle.com/datasets/mlg-ulb/creditcardfraud). Kako u datom skupu podataka ima znatno veći broj validnih od nevalidnih transakcija(odnos 99:1), pre samog učenja modela biće odradjen klasičan undersampling i oversampling sa akcentom na SMOTE tehnici. U pretprocesiranju će biti korišćene 3 tehnike (undersampling, klasičan oversampling i SMOTE).
Metrike:
Metriku koja će biti korišćena za poređenje dobijenih rezultata je metrika koja opisuje tačnost, preciznost, osetljivost i F1 score.
Validacija rešenja:
Diskusijom i poredjenjem dobijenih rezultata ćemo utvrditi stepen uspešnosti treniranja modela korišćenjem gore navedenih algoritama.
Članovi tima: Zorica Vuković SW21/2019 (grupa 2), Srdjan Djurić SW63/2019 (grupa 4)
Asistent: Aleksandar Lukić, Branislav Andjelić
Problem koji se rešava: Klasifikovanje transakcija kreditnih kartica kao validnih ili nevalidnih sa što većim stepenom uspešnosti
Algoritmi: Za učenje modela biće korišćeno nekoliko klasifikacionih algoritama: 1) Decision tree 2) Random forest 3) SVM 4) Naive Bayes Pored klasifikacionih algoritama, biće korišćen i jedan algoritam baziran na konvolucionim neuronskim mrežama (sekvencijalni CNN model).
Podaci: Izabrani skup podataka koji će biti korišćen za treniranje modela je Credit Card Fraud Detection (https://www.kaggle.com/datasets/mlg-ulb/creditcardfraud). Kako u datom skupu podataka ima znatno veći broj validnih od nevalidnih transakcija(odnos 99:1), pre samog učenja modela biće odradjen klasičan undersampling i oversampling sa akcentom na SMOTE tehnici. U pretprocesiranju će biti korišćene 3 tehnike (undersampling, klasičan oversampling i SMOTE).
Metrike: Metriku koja će biti korišćena za poređenje dobijenih rezultata je metrika koja opisuje tačnost, preciznost, osetljivost i F1 score.
Validacija rešenja: Diskusijom i poredjenjem dobijenih rezultata ćemo utvrditi stepen uspešnosti treniranja modela korišćenjem gore navedenih algoritama.