Open Lule99 opened 3 years ago
Luka Kureljušić, SW-23-2018, Grupa 2
Aleksandar Lukić
Klasifikacija cifara 0-9 iz audio fajlova.
Transformacija audio fajla u spektrogram, i dalja klasifikacija dobijene slike konvolucionom neuronskom mrežom.
Za dataset koristiće se podskup iz "Tensorflow speech commands" koji sadrži samo cifre: http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz
Procenat uspešnosti klasifikovanih slika u odnosu na test podatke.
Dataset će biti podeljen na trening (75%), validacioni(15%) i test (10%) skup.
https://github.com/Lule99/DigitRecognition
Tema odobrena, ostavite link ka github repozitorijumu. Srećan rad.
Članovi tima:
Asistent:
Problem koji se rešava:
Klasifikacija cifara 0-9 iz audio fajlova.
Algoritam:
Transformacija audio fajla u spektrogram, i dalja klasifikacija dobijene slike konvolucionom neuronskom mrežom.
Dataset:
Za dataset koristiće se podskup iz "Tensorflow speech commands" koji sadrži samo cifre: http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz
Metrika za merenje performanse:
Procenat uspešnosti klasifikovanih slika u odnosu na test podatke.
Validacija rešenja:
Dataset će biti podeljen na trening (75%), validacioni(15%) i test (10%) skup.
Repozitorijum:
https://github.com/Lule99/DigitRecognition