ftn-ai-lab / ori-2021-siit

0 stars 0 forks source link

Klasifikacija izgovorenih brojeva (cifara) #22

Open Lule99 opened 3 years ago

Lule99 commented 3 years ago

Članovi tima:

Luka Kureljušić, SW-23-2018, Grupa 2

Asistent:

Aleksandar Lukić

Problem koji se rešava:

Klasifikacija cifara 0-9 iz audio fajlova.

Algoritam:

Transformacija audio fajla u spektrogram, i dalja klasifikacija dobijene slike konvolucionom neuronskom mrežom.

Dataset:

Za dataset koristiće se podskup iz "Tensorflow speech commands" koji sadrži samo cifre: http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz

Metrika za merenje performanse:

Procenat uspešnosti klasifikovanih slika u odnosu na test podatke.

Validacija rešenja:

Dataset će biti podeljen na trening (75%), validacioni(15%) i test (10%) skup.

Repozitorijum:

https://github.com/Lule99/DigitRecognition

lukic-aleksandar commented 3 years ago

Tema odobrena, ostavite link ka github repozitorijumu. Srećan rad.