ftn-ai-lab / ri-2023-siit

0 stars 0 forks source link

Prepoznavanje melodija nastalih pevušenjem #3

Open coma007 opened 1 year ago

coma007 commented 1 year ago

Članovi tima

SV 18/2020 Milica Sladaković (grupa 2) SV 27/2020 Nemanja Dutina (grupa 2)

Asistent

Branislav Anđelić

Problem koji se rešava

Često se dešava da, ukoliko zaboravimo tekst neke pesme, težimo da pronađemo tu pesmu koristeći se pretraživačima baziranim na tekstu. U takvom pristupu, veliko ograničenje može biti to što ne znamo jezik teksta pesme ili se čak ne sećamo teksta, već samo melodije. Jedno od rešenja ovakvog problema bi bilo da se pesma može prepoznati na osnovu melodije, pa čak i ako je ta melodija nastala mumljanjem ili zviždanjem.

Cilj projekta je kreirati klasifikator ovakvih melodija. Za ovaj probelm postoje veoma dobro razvijena rešenja, a jedan od softvera koji rešavaju sličan problem je Shazam.

Algoritmi

Podaci koji se koriste

Početni izvor podataka će biti melodije iz nekoliko poznatih filmova, a ti podaci se mogu pronaći ovde. Navedeni podaci su organizovani u osam kategorija, gde su kategorije sledeće numere: Let it go (Frozen), Hakuna Matata (The Lion King), Mamma Mia (Mamma Mia!), Tema iz filma Pink Panter, Hedwig’s Theme (Harry Potter), Tema iz filma Singing in the Rain, This is me (The Greatest Showman) i Imperial March (Star Wars).

Nije isključeno da će se skup podataka naknadno proširiti, ukoliko to bude moguće. Pored podataka dostupnih na internetu, postoji mogućnost da će se manuelno skupljati podaci, snimanjem glasa.

Metrika za merenje performansi

Metrika će biti preciznost prepoznavanja, odnosno procenat uspešnosti klasifikacije.

Validacija rešenja

Skup podataka će se podeliti u tri dela: trening (80%), validacioni (10%) i test (10%) skup. Takođe, biće upoređeni i različiti modeli, odnosno algoritmi.

bandjeo commented 1 year ago

Tema odobrena. Ostavite link ka github repozitorijumu.

Srećan ran!

eXtremeNemanja commented 1 year ago

https://github.com/coma007/hummingbird