Metrika:
Koristiće se Rouge-1, Rouge-2 i Rouge-L metrike.
Validacija:
Uzeće se 50 epizoda za test skup(2 epizode iz svake sezone), a ostalo će se koristiti za treniranje.
Uspeh rezultujućih modela će se meriti gorepomenutim metrikama.
Dodatno će se smatrati uspehom ukoliko u generisanoj epizodi Kenny umre.
Članovi tima: Petar Kupusarević, SW57/2019, Grupa 4
Asistent: Branislav Anđelić
Problem: Rešava se problem generisanja teksta South Park epizode koristeći Transformer modela.
Algoritam: Unapred obučen Transformer model za generisanje teksta(verovatno GPT-2) će se dodatno trenirati sa podacima iz dataset-a.
Podaci: ~300 epizoda, 95k rečenica https://www.kaggle.com/datasets/mustafacicek/south-park-scripts-dataset
Metrika: Koristiće se Rouge-1, Rouge-2 i Rouge-L metrike.
Validacija: Uzeće se 50 epizoda za test skup(2 epizode iz svake sezone), a ostalo će se koristiti za treniranje. Uspeh rezultujućih modela će se meriti gorepomenutim metrikama. Dodatno će se smatrati uspehom ukoliko u generisanoj epizodi Kenny umre.