ftn-ai-lab / ori-2022-siit

0 stars 0 forks source link

Generisanje South Park Epizode #30

Open Cabbagito opened 2 years ago

Cabbagito commented 2 years ago

Članovi tima: Petar Kupusarević, SW57/2019, Grupa 4

Asistent: Branislav Anđelić

Problem: Rešava se problem generisanja teksta South Park epizode koristeći Transformer modela.

Algoritam: Unapred obučen Transformer model za generisanje teksta(verovatno GPT-2) će se dodatno trenirati sa podacima iz dataset-a.

Podaci: ~300 epizoda, 95k rečenica https://www.kaggle.com/datasets/mustafacicek/south-park-scripts-dataset

Metrika: Koristiće se Rouge-1, Rouge-2 i Rouge-L metrike.

Validacija: Uzeće se 50 epizoda za test skup(2 epizode iz svake sezone), a ostalo će se koristiti za treniranje. Uspeh rezultujućih modela će se meriti gorepomenutim metrikama. Dodatno će se smatrati uspehom ukoliko u generisanoj epizodi Kenny umre.

bandjeo commented 2 years ago

Tema odobrena. Ostavite link ka GitHub repozitorijumu projekta. Srećan rad.

Cabbagito commented 2 years ago

https://github.com/Cabbagito/Generating-South-Park-Episodes