Klasifikacija vesti na "real" ili "fake" vesti na osnovu njihovog naslova i sadržaja.
Algoritmi
U postupku pretprocesiranja će se ukloniti tzv. stop reči, vršiće se lematizacija sa politikom koja bude davala najbolje rezultate na datom problemu (npr. lematizacija samo određenih vrsta reči) i sl. sa ciljem poboljšanja tačnosti klasifikacije. Tokenizacija će, pored pojedinačnih reči, tokenizovati i susedne reči u jedan token, sa istim ciljem. Na osnovu dataset-a će se obučavati sledeći modeli:
Metrika za ovaj problem će biti tačnost klasifikacije vesti.
Validacija rešenja
Dataset će se podeliti u 3 skupa: skup za obučavanje (najveći udeo početnog dataset-a), validacioni i test skup. Tačni procenti za svaki skup će biti naknadno određeni.
Članovi tima
Asistent
Problem koji se rešava
Algoritmi
Podaci koji se koriste
Metrika za merenje performansi
Validacija rešenja