Closed ptakopysk closed 8 months ago
Kód viz repo: https://github.com/jinymusim/GPT-Czech-Poet
K rešerším: zjevně jsou zajímavé experimenty které dělá Tomasz ohledně byte language models + related work k tomu + Jindřichův článek proti byte language models :-)
@ptakopysk OpenReview říká, že ten článek nemám právo zobrazit.
Jakou relevanci vidíš v těch byte LM? A nebyl ten Jindřichův článek o char modelech (a ještě možná pro překlad?)?
Zajímavé. Zkouším přiložit PDF: 1490_gpt_czech_poet_generation_of_c.pdf
Jakou relevanci vidíš v těch byte LM? A nebyl ten Jindřichův článek o char modelech (a ještě možná pro překlad?)?
V Byte LM vidím relevanci v tom, že když @jinymusim použil Byte LM, tak mu v několika kritériích vyšly nejlepší výsledky. Respektive nevím, jestli se nějak liší Byte LM a ta použitá Unicode tokenizace, ale myšlenkově je to každopádně podobné, tokenizace na fakt malé jednotky, character nebo byte. (Nevim o čem byl Jidnřichův článek, nečet jsem ho.)
Hotovo, recenzi jsem předal ústně a papírově.
Přečíst článek GPT Czech Poet: Generation of Czech Poetic Strophes with Language Models a napsat na něj podrobnou strukturovanou recenzi: