Open ptakopysk opened 9 months ago
Bendík diplomka: https://dspace.cvut.cz/handle/10467/108779
Možná pomocí GPT4 to neni vono. Zkoušeli jsme ÚFAL KER ale asi keywordy neni to co chcem. Asi kouknout na HuggingFace co tam je za modely který třeba určujou téma textu? (Klidně na angličtině, můžem to protáhnout překladem, to na téma asi nevadí.)
V tom článku On the power of special-purpose GPT models to create and evaluate new poetry in old styles, tam používají gpt-3.5 a promptují ho sadou kategorií ze kterých má vybrat.
Zkouším to teď pomocí mistralu a něco to dělá.
Stav a myšlenky a plány k tomu po dnešku:
/net/projects/EduPo/data/ccv-new-summary
Shrnutí obsahu básně může bejt dobrá cesta k vyhodnocování kvality a smysluplnosti básně, asi.
Je to pomoci Mixtral-Instruct 8x7B! cswikimistral nefuguje dobře.
české a anglické vygenerované summaries pomocí GPT4 pro 30 náhodně vybraných básní jsou v /net/projects/EduPo/data/ccv-new-summary-gpt4
Přeložil jsem Lindatem pro tadytěch 30 básní summaries od Michala Lindatem a přidal to do těch Michalovo Jsonů. Jednoduché vylistítko a zobrazítko zde: https://ufallab.ms.mff.cuni.cz/cgi-bin/rosa/edupo/scripts/show_poems.sh
...a navíc jsme teď ještě přidali Lindat překlady EN summaries do těch Davidovo fajlů, takže každej gpt4 fajl má teď 3 summaries: vygenerovanou EN, vygenerovanou CS, a EN přeloženou do CS.
Jednak bychom tím možná mohli měřit smysluplnost básně --- pokud je smysluplná tak by asi měla mít jasnější téma...?
A jednak by se nám tio mohlo hodit jako anotace datasetu, abychom pak mohli fine-tunovat model, který bude generovat báseň na dané téma.