morfo_segmentace
poloautomatická segmentace textu na morfémy + výpočet dat pro MAL
Moje pracovní verze bez pořádných popisků či normálně pojmenovaných proměnných :D
plán:
- sloučit skripty pro manuální a automatickou segmentaci
- umožnit přidávat nová segmentovaná slova přímo do celého morfo-slovníku
- umožnit ukládání segmentovaného textu do jednoho sloupce (co řádek, to segmentované slovo textu, ne lineární segmentovaný text)
- vytvořit nějakou hezčí reprezentaci slovníku než je ten soubor můj_slovník.csv
- sloučit skripty pro počítání dat pro MAL pro types a tokens
- vložit (sem nebo jinam?) skript pro počítání vážených průměrů a spouštění pomocného programu NLREG pro výpočet MALu