pelegrinova / morfo_segmentace

poloautomatická segmentace textu na morfémy + výpočet dat pro MAL: pokusy
3 stars 1 forks source link

Náhrada grafémů: odděl od ruční segmentace #28

Open Glutexo opened 2 years ago

Glutexo commented 2 years ago

A doplň sem popis.

Doplněno:

Náhrada grafémů za fonémy je činnost nesouvisející se samotnou morfologickou segmentací. Jedná se o oddělený proces, jenž si zaslouží vlastní skript.

Manuální segmentace v tuto chvíli řeší obojí. Oddělením se zvýší symetrie mezi manuální segmentací, jež v tuto chvíli dělá i substituci, a automatickou, jež očekává již přepsaný text.

Až se skripty naučí pracovat se vstupy a výstupy standardním způsobem, bude možné tyto dva kroky snadno zřetězit.

pelegrinova commented 2 years ago

Prosím o psaní "fonetický" - s uvozovkami. Nejedná se ani náhodou o fonetický přepis, jen mu pro sebe pracovně říkám "fonetický". Spíš je to substituce grafémů za fonémy, ale to bylo moc dlouhé...

pelegrinova commented 2 years ago

Myslíš tím do samostatného pythonního souboru?

Glutexo commented 2 years ago

Ano. Popíšu podrobněji. Motivaci i provedení. Založil jsem jen rychle, ať na to nezapomenu.

Můžeme mu říkat třeba pseudofonetický?

pelegrinova commented 2 years ago

Asi ano. Byť spokojenější bych byla s "substituce grafémů", ale "pseudofonetický" se zdá být praktičtější pro pojmenovávání proměnných i... Ok, těším se na detaily, i když mám pocit, že tuším. Minimálně motivaci rozumím. Ale možná ne tak detailně, tož to tu klidně popis pořádně.

Glutexo commented 2 years ago

Doplněno. Zas takové dílo to nakonec nebylo.

Glutexo commented 2 years ago

Do záznamu: #30 se nakonec zřejmě slučovat nebude. Ponecháváme zatím pro případnou referenci.