pelegrinova / morfo_segmentace

poloautomatická segmentace textu na morfémy + výpočet dat pro MAL: pokusy
3 stars 1 forks source link

♻️ Použij split bez parametru #32

Closed Glutexo closed 3 years ago

Glutexo commented 3 years ago

split(sep=" ") rozdělí řetězec pouze podle právě jedné mezery. Oproti tomu split() jej rozdělí všude tam, kde se vyskytne libovolně dlouhý sledu bílých znaků. Zároveň tyto odstraní i z počátku a konce řetězce. Ve výsledném poli se pak nevyskytují prázdné řetězce.

Tímto lze zcela nahradit replace("\n", " "), strip() i re.sub(r"\s{2,}", " ", text).

pelegrinova commented 3 years ago

aha, to je husté!