MartinHlavna / hector

Simple tool for stylistic correction for Slovak writters
GNU General Public License v3.0
2 stars 0 forks source link

Nesprávna segmentácia viet, ak sa v texte používa ako koniec riadku \r\n #19

Closed MartinHlavna closed 3 weeks ago

MartinHlavna commented 3 weeks ago

Windows používa na identifikáciu konca riadku \r\n. Spacy (minimálne pri spustení na linuxe a copypastnutí textu z windows editora) si však nevie správne s týmto znakom poradiť. V niektorých situáciach to môźe skončiť až nesprávnou segmentáciou vety.

Okrem toho sa \r zobrazuje ako whitespace, no nie je zvýraznený ako zbytočná medzera na konci odstavca. Pravdepodobne sú znaky \r aj nesprávne započítané do počtu znakov.

Riešením by bola možno normalizácia textu pred vložením do spacy rutiny, avšak tým pádom by nesedeli pozície znakov voči pôvodnému textu v editore.

MartinHlavna commented 3 weeks ago

Opravené v 0.10.0