CentreForDigitalHumanities / tscan

T-scan: an analysis tool for dutch texts to assess the complexity of the text, based on original work by Rogier Kraf
GNU Affero General Public License v3.0
18 stars 6 forks source link

Teksten opschonen #34

Open oktaal opened 3 years ago

oktaal commented 3 years ago

Het automatisch uitfilteren van zinnen van één karakter, en van aaneengeschreven cijfers, zodat opsommingsletters en -cijfers met een punt erachter geen zin meer worden.

Laat het merendeel van de kopjes automatisch overslaan. Zet ‘###’ voor een zin als:

oktaal commented 3 years ago

Idealiter wordt de invoer omgevormd naar een apart txt-bestand waar het resultaat van deze filtering in te zien is.