CentreForDigitalHumanities / tscan

T-scan: an analysis tool for dutch texts to assess the complexity of the text, based on original work by Rogier Kraf
GNU Affero General Public License v3.0
18 stars 6 forks source link

[LINT] Verbeteringen stoplijst #47

Closed oktaal closed 2 years ago

oktaal commented 3 years ago

Maak het mogelijk om stoplijsten te beheren.

"Ik vind de titel stoplijst uploaden niet erg duidelijk. Dacht eerst dat ik hier ook een tekst in zou kunnen voeren, maar dan in csv-format, wat me al een beetje vreemd voorkwam."

"In plaats van ‘stoplijst’ is ‘woordenstoplijst’ misschien al iets inzichtelijker, of iets met ‘uitzonderingen’."

"De woorden ‘kiesbestandgeenbestand’ in het vakje voor de stoplijst wekken verwarring, ook omdat ze blijven staan na het invoeren van een stoplijst."

"Een stoplist werkt ook als hij txt-formaat heeft, niet alleen als hij csv-formaat heeft."

"De stoplijstwoorden worden wel verwerkt in de woordmaten, maar niet in het markeren van woorden in Bekijk uw tekst."

"Enkele verwarrende mededelingen in het huidige invoertraject moeten verbeterd worden.

  • Wanneer je een tekst plakt, blijft de mededeling u heeft nog geen tekst geplakt gewoon staan.
  • De titel Stoplijst uploaden moet verduidelijkt worden.
  • De woorden ‘kiesbestandgeenbestand’ in het vakje voor de stoplijst wekken verwarring, ook omdat ze blijven staan na het invoeren van een stoplijst."

"Twee ontwerpproblemen rondom de stoplijst moeten worden aangepakt.

  • Duidelijk moet worden dat een stoplist meerdere formaten kan krijgen: naast csv-formaat is ook een txt-formaat mogelijk.
  • De stoplijstwoorden worden wel verwerkt in de woordmaten, maar nog niet in het markeren van woorden in Bekijk uw tekst."

"Er moet een algemene stoplijst komen van gangbare woorden die ontbreken in de SubtLex-frequentielijst. Die woorden blijven dan structureel buiten beschouwing. Ook zo worden valse alarmen voorkomen, zowel in de frequentiescores als in Bekijk uw tekst."