Closed CharlesGaydon closed 4 years ago
La sensibilité à la casse a été corrigée dans https://github.com/dataforgoodfr/batch7_rse/commit/d2bf60fa80ec0cd41534d55146cb8cc442707917. Pour l'ortographe c'est plus compliqué - en gros si un mot est inconnu du dictionnaire de Spacy ça bloque. Les solutions éventuelles sont compliquées:
Je pense qu'on peut accepter cet état de fait, mais simplement informer l'utilisateur qu'un ou plusieurs mots lui sont inconnus.
Grosse différence entre: et