dataforgoodfr / batch7_rse

A search engine for French corporate societal and environnemental commitments and actions.
http://dataforgood.fr/batch7_rse/
MIT License
5 stars 2 forks source link

[Recherche par mots clefs] Sensibilité à la casse [résolu] et à l'orthographe (dont accents) [non résolu] #31

Closed CharlesGaydon closed 4 years ago

CharlesGaydon commented 4 years ago

Grosse différence entre: image et image

CharlesGaydon commented 4 years ago

La sensibilité à la casse a été corrigée dans https://github.com/dataforgoodfr/batch7_rse/commit/d2bf60fa80ec0cd41534d55146cb8cc442707917. Pour l'ortographe c'est plus compliqué - en gros si un mot est inconnu du dictionnaire de Spacy ça bloque. Les solutions éventuelles sont compliquées:

CharlesGaydon commented 4 years ago

Je pense qu'on peut accepter cet état de fait, mais simplement informer l'utilisateur qu'un ou plusieurs mots lui sont inconnus.