linogaliana / python-datascientist

Dépôt associé au cours Python pour data scientists (ENSAE 2e année)
https://pythonds.linogaliana.fr/
Other
101 stars 46 forks source link

Coquilles tuto Elastic #446

Open jpramil opened 10 months ago

jpramil commented 10 months ago

Probables pb de copié-collé :

"Un index est une collection de documents dans lesquels on souhaite chercher, préalablement ingérés dans un moteur de recherche les documents sont les établissements. L’indexation consiste à pré-réaliser les traitements des termes des documents pour gagner en efficacité lors de la phase de recherche. L’indexation est faite une fois pour de nombreuses recherches potentielles, pour lesquelles la rapidité de réponse peut être cruciale. Après avoir indexé une base, on effectuera des requêtes qui sont des recherches d’un document dans la base indexé (équivalent de notre web) à partir de termes de recherche normalisés."

jpramil commented 10 months ago

Non affichage des df lors des premiers preprocess : " A l’issue de la question 1, le jeu de données ciqual devrait ressembler à celui-ci: Après avoir mis en majuscule, on se retrouve avec le jeu de données suivant: Après retrait des stop-words, nos libellés prennent la forme suivante : La regex pour éliminer les caractères de ponctuation permet ainsi d’obtenir: Enfin, à l’issue de la question 5, le DataFrame obtenu est le suivant: Ces étapes de nettoyage ont ainsi permis de concentrer l’information dans les noms de produits sur ce qui l’identifie vraiment. "

jpramil commented 10 months ago

Fichier schema.json disparu (pour le mapping)