dot-layer / blog

https://dotlayer.org/
Other
14 stars 6 forks source link

WIP julia boosting trees #104

Closed jeremiedb closed 4 years ago

jeremiedb commented 4 years ago

Pas prêt à être publié. J'ai juste poussé le premier draft rough et incomplet pour me forcer à finir par le finir!

J'aimerais revoir le flow pour que ce soit plus fluide.

À clarifier aussi quelle emphase mettre sur le l'édiucation aux tree vs. le plus low end de comment atteindre une performance C level.

jeremiedb commented 4 years ago

Un gros merci @AnnieDeshaies et @davebulaval pour vos feedbacks! Je suis à refaire un passe sur le typo.

Sinon, je dirais que j'aimerais bien ajouter un petit peu de chaire sur l'aspect performance de l'histogramme, comment ça peut être calculé de façon optimale avec un seul scan du data.

Enfin, j'ajouterais un exemple de benchmark qui compare la performance avec XGBoost sur un toy dataset.

samperochkin commented 4 years ago

Let us know quand tu sens que c'est pas mal final, je vais faire un dernier passage typos (ou en parler à Sim Valois xd)

jeremiedb commented 4 years ago

Merci @samperochkin, je dirais que j'ai maintenant mon contenu. Je vais refaire une passe demain à tête reposé et je te fais signe.

@AnnieDeshaies Pour le support du highlight de la synthaxe, est-ce que ce serait possible d'ajouter le support pour Julia? Je crois que ça devrait pouvoir s'intégrer assez bien an ajoutant le CDN: https://cdnjs.com/libraries/highlight.js/ https://cdnjs.cloudflare.com/ajax/libs/highlight.js/9.18.1/languages/julia.min.js

jeremiedb commented 4 years ago

@samperochkin Je pense que ça s'en vient good to go!

AnnieDeshaies commented 4 years ago

Je vais ajouter le support de julia ce matin. Pas de troubles👌, je vous fais signe des que c'est fait 🔥🔥🔥

jeremiedb commented 4 years ago

Thanks @chblw J'ai apporté les modifs et corrections et laissé quelques explications sur les choix de certaines formulations. Bon point pour la conclusion, j'ai ajouté de quoi.

jeremiedb commented 4 years ago

Est-ce possible avec l'article de reproduire le tableau de résultats à la fin ?

Comme c'est court, j'ai ajouté le code pour reproduire l'évaluation du temps d'entraînement. Je ne sais pas si c'est ce que tu avais en tête? Avec le code highlighting, ça devrait ressortir par trop mal.

davebulaval commented 4 years ago

Est-ce possible avec l'article de reproduire le tableau de résultats à la fin ?

Comme c'est court, j'ai ajouté le code pour reproduire l'évaluation du temps d'entraînement. Je ne sais pas si c'est ce que tu avais en tête? Avec le code highlighting, ça devrait ressortir par trop mal.

C'était plus par curiosité. Sinon, un lien vers un github ?

jeremiedb commented 4 years ago

Comme tu le sens! Préfères-tu un lien vers le github, ou bien je laisse le code dans le post?

davebulaval commented 4 years ago

Comme tu le sens! Préfères-tu un lien vers le github, ou bien je laisse le code dans le post?

Lien GitHub, ça va faire du traffic vers ton code hahaha

jeremiedb commented 4 years ago

Done!

samperochkin commented 4 years ago

Tout porte à croire qu'on va publier ça mercredi @jeremiedb ! Je te contacte en privé en temps et lieu.

jeremiedb commented 4 years ago

Tout porte à croire qu'on va publier ça mercredi @jeremiedb ! Je te contacte en privé en temps et lieu.

Super! En faisant une adaptation des calculs en Float32 plutôt que Float64, j'ai réalisé que ça permettrait de combler le petit écart de performance que j'observais sur les plus gros dataset vs xgboost (j'allais me laisser faire si facilement!). Je ferais donc une petite correction d'ici fin de journée demain pour pas misleader sur la performance.

davebulaval commented 4 years ago

Tout porte à croire qu'on va publier ça mercredi @jeremiedb ! Je te contacte en privé en temps et lieu.

Super! En faisant une adaptation des calculs en Float32 plutôt que Float64, j'ai réalisé que ça permettrait de combler le petit écart de performance que j'observais sur les plus gros dataset vs xgboost (j'allais me laisser faire si facilement!). Je ferais donc une petite correction d'ici fin de journée demain pour pas misleader sur la performance.

Est-ce corriger ?

jeremiedb commented 4 years ago

Done. J'aimerais attendre que le code highlight supportant Julia soit présent cependant. À moins que ce soit déjà fait?

davebulaval commented 4 years ago

Done. J'aimerais attendre que le code highlight supportant Julia soit présent cependant. À moins que ce soit déjà fait?

@AnnieDeshaies ?

davebulaval commented 4 years ago

Done. J'aimerais attendre que le code highlight supportant Julia soit présent cependant. À moins que ce soit déjà fait?

@AnnieDeshaies ?

@AnnieDeshaies will come back soon from a badtrip to the corporate life and will take a look at it. After that we will publish the next wednesday.

AnnieDeshaies commented 4 years ago

Corpo life is killing me haha @jeremiedb je me souviens pu ce que jessaie de faire dis-moi. Tu veux que les images de code soit des blocs de code Julia?

davebulaval commented 4 years ago

Corpo life is killing me haha @jeremiedb je me souviens pu ce que jessaie de faire dis-moi. Tu veux que les images de code soit des blocs de code Julia?

C'était ça.

AnnieDeshaies commented 4 years ago

okay javais pas vu que tu mavais repondu. je fais la file a la pharmacie pis apres jva essayer de lintegrer edit: trolol je sais pas comment le tester...

davebulaval commented 4 years ago

@jeremiedb Est-ce possible d'avoir un exemple du highlight que tu veux avoir pour Julia ? @AnnieDeshaies me disait qu'elle ne sais pas comment debug et tester.

jeremiedb commented 4 years ago

@davebulaval désolé du délai, je suis sur nos rebalancements de fin de mois des portefeuilles, alors je suis un peu pris court! Mais j'avais fait de quoi pour nos site web, alors je pense pouvoir proposer de quoi, probablement fin pm ou ce soir. En gros, il s'agit d'ajouter le support du langage Julia au highlight.js (qui ne l'inclut pas par défault, mais est dispo comme extension)

davebulaval commented 4 years ago

@davebulaval désolé du délai, je suis sur nos rebalancements de fin de mois des portefeuilles, alors je suis un peu pris court! Mais j'avais fait de quoi pour nos site web, alors je pense pouvoir proposer de quoi, probablement fin pm ou ce soir. En gros, il s'agit d'ajouter le support du langage Julia au highlight.js (qui ne l'inclut pas par défault, mais est dispo comme extension)

Parfait! Bonne chance hahaha

jeremiedb commented 4 years ago

Finalement, c'était vraiment un low hanging fruit, le theme est déjà setup pour générer les link vers les highlight.js de nouveaux langages dans le footer.html dans les partials , il suffit de les spécifier dans le paramètre highlightjsLang dans le config.toml. J'en ai prodité pour ajouter python et faire un update de la version de highlight.js en même temps. Donc @AnnieDeshaies , fausse alerte, rien à faire finalement! Cette fois je crois que c'est bel et bien ready to go :)

samperochkin commented 4 years ago

Great! La date est d'hier, mais je n'y vois pas d'inconvénient. On S&Merge right now, quelqu'un confirme?