faster counts_by_id for pandas

Nixtla / utilsforecast

https://nixtlaverse.nixtla.io/utilsforecast

Apache License 2.0

35 stars 6 forks source link

Closed jmoralez closed 2 months ago

jmoralez commented 2 months ago

Uses pd.Series.value_counts(dropna=False, sort=False) instead of df.groupby(col, observed=True).size() which is over 2x faster.

review-notebook-app[bot] commented 2 months ago

Check out this pull request on

See visual diffs & provide feedback on Jupyter Notebooks.