O Scalene profiler indicou que o Lasso.fit é onde a maior parte do tempo está a ser gasto.
Seguem alternativas para acelerar:
Substituir a atual regeressão lasso do sklearn pelo lasso da biblioteca cuML
Substituir a atual regressão lasso do sklearn pelo scikit-learn-intelexlink
não resultou: ficou mais lento
substituir sklearn pela biblioteca statsmodels. ver esta regressão
Considerar criar uma implementação própria da regressão lasso
Rationale: O lasso.fit é ajustado a um conjunto de dados com poucos elementos (<300). Sklearn pode não ser optimo nessa situação. Segundo o profiling feito com Scalene, no lasso.fit a maior parte do tempo de processamento está a ser feita em Python e não em native code (C, C++)
O Scalene profiler indicou que o
Lasso.fit
é onde a maior parte do tempo está a ser gasto.Seguem alternativas para acelerar:
Substituir a atual regressão lasso do sklearn pelo scikit-learn-intelexlink