Implement new Models: XGBoost, SVC and Randon Forest

allyssonmacedo commented 4 months ago

Add Models in the pipeline of build models
The models will be processed and implemented and generated in the save file
The scores compilation must considering the same target with different models (This way we have a compound target build with different models according to the precision)

allyssonmacedo commented 4 months ago

Done. Build one score compound considering all the probability for the targets and with different models

allyssonmacedo commented 4 months ago

O Support Vector Classifier (SVC) é um algoritmo que pode ser computacionalmente caro, especialmente com grandes conjuntos de dados ou quando usa o kernel gaussiano (RBF). Aqui estão algumas maneiras de otimizar o tempo de execução do seu modelo SVC:

Escolher o Kernel Apropriado Linear Kernel: Se o seu conjunto de dados for linearmente separável ou se você tiver um grande número de amostras, usar um kernel linear (kernel='linear') pode ser muito mais rápido do que o kernel RBF. Polinomial ou RBF: Se você precisar usar um kernel não linear, tente diminuir o grau no caso do kernel polinomial (degree) ou ajustar o parâmetro gamma no kernel RBF para ver se uma menor complexidade pode ser adequada.
Ajuste de Parâmetros C (Regularização): O parâmetro C controla o trade-off entre a margem da decisão e a classificação correta das amostras de treinamento. Um valor maior de C pode tornar o modelo mais complexo e demorado. Tente diminuir C para simplificar o modelo. Gamma (no caso de kernel RBF): O parâmetro gamma controla a influência de cada amostra de treinamento. Um valor menor de gamma faz com que o modelo seja mais linear (e possivelmente mais rápido). Valores altos de gamma podem tornar o modelo mais complexo e mais lento.
Subamostragem dos Dados Reduzir o Tamanho do Conjunto de Dados: Se possível, experimente usar um subconjunto menor dos seus dados para treinamento, especialmente ao ajustar os hiperparâmetros. Balanceamento de Classes: Se suas classes estão desbalanceadas, experimente amostrar seus dados de maneira balanceada para reduzir a quantidade de dados processados.
Redução de Dimensionalidade PCA ou TruncatedSVD: Reduzir a dimensionalidade dos dados com técnicas como PCA (Principal Component Analysis) ou TruncatedSVD pode acelerar o treinamento. Selecionar Features Importantes: Usar técnicas de seleção de features para manter apenas as features mais importantes pode reduzir o tempo de treinamento.
Ajustes de Parâmetros de Treinamento max_iter: Defina um número máximo de iterações (max_iter) para impedir que o modelo demore muito em casos de convergência lenta. tol (Tolerância): Ajustar o parâmetro de tolerância (tol) pode acelerar a convergência, embora possa reduzir a precisão.
Utilizar Implementações Otimizadas LinearSVC: Se você está usando o kernel linear, considere usar LinearSVC, que é otimizado para este tipo de problema e geralmente mais rápido. scikit-learn com suporte a paralelismo: Se você tem acesso a múltiplos núcleos de CPU, verifique se o scikit-learn está configurado para utilizá-los.
Pré-processamento dos Dados Normalização ou Padronização: As SVMs são sensíveis à escala dos dados, então normalize ou padronize os dados antes de usá-los.

ViniciusRaphael / crypto_technical_analysis

Implement new Models: XGBoost, SVC and Randon Forest #17