Backpropagation et loss function

Pour la backpropagation, on va comparer les prédictions du modèle (Value Actual State, (Proba Coup 1, PC2, ...) par rapport aux valeurs données par le MCTS (Value State) et pour la proba de choisir un coup, on reprend la liste donnée par le modèle, on retire les coups impossibles et on renormalise pour que la somme des probas restantes soit égale à 1.

Modèle Output : Prédictions : float(VAS) , list(PC) MCTS : True Value : float(VAS) , sum (normalise(predList(PC) * Vecteur des coups possibles [0,1,...,0] )==1

L'objectif est que le modèle apprenne les valeurs données par MCTS et apprenne les coups jouables ou non.

Jefidev / AIChess

Backpropagation et loss function #3