mjx-project / mjx

Mjx: A framework for Mahjong AI research
https://colab.research.google.com/drive/1m1wOT_K2YFtuV6IO7VgWk4ilVhTKqRFU?usp=sharing
MIT License
167 stars 18 forks source link

少数データでmodelを学習させる. #1131

Closed nissymori closed 2 years ago

nissymori commented 2 years ago

modelを学習させるための関数を書いて, 少数データで上手く学習できていることを確認.

nissymori commented 2 years ago

学習に必要な関数は実装してテストも通りました. 手元にある少数データで一旦学習を回してみて学習が実行できていればこのPRは閉じてデータを増やしてみようと思います.

nissymori commented 2 years ago

lossがかなりの頻度で爆発する. 実施した対策

nissymori commented 2 years ago

@sotetsuk optimizerなどを変更するとlossが爆発することは無くなりました. データを増やして色々してみようと思います. 問題なければとりあえずこのPRは閉じようと思います.

nissymori commented 2 years ago

いくつかライブラリの依存増えているんですけど, requirements.txtに書き足したほうがいいでしょうか.

sotetsuk commented 2 years ago

いや、requirementsは増やさないで下さい!

sotetsuk commented 2 years ago

了解です!マージしちゃってください! ある程度妥当に学習できたら局と点数を変えてみてプロットしてみて変じゃないか確認してみてもらえると🙏@nissymori

nissymori commented 2 years ago

レビュー有難うございます!了解です!