Closed Inazuma110 closed 3 years ago
例えば,KNNのCross Validation は
model = KNeighborsClassifier(**study.best_params)
accuracy = np.mean(cross_val_score(model, train_train_x, train_train_y, cv=10, scoring='f1_macro'))
みたいに書きます. study.best_paramsにはoptunaで探索されたハイパーパラメータが入っています.
cross_val_scoreの引数を cv=KFold(shuffle=True, random_state=1)
にしたほうが良いです.じゃないと擬似ラベルの行が固まってしまします.
これをしないと現在公開しているtestデータのスコアで過学習してしまい,コンテスト終了後の本評価で痛い目を見るので,最も優先して実装したほうが良いです. コード残ってたら今までの実装すべてに対して行い,Issueに結果を書いてください.