idekazuki / diary

記録
0 stars 1 forks source link

data分析competition titanic #72

Open idekazuki opened 4 years ago

idekazuki commented 4 years ago

competitionで気をつけること ・外部データの使用禁止 ・ハンドラベリングの禁止 ・再現性の確保

lr.fit(X_train, y_train)

idekazuki commented 4 years ago

データ分析の大まかな流れ ライブラリ・データ読み込み データの概観・分析・前処理 ベースラインモデルの構築 特徴量エンジニアリング 様々なモデルの構築・調整 モデルのアンサンブリング 予測の出力・提出

idekazuki commented 4 years ago

ランダムフォレスト法で指定できるパラメータは以下の通り。 max_depth:決定木の深さの最大値 min_samples_leaf:葉が含むサンプル数の最小値 n_estimators:決定木の数 n_jobs:計算に用いるスレッド数 random_state:乱数生成のシード値