Atsuhiko / AAMLP

1 stars 3 forks source link

第6回 Feature engineering p142 / Feature selection p155 #12

Open yuyuyuriko78 opened 3 years ago

yuyuyuriko78 commented 3 years ago

先生:川田さん

yuyuyuriko78 commented 3 years ago

SHAP

yuyuyuriko78 commented 3 years ago

井伊さんの自慢話

yuyuyuriko78 commented 3 years ago

Feature Engineering

yuyuyuriko78 commented 3 years ago

ポイント

購買データセット

dtメソッド

特徴量の辞書

aggregate(集計)

yuyuyuriko78 commented 3 years ago

Numerical variablesのfeature engineering

統計学的なアプローチ

統計量の例

scipy

tsfreshモジュール

多項式によるfeature engineering

2次の多項式特徴量生成

binning ビン分割

yuyuyuriko78 commented 3 years ago

欠損値処理

yuyuyuriko78 commented 3 years ago

Feature Selection

yuyuyuriko78 commented 3 years ago

目的

種類

種類 説明
フィルター 人間の手でフィルタリング。統計量を調べる。速度◎、精度×
ラッパー 逐次的に特徴量を増減し、すべてのパターンを自動で確認していく。速度×、精度◎
埋め込み ランダムフォレスト、LASSOを利用。特徴量の重要度をみて選択。速度○、精度○

フィルター法

分散が低い(0.1未満)特徴量を削除

相関の高い2つの変数のうち、ひとつを削除。

ラッパー法

貪欲特徴選択

埋め込み法