sakamomo554101 / study

勉強用のリポジトリ(記事とかのリンクを貼ったりしていく)
0 stars 0 forks source link

データドリフトについて #13

Open sakamomo554101 opened 3 years ago

sakamomo554101 commented 3 years ago

https://aws.amazon.com/jp/blogs/news/detect-data-drift-with-amazon-sagemaker-model-monitor/

Deequって、気になるな。 単純にデータの統計量(平均値、中央値、分散など)を出力する感じ?

sakamomo554101 commented 3 years ago
推論時の入力データや出力結果が、学習時の許容範囲を超えて変化することをデータドリフトと呼びます
sakamomo554101 commented 3 years ago

https://note.com/dd_techblog/n/n91b349d9994e

それぞれの特徴量の列ごとに分布を出して、類似度をみているイメージ。 カテゴリ特徴(質的特徴量)と数値特徴(量的特徴量)では距離計算が異なると記載がある。 (それはその通り)