Open mayosuke opened 6 years ago
(10:00) Amazon SageMaker を中心とした持続的な ML システム
機械学習を実システムで運用してビジネス上の成果を出すためには、単に機械学習モデルの精度を改善させるより、多くの点を考慮する必要があります。例えば、プロダクション環境にいれたモデルの評価や改善が求められたり、複数チームの協調作業が必要となることもあります。このセッションでは、Amazon SageMaker を中心に、AWS 上で機械学習システムを構築・運用する際のベストプラクティスについてご説明します。
志村 誠(アマゾン ウェブ サービス ジャパン株式会社 技術統括本部 ソリューションアーキテクト)
AWS のソリューションアーキテクトとして、アナリティクスに関わる領域で、さまざまなお客さまの AWS 活用支援を担当しています。
mlシステムをプロダクションシステムとしてどう使い続けていくか ml ops よくある話 mlシステムを作ったのはいいけど、担当者がいなくなると中身がわからなくなる 効果がわからない
機械学習は特に、最初にビジネス課題についてちゃんと考えるのが大事
スライド:MLシステムは、それ以外の要素の大きく影響される
MLシステムを導入したら、ビジネス課題が解決したかを確かめることが重要
解決したい課題に対する過去データが無ければ機械学習システムを導入することはできない
データエンジニア(データサイエンティストとは違う) データの加工・前処理を行う人
スライド:六角形の図の更新版
スライド:六角形の図の各点に対応するAWSのサービス
MLシステムの中のサイクル
スライド:三角形の図
スライド:開発
基本的にはプログラミング
スライド:学習
スライド:推論と再学習
メトリクスをとってデプロイを自動化していく ー> DevOps ー> MLOps
スライド:三角形の図の更新
スライド:3コンポーネント 3コンポーネントの集合体がsagemaker、コンポーネントを個別に使うのも可
スライド:開発コンポーネント
お手軽にJupyterノートブック環境が立ち上がる 使い慣れた環境が無ければ、これ使うのが簡単
スライド:学習コンポーネント
APIをたたいて毎回つくる APIから操作できるので、10回、ちょっとだけパラメータをかえてジョブを並列で実行する、とかがやりやすい
スライド:推論コンポーネント
ABテスト 7:3とか、比率を指定も可能
スライド:サーバサイドのリアルタイム推論
?ETL
スライド:サーバサイドのバッチ推論
例:ECサイト 毎ユーザーアクセスで推論する必要はないが、日次で推論したいような場合とか
スライド:エッジサイドのリアルタイム推論
例:外観検査を自動化したい データはS3にログとしてためておいて、SageMakerで学習させて、エッジのモデルを更新する
スライド:StepFunctionsによるMLモデル更新の自動化
スライド:データ加工プロセすまでStepFunctionsでかんり
スライド:アドホックな前処理やデータ抽出をSageMakeerで
スライド:本番環境でのABテストと効果測定 SageMakerだけでは完結しない
スライド:複数のMLモデル学習時の精度評価
スライド:MLにおけるセキュリティと権限管理
スライド:運用管理の観点から利用者を区分
スライド:AWS Glue、Amazon SageMakerによる権限管理 Glueのアクセス権限管理がIAMでできるようになった?
スライド:まとめ
?????「Amazon SageMaker を中心とした持続的な ML システム」 #AWSDevDay
Summary
Introduction
Conclusion
Reference