mayosuke / blogs

0 stars 0 forks source link

AWS Dev Day 2018: Amazon SageMaker を中心とした持続的な ML システム #6

Open mayosuke opened 6 years ago

mayosuke commented 6 years ago

？？？？？「Amazon SageMaker を中心とした持続的な ML システム」 #AWSDevDay

Summary

Introduction

Conclusion

Reference

mayosuke commented 6 years ago

Overview

(10:00) Amazon SageMaker を中心とした持続的な ML システム
機械学習を実システムで運用してビジネス上の成果を出すためには、単に機械学習モデルの精度を改善させるより、多くの点を考慮する必要があります。例えば、プロダクション環境にいれたモデルの評価や改善が求められたり、複数チームの協調作業が必要となることもあります。このセッションでは、Amazon SageMaker を中心に、AWS 上で機械学習システムを構築・運用する際のベストプラクティスについてご説明します。
志村 誠（アマゾン ウェブ サービス ジャパン株式会社 技術統括本部 ソリューションアーキテクト）

AWS のソリューションアーキテクトとして、アナリティクスに関わる領域で、さまざまなお客さまの AWS 活用支援を担当しています。

Memo

アジェンダ

awsdevdaytokyo2018-ml1-agenda

mlシステムの内外におけるopsサイクル

MLシステムをとりまくサイクル

cycle-around-ml-system

　mlシステムをプロダクションシステムとしてどう使い続けていくか　　ml ops 　よくある話　　mlシステムを作ったのはいいけど、担当者がいなくなると中身がわからなくなる　　効果がわからない

　機械学習は特に、最初にビジネス課題についてちゃんと考えるのが大事

スライド：MLシステムは、それ以外の要素の大きく影響される

screen shot 2018-11-06 at 9 16 35

MLシステムを導入したら、ビジネス課題が解決したかを確かめることが重要

解決したい課題に対する過去データが無ければ機械学習システムを導入することはできない

データエンジニア（データサイエンティストとは違う）　データの加工・前処理を行う人

スライド：六角形の図の更新版

screen shot 2018-11-06 at 9 18 00

スライド：六角形の図の各点に対応するAWSのサービス

screen shot 2018-11-06 at 9 18 24

MLシステムの中のサイクル

screen shot 2018-11-06 at 9 18 00

スライド：三角形の図

screen shot 2018-11-06 at 9 19 33

スライド：開発

screen shot 2018-11-06 at 9 22 14

基本的にはプログラミング

スライド：学習

screen shot 2018-11-06 at 9 22 46

スライド：推論と再学習

screen shot 2018-11-06 at 9 23 19

メトリクスをとってデプロイを自動化していく　ー＞　DevOps　ー＞　MLOps

スライド：三角形の図の更新

screen shot 2018-11-06 at 9 24 02

Amazon SageMaker

スライド：３コンポーネント３コンポーネントの集合体がsagemaker、コンポーネントを個別に使うのも可

screen shot 2018-11-06 at 9 24 27

スライド：開発コンポーネント

screen shot 2018-11-06 at 9 30 09

お手軽にJupyterノートブック環境が立ち上がる　使い慣れた環境が無ければ、これ使うのが簡単

スライド：学習コンポーネント

screen shot 2018-11-06 at 9 30 41

APIをたたいて毎回つくる APIから操作できるので、１０回、ちょっとだけパラメータをかえてジョブを並列で実行する、とかがやりやすい

スライド：推論コンポーネント

screen shot 2018-11-06 at 9 34 29

ABテスト　７：３とか、比率を指定も可能

Amazon SageMakerを用いたMLシステムのオートメーション

screen shot 2018-11-06 at 9 35 42

Amazon SageMakerを含んだMLシステムのアーキテクチャ

スライド：サーバサイドのリアルタイム推論

screen shot 2018-11-06 at 9 35 42

？ETL

スライド：サーバサイドのバッチ推論

screen shot 2018-11-06 at 9 50 55

例：ECサイト　毎ユーザーアクセスで推論する必要はないが、日次で推論したいような場合とか

スライド：エッジサイドのリアルタイム推論

screen shot 2018-11-06 at 9 51 51

例：外観検査を自動化したい　データはS3にログとしてためておいて、SageMakerで学習させて、エッジのモデルを更新する

MLサイクルのオートメーション

スライド：StepFunctionsによるMLモデル更新の自動化

screen shot 2018-11-06 at 9 52 22

スライド：データ加工プロセすまでStepFunctionsでかんり

screen shot 2018-11-06 at 9 52 49

スライド：アドホックな前処理やデータ抽出をSageMakeerで

screen shot 2018-11-06 at 9 53 15

スライド：本番環境でのABテストと効果測定 SageMakerだけでは完結しない

スライド：複数のMLモデル学習時の精度評価

screen shot 2018-11-06 at 9 53 39

MLシステムのセキュリティと権限管理

スライド：MLにおけるセキュリティと権限管理

スライド：運用管理の観点から利用者を区分

スライド：AWS Glue、Amazon SageMakerによる権限管理 Glueのアクセス権限管理がIAMでできるようになった？

まとめ

スライド：まとめ