SlideShare una empresa de Scribd logo
1 de 15
Mobility Technologies Co., Ltd.
MLOpsはバズワード
株式会社 Mobility Technologies
渡部 徹太郎
2021/6/16
第8回 MLOps 勉強会 Tokyo (Online)
Mobility Technologies Co., Ltd.
自己紹介
2
ID :fetaro
名前:渡部 徹太郎
学生:東京工業大学でデータベースと情報検索の研究
(@日本データベース学会)
職歴:
* 野村総合研究所(NRI)
- オンライントレードシステム基盤
- オープンソース技術部隊
* リクルートテクノロジーズ
- ビッグデータ分析基盤
* MobilityTechnologies
- データエンジニア
エディタ:emacs派→ InteliJ派
趣味:麻雀、自宅サーバ
著書
増版きまりました!
Mobility Technologies Co., Ltd.
Opsという言葉から受けるイメージは監視や改善
MLOpsという言葉
3
ML Ops
=Machine Learning Operations
=機械学習の運用
→「機械学習システムを本番化したあとの監視・改善」
のような印象を受ける
Mobility Technologies Co., Ltd.
アンケートを取ってみたが、本番化や監視・改善が一番多かった
MLOpsという言葉
4
https://twitter.com/fetarodc/status/1331412910778683392?s=20 https://twitter.com/fetarodc/status/1400329729413054467?s=20
では本番化や監視・改善がML Opsなのか? → 実態は違う
Mobility Technologies Co., Ltd.
よく見るGoogleの「Hidden Technical Debt in Machine Learning Systems」の図
(機械学習システムの隠れた技術的負債)
機械学習システムでやることは多岐にわたる
5
https://papers.nips.cc/paper/2015/file/86df7dcfd896fcaf2674f757a2463eba-Paper.pdf
Mobility Technologies Co., Ltd.
機械学習システムでやることは多岐にわたる
6
MLOpsの文脈で見聞きしたことがある要素
MLの本丸
説明
本番化
モデル開発
データ準備
生
成
収
集
正解
ラベル
付け
(アノテーシ
ョン)
特
徴
量
変
換
モデル推定 オンライン
推論機
デ
プ
ロ
イ
実験管理
バッチ
推論機
学習
データ
分散処理・ハードウェア(GPU)
特徴量
ストア
モデル
監視
精度監視
性能
評価
開発ツール
ノートブック
説明可能性
Explainability
データ
ドリフト監視
ハイパー
パラメータ
チューニング
前
処
理
パイプライン (ワークフロー管理)
バージョン管理 コンテナ管理
特徴量
ストア
分析ツール
デバッガ
MLOpsの文脈で見聞きしたことがある要素
Mobility Technologies Co., Ltd.
MLOpsとは、この図の全域または一部であり、明確な定義はない
この図にないものも今後MLOpsと呼ばれるかもしれない
MLOpsとは
7
MLOpsの文脈で見聞きしたことがある要素
MLの本丸
説明
本番化
モデル開発
データ準備
生
成
収
集
正解
ラベル
付け
(アノテーシ
ョン)
特
徴
量
変
換
モデル推定 オンライン
推論機
デ
プ
ロ
イ
実験管理
バッチ
推論機
学習
データ
分散処理・ハードウェア(GPU)
特徴量
ストア
モデル
監視
精度監視
性能
評価
開発ツール
ノートブック
説明可能性
Explainability
データ
ドリフト監視
ハイパー
パラメータ
チューニング
前
処
理
パイプライン (ワークフロー管理)
バージョン管理 コンテナ管理
特徴量
ストア
分析ツール
デバッガ
Mobility Technologies Co., Ltd.
ITベンダは自社製品にMLOpsの謳い文句をつけるが、カバー範囲がバラバラ
例えば Amazon SageMakerはかなり広い範囲をカバーしている
ITベンダにとってのMLOps
8
https://aws.amazon.com/jp/sagemaker/
Mobility Technologies Co., Ltd.
他にも広い範囲をカバーしているツールはある
(「エンドツーエンド」とよばれることもある)
 有名どころ
 AWS SageMaker
 Kubeflow ( Kubeflow Pipelines )
 TensorFlow Extended(TFX)
 その他
 GCP AI Platform, Azure AI, MLflow, DataRobot MLOps, ABEJA...
これらのツールによくある機能
 モデル推定、モデル管理、デプロイ、オンライン推論、バッチ推論
これらのツールでも珍しい機能
 アノテーション、 特徴量ストア、ハイパーパラメータチューニング、実験管理
ITベンダにとってのMLOps
9
Mobility Technologies Co., Ltd.
一部に特化するツールもある
MLOps Toysというページで多数紹介されている
 7つの分類「データバージョニング」「学習オーケス
トレーション」「特徴量ストア」「実験管理」「モデ
ル提供」「モデル監視」「説明可能性」
例
 Aporia:データ監視
 Aim:ハイパーパラメータ管理、実験管理
 BentoML:デプロイ、監視
 Bodywork:kubenetesへのデプロイ
 Butterfree:特徴量ストア
ITベンダにとってのMLOps
10
https://mlops.toys/
Mobility Technologies Co., Ltd.
 2019年開催の「ML Ops NYC19」
 発表内容は多岐にわたっていた
 例
 Uber
 Tensorflow ExtendedではなくApache Sparkを採用してパイプラインを作った話
 https://www.youtube.com/watch?v=u2fs95L5BwI
 Netflix
 データサイエンティストに優しい機械学習フレームワーク「METAFLOW」
 紹介ブログ: https://lab.mo-t.com/blog/andonlabo-mlops-nyc19
 Walmart
 機械学習プロジェクトの実態と、「人」「技術」「プロセス」の3つにフォーカスしたベストプラ
クティス
MLOpsのカンファレンス
11
詳細はMoTのテックブログ参照
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
Mobility Technologies Co., Ltd.
 今まさに開催中の「MLOps World」
 相変わらずセッションの内容は多岐にわたる
MLOpsのカンファレンス
12
→Kubeflowの話
→Kubeflowの話
→データの監視の話
→監視やモデル説明可能性の話
→デプロイメントの話
→Pythonライブラリの話
https://mlopsworld.com/
Mobility Technologies Co., Ltd.
MLOpsという言葉から本番化や運用といったイメージを受けるが、実態は違う
MLOpsは、機械学習システムにおいて、
モデル推定以外のやることの全体または一部を表しており、
明確な定義はない
ITベンダの出すMLOps製品は、全体をカバーしているものもあれば、
一部に特化しているものもある
MLOpsカンファレンスの発表内容は、ツールから人材まで多岐にわたる
まとめ
13
Mobility Technologies Co., Ltd.
MLOpsといわれたら
「MLOpsのどの辺?」
と聞き返すようにしよう
まとめ
14
文章·画像等の内容の無断転載及び複製等の行為はご遠慮ください。
Mobility Technologies Co., Ltd.
15

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

機械学習モデルのサービングとは?
機械学習モデルのサービングとは?機械学習モデルのサービングとは?
機械学習モデルのサービングとは?
 
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
 
(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説
 
DockerコンテナでGitを使う
DockerコンテナでGitを使うDockerコンテナでGitを使う
DockerコンテナでGitを使う
 
Machine learning CI/CD with OSS
Machine learning CI/CD with OSSMachine learning CI/CD with OSS
Machine learning CI/CD with OSS
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
 
Ml system in_python
Ml system in_pythonMl system in_python
Ml system in_python
 
Python 3.9からの新定番zoneinfoを使いこなそう
Python 3.9からの新定番zoneinfoを使いこなそうPython 3.9からの新定番zoneinfoを使いこなそう
Python 3.9からの新定番zoneinfoを使いこなそう
 
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
 
If文から機械学習への道
If文から機械学習への道If文から機械学習への道
If文から機械学習への道
 
機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルト機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルト
 
Teslaにおけるコンピュータビジョン技術の調査
Teslaにおけるコンピュータビジョン技術の調査Teslaにおけるコンピュータビジョン技術の調査
Teslaにおけるコンピュータビジョン技術の調査
 
MLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめMLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめ
 
ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門
 
Pythonによる黒魔術入門
Pythonによる黒魔術入門Pythonによる黒魔術入門
Pythonによる黒魔術入門
 
【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical Report【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical Report
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
 
Teslaにおけるコンピュータビジョン技術の調査 (2)
Teslaにおけるコンピュータビジョン技術の調査 (2)Teslaにおけるコンピュータビジョン技術の調査 (2)
Teslaにおけるコンピュータビジョン技術の調査 (2)
 
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
 
MLflowによる機械学習モデルのライフサイクルの管理
MLflowによる機械学習モデルのライフサイクルの管理MLflowによる機械学習モデルのライフサイクルの管理
MLflowによる機械学習モデルのライフサイクルの管理
 

Similar a MLOpsはバズワード

ソフトウェアとAIの進化が示唆するもの Final Final revised Final
ソフトウェアとAIの進化が示唆するもの Final Final revised FinalソフトウェアとAIの進化が示唆するもの Final Final revised Final
ソフトウェアとAIの進化が示唆するもの Final Final revised Final
Roy Sugimura, Ph.D
 

Similar a MLOpsはバズワード (20)

ドライブレコーダの動画を使った道路情報の自動差分抽出
ドライブレコーダの動画を使った道路情報の自動差分抽出ドライブレコーダの動画を使った道路情報の自動差分抽出
ドライブレコーダの動画を使った道路情報の自動差分抽出
 
ドライブレコーダの画像認識による道路情報の自動差分抽出
ドライブレコーダの画像認識による道路情報の自動差分抽出ドライブレコーダの画像認識による道路情報の自動差分抽出
ドライブレコーダの画像認識による道路情報の自動差分抽出
 
Deep Learningを用いたロボット制御
Deep Learningを用いたロボット制御Deep Learningを用いたロボット制御
Deep Learningを用いたロボット制御
 
福岡市内のベンチャー企業が取り組む最新It技術
福岡市内のベンチャー企業が取り組む最新It技術福岡市内のベンチャー企業が取り組む最新It技術
福岡市内のベンチャー企業が取り組む最新It技術
 
ディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみたディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみた
 
Elasticsearchを使ったTwitter監視アプリ
Elasticsearchを使ったTwitter監視アプリElasticsearchを使ったTwitter監視アプリ
Elasticsearchを使ったTwitter監視アプリ
 
エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習
 
日本語における自然言語解析とその応用 〜COTOHA VA & API〜
日本語における自然言語解析とその応用 〜COTOHA VA & API〜日本語における自然言語解析とその応用 〜COTOHA VA & API〜
日本語における自然言語解析とその応用 〜COTOHA VA & API〜
 
メルペイの与信モデリングで安全・安心のために実践していること
メルペイの与信モデリングで安全・安心のために実践していることメルペイの与信モデリングで安全・安心のために実践していること
メルペイの与信モデリングで安全・安心のために実践していること
 
20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdf20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdf
 
Os 12 記号創発ロボティクス / OS趣旨説明@JSAI2015
Os 12 記号創発ロボティクス / OS趣旨説明@JSAI2015 Os 12 記号創発ロボティクス / OS趣旨説明@JSAI2015
Os 12 記号創発ロボティクス / OS趣旨説明@JSAI2015
 
求職サービスの検索ログを用いたクエリのカテゴリ推定とその活用事例の紹介
求職サービスの検索ログを用いたクエリのカテゴリ推定とその活用事例の紹介求職サービスの検索ログを用いたクエリのカテゴリ推定とその活用事例の紹介
求職サービスの検索ログを用いたクエリのカテゴリ推定とその活用事例の紹介
 
ロボットサービス開発の現場から
ロボットサービス開発の現場からロボットサービス開発の現場から
ロボットサービス開発の現場から
 
IoTデバイスデータ収集の難しい点
IoTデバイスデータ収集の難しい点IoTデバイスデータ収集の難しい点
IoTデバイスデータ収集の難しい点
 
MLOpsの概要と初学者が気をつけたほうが良いこと
MLOpsの概要と初学者が気をつけたほうが良いことMLOpsの概要と初学者が気をつけたほうが良いこと
MLOpsの概要と初学者が気をつけたほうが良いこと
 
ソフトウェアとAIの進化が示唆するもの Final Final revised Final
ソフトウェアとAIの進化が示唆するもの Final Final revised FinalソフトウェアとAIの進化が示唆するもの Final Final revised Final
ソフトウェアとAIの進化が示唆するもの Final Final revised Final
 
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいことMLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
 
Developers.IO 2019 | IoT はここまできた!「作らずに創る」IoT システムとその先の「デジタル化&データ活用」
Developers.IO 2019 | IoT はここまできた!「作らずに創る」IoT システムとその先の「デジタル化&データ活用」Developers.IO 2019 | IoT はここまできた!「作らずに創る」IoT システムとその先の「デジタル化&データ活用」
Developers.IO 2019 | IoT はここまできた!「作らずに創る」IoT システムとその先の「デジタル化&データ活用」
 
2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ
2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ
2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ
 
Rustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったかRustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったか
 

Más de Tetsutaro Watanabe

Más de Tetsutaro Watanabe (20)

データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎データサイエンティスト向け性能問題対応の基礎
データサイエンティスト向け性能問題対応の基礎
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例
 
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
 
タクシードライブレコーダーの動画処理MLパイプラインにkubernetesを使ってみた
タクシードライブレコーダーの動画処理MLパイプラインにkubernetesを使ってみたタクシードライブレコーダーの動画処理MLパイプラインにkubernetesを使ってみた
タクシードライブレコーダーの動画処理MLパイプラインにkubernetesを使ってみた
 
JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用
JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用
JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用
 
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
Google Cloud Next '18 Recap/報告会 機械学習関連
Google Cloud Next '18 Recap/報告会 機械学習関連Google Cloud Next '18 Recap/報告会 機械学習関連
Google Cloud Next '18 Recap/報告会 機械学習関連
 
巨大なサービスと膨大なデータを支えるプラットフォーム

巨大なサービスと膨大なデータを支えるプラットフォーム
巨大なサービスと膨大なデータを支えるプラットフォーム

巨大なサービスと膨大なデータを支えるプラットフォーム

 
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
 
WiredTigerを詳しく説明
WiredTigerを詳しく説明WiredTigerを詳しく説明
WiredTigerを詳しく説明
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
 
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
 
ビックデータ処理技術の全体像とリクルートでの使い分け
ビックデータ処理技術の全体像とリクルートでの使い分けビックデータ処理技術の全体像とリクルートでの使い分け
ビックデータ処理技術の全体像とリクルートでの使い分け
 
MongoDBが遅いときの切り分け方法
MongoDBが遅いときの切り分け方法MongoDBが遅いときの切り分け方法
MongoDBが遅いときの切り分け方法
 
MongoDB3.2の紹介
MongoDB3.2の紹介MongoDB3.2の紹介
MongoDB3.2の紹介
 
MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!MongoDB World 2014に行ってきた!
MongoDB World 2014に行ってきた!
 
がっつりMongoDB事例紹介
がっつりMongoDB事例紹介がっつりMongoDB事例紹介
がっつりMongoDB事例紹介
 
初心者向けMongoDBのキホン!
初心者向けMongoDBのキホン!初心者向けMongoDBのキホン!
初心者向けMongoDBのキホン!
 
MongoDBの監視
MongoDBの監視MongoDBの監視
MongoDBの監視
 

Último

Último (7)

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

MLOpsはバズワード

  • 1. Mobility Technologies Co., Ltd. MLOpsはバズワード 株式会社 Mobility Technologies 渡部 徹太郎 2021/6/16 第8回 MLOps 勉強会 Tokyo (Online)
  • 2. Mobility Technologies Co., Ltd. 自己紹介 2 ID :fetaro 名前:渡部 徹太郎 学生:東京工業大学でデータベースと情報検索の研究 (@日本データベース学会) 職歴: * 野村総合研究所(NRI) - オンライントレードシステム基盤 - オープンソース技術部隊 * リクルートテクノロジーズ - ビッグデータ分析基盤 * MobilityTechnologies - データエンジニア エディタ:emacs派→ InteliJ派 趣味:麻雀、自宅サーバ 著書 増版きまりました!
  • 3. Mobility Technologies Co., Ltd. Opsという言葉から受けるイメージは監視や改善 MLOpsという言葉 3 ML Ops =Machine Learning Operations =機械学習の運用 →「機械学習システムを本番化したあとの監視・改善」 のような印象を受ける
  • 4. Mobility Technologies Co., Ltd. アンケートを取ってみたが、本番化や監視・改善が一番多かった MLOpsという言葉 4 https://twitter.com/fetarodc/status/1331412910778683392?s=20 https://twitter.com/fetarodc/status/1400329729413054467?s=20 では本番化や監視・改善がML Opsなのか? → 実態は違う
  • 5. Mobility Technologies Co., Ltd. よく見るGoogleの「Hidden Technical Debt in Machine Learning Systems」の図 (機械学習システムの隠れた技術的負債) 機械学習システムでやることは多岐にわたる 5 https://papers.nips.cc/paper/2015/file/86df7dcfd896fcaf2674f757a2463eba-Paper.pdf
  • 6. Mobility Technologies Co., Ltd. 機械学習システムでやることは多岐にわたる 6 MLOpsの文脈で見聞きしたことがある要素 MLの本丸 説明 本番化 モデル開発 データ準備 生 成 収 集 正解 ラベル 付け (アノテーシ ョン) 特 徴 量 変 換 モデル推定 オンライン 推論機 デ プ ロ イ 実験管理 バッチ 推論機 学習 データ 分散処理・ハードウェア(GPU) 特徴量 ストア モデル 監視 精度監視 性能 評価 開発ツール ノートブック 説明可能性 Explainability データ ドリフト監視 ハイパー パラメータ チューニング 前 処 理 パイプライン (ワークフロー管理) バージョン管理 コンテナ管理 特徴量 ストア 分析ツール デバッガ MLOpsの文脈で見聞きしたことがある要素
  • 7. Mobility Technologies Co., Ltd. MLOpsとは、この図の全域または一部であり、明確な定義はない この図にないものも今後MLOpsと呼ばれるかもしれない MLOpsとは 7 MLOpsの文脈で見聞きしたことがある要素 MLの本丸 説明 本番化 モデル開発 データ準備 生 成 収 集 正解 ラベル 付け (アノテーシ ョン) 特 徴 量 変 換 モデル推定 オンライン 推論機 デ プ ロ イ 実験管理 バッチ 推論機 学習 データ 分散処理・ハードウェア(GPU) 特徴量 ストア モデル 監視 精度監視 性能 評価 開発ツール ノートブック 説明可能性 Explainability データ ドリフト監視 ハイパー パラメータ チューニング 前 処 理 パイプライン (ワークフロー管理) バージョン管理 コンテナ管理 特徴量 ストア 分析ツール デバッガ
  • 8. Mobility Technologies Co., Ltd. ITベンダは自社製品にMLOpsの謳い文句をつけるが、カバー範囲がバラバラ 例えば Amazon SageMakerはかなり広い範囲をカバーしている ITベンダにとってのMLOps 8 https://aws.amazon.com/jp/sagemaker/
  • 9. Mobility Technologies Co., Ltd. 他にも広い範囲をカバーしているツールはある (「エンドツーエンド」とよばれることもある)  有名どころ  AWS SageMaker  Kubeflow ( Kubeflow Pipelines )  TensorFlow Extended(TFX)  その他  GCP AI Platform, Azure AI, MLflow, DataRobot MLOps, ABEJA... これらのツールによくある機能  モデル推定、モデル管理、デプロイ、オンライン推論、バッチ推論 これらのツールでも珍しい機能  アノテーション、 特徴量ストア、ハイパーパラメータチューニング、実験管理 ITベンダにとってのMLOps 9
  • 10. Mobility Technologies Co., Ltd. 一部に特化するツールもある MLOps Toysというページで多数紹介されている  7つの分類「データバージョニング」「学習オーケス トレーション」「特徴量ストア」「実験管理」「モデ ル提供」「モデル監視」「説明可能性」 例  Aporia:データ監視  Aim:ハイパーパラメータ管理、実験管理  BentoML:デプロイ、監視  Bodywork:kubenetesへのデプロイ  Butterfree:特徴量ストア ITベンダにとってのMLOps 10 https://mlops.toys/
  • 11. Mobility Technologies Co., Ltd.  2019年開催の「ML Ops NYC19」  発表内容は多岐にわたっていた  例  Uber  Tensorflow ExtendedではなくApache Sparkを採用してパイプラインを作った話  https://www.youtube.com/watch?v=u2fs95L5BwI  Netflix  データサイエンティストに優しい機械学習フレームワーク「METAFLOW」  紹介ブログ: https://lab.mo-t.com/blog/andonlabo-mlops-nyc19  Walmart  機械学習プロジェクトの実態と、「人」「技術」「プロセス」の3つにフォーカスしたベストプラ クティス MLOpsのカンファレンス 11 詳細はMoTのテックブログ参照 ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
  • 12. Mobility Technologies Co., Ltd.  今まさに開催中の「MLOps World」  相変わらずセッションの内容は多岐にわたる MLOpsのカンファレンス 12 →Kubeflowの話 →Kubeflowの話 →データの監視の話 →監視やモデル説明可能性の話 →デプロイメントの話 →Pythonライブラリの話 https://mlopsworld.com/
  • 13. Mobility Technologies Co., Ltd. MLOpsという言葉から本番化や運用といったイメージを受けるが、実態は違う MLOpsは、機械学習システムにおいて、 モデル推定以外のやることの全体または一部を表しており、 明確な定義はない ITベンダの出すMLOps製品は、全体をカバーしているものもあれば、 一部に特化しているものもある MLOpsカンファレンスの発表内容は、ツールから人材まで多岐にわたる まとめ 13
  • 14. Mobility Technologies Co., Ltd. MLOpsといわれたら 「MLOpsのどの辺?」 と聞き返すようにしよう まとめ 14