Submit Search
Upload
Feature Store in DRIVE CHART
•
0 likes
•
43 views
E
emakryo
Follow
Mobility Technologies & DeNA 社内勉強会での発表資料です。
Read less
Read more
Technology
Report
Share
Report
Share
1 of 23
Download now
Download to read offline
Recommended
Cargo makeを使ってみた話
Cargo makeを使ってみた話
emakryo
Customizing cargo for cross compiling
Customizing cargo for cross compiling
emakryo
RustによるGPUプログラミング環境
RustによるGPUプログラミング環境
KiyotomoHiroyasu
Rustで3D graphics programming
Rustで3D graphics programming
KiyotomoHiroyasu
True Cloud Native Batch Workflow for .NET with MicroBatchFramework
True Cloud Native Batch Workflow for .NET with MicroBatchFramework
Yoshifumi Kawai
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発
Kazuaki Tanaka
mruby搭載ボード GR-CITRUS の新しい開発環境の紹介
mruby搭載ボード GR-CITRUS の新しい開発環境の紹介
三七男 山本
Building the Game Server both API and Realtime via c#
Building the Game Server both API and Realtime via c#
Yoshifumi Kawai
Recommended
Cargo makeを使ってみた話
Cargo makeを使ってみた話
emakryo
Customizing cargo for cross compiling
Customizing cargo for cross compiling
emakryo
RustによるGPUプログラミング環境
RustによるGPUプログラミング環境
KiyotomoHiroyasu
Rustで3D graphics programming
Rustで3D graphics programming
KiyotomoHiroyasu
True Cloud Native Batch Workflow for .NET with MicroBatchFramework
True Cloud Native Batch Workflow for .NET with MicroBatchFramework
Yoshifumi Kawai
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発
ET2014資料: mruby プログラム言語Rubyによる組込みソト開発
Kazuaki Tanaka
mruby搭載ボード GR-CITRUS の新しい開発環境の紹介
mruby搭載ボード GR-CITRUS の新しい開発環境の紹介
三七男 山本
Building the Game Server both API and Realtime via c#
Building the Game Server both API and Realtime via c#
Yoshifumi Kawai
フロントエンド制作向け ビルドツールGruntを PHPバックエンド開発で利用する @M_Ishikawa #phpcon2013
フロントエンド制作向け ビルドツールGruntを PHPバックエンド開発で利用する @M_Ishikawa #phpcon2013
Masayuki Ishikawa
Ruby向け帳票ソリューション「ThinReports」の開発で知るOSSの威力
Ruby向け帳票ソリューション「ThinReports」の開発で知るOSSの威力
ThinReports
T4でts生成するメタプログラミング
T4でts生成するメタプログラミング
Shinichi Ueno
Ruby Kaigi LT - unshiu
Ruby Kaigi LT - unshiu
gaooh
【Unite 2017 Tokyo】WebGL:ゲームプラットフォームとしてのWebと現在と未来
【Unite 2017 Tokyo】WebGL:ゲームプラットフォームとしてのWebと現在と未来
Unite2017Tokyo
Mbed祭り 2017@春の新横浜 20170225 竹之下
Mbed祭り 2017@春の新横浜 20170225 竹之下
Koyo Takenoshita
C# Tokyo Guide 2020/04/03
C# Tokyo Guide 2020/04/03
m ishizaki
楽しいVR空間を作る技術と支える技術 #osc19do
楽しいVR空間を作る技術と支える技術 #osc19do
infinite_loop
俺とGitHubとcodeシリーズ
俺とGitHubとcodeシリーズ
Masayuki KaToH
JAWS-UG三都物語 クラウドとデバイスが連携するアジェンダ
JAWS-UG三都物語 クラウドとデバイスが連携するアジェンダ
Kenichi Yoshida
Obj-CをSwiftにリプレースするお話
Obj-CをSwiftにリプレースするお話
Hitoshi Saito
Rustで楽しむ競技プログラミング
Rustで楽しむ競技プログラミング
yoshrc
OSS Reporting Solution ThinReports
OSS Reporting Solution ThinReports
ThinReports
OSC 2013 .Enterprise
OSC 2013 .Enterprise
Katsuya Hidaka
BricRoboEV3RT開発環境の使い方
BricRoboEV3RT開発環境の使い方
Toru Eguchi
msgraph-sshpubkey
msgraph-sshpubkey
yaegashi
最近のフロントエンドツールの紹介
最近のフロントエンドツールの紹介
Ryo Iinuma
俺とサーバレスアーキテクチャ Aws cognito + s3 + ses + lambda編
俺とサーバレスアーキテクチャ Aws cognito + s3 + ses + lambda編
Masayuki KaToH
VSCode Conference Japan 2021 kyusque
VSCode Conference Japan 2021 kyusque
kyusque
TechBuzz第5回cocos2d-x勉強会 BrainWars発表資料
TechBuzz第5回cocos2d-x勉強会 BrainWars発表資料
Takuma Kudo
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM,INC
先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際
Tetsutaro Watanabe
More Related Content
What's hot
フロントエンド制作向け ビルドツールGruntを PHPバックエンド開発で利用する @M_Ishikawa #phpcon2013
フロントエンド制作向け ビルドツールGruntを PHPバックエンド開発で利用する @M_Ishikawa #phpcon2013
Masayuki Ishikawa
Ruby向け帳票ソリューション「ThinReports」の開発で知るOSSの威力
Ruby向け帳票ソリューション「ThinReports」の開発で知るOSSの威力
ThinReports
T4でts生成するメタプログラミング
T4でts生成するメタプログラミング
Shinichi Ueno
Ruby Kaigi LT - unshiu
Ruby Kaigi LT - unshiu
gaooh
【Unite 2017 Tokyo】WebGL:ゲームプラットフォームとしてのWebと現在と未来
【Unite 2017 Tokyo】WebGL:ゲームプラットフォームとしてのWebと現在と未来
Unite2017Tokyo
Mbed祭り 2017@春の新横浜 20170225 竹之下
Mbed祭り 2017@春の新横浜 20170225 竹之下
Koyo Takenoshita
C# Tokyo Guide 2020/04/03
C# Tokyo Guide 2020/04/03
m ishizaki
楽しいVR空間を作る技術と支える技術 #osc19do
楽しいVR空間を作る技術と支える技術 #osc19do
infinite_loop
俺とGitHubとcodeシリーズ
俺とGitHubとcodeシリーズ
Masayuki KaToH
JAWS-UG三都物語 クラウドとデバイスが連携するアジェンダ
JAWS-UG三都物語 クラウドとデバイスが連携するアジェンダ
Kenichi Yoshida
Obj-CをSwiftにリプレースするお話
Obj-CをSwiftにリプレースするお話
Hitoshi Saito
Rustで楽しむ競技プログラミング
Rustで楽しむ競技プログラミング
yoshrc
OSS Reporting Solution ThinReports
OSS Reporting Solution ThinReports
ThinReports
OSC 2013 .Enterprise
OSC 2013 .Enterprise
Katsuya Hidaka
BricRoboEV3RT開発環境の使い方
BricRoboEV3RT開発環境の使い方
Toru Eguchi
msgraph-sshpubkey
msgraph-sshpubkey
yaegashi
最近のフロントエンドツールの紹介
最近のフロントエンドツールの紹介
Ryo Iinuma
俺とサーバレスアーキテクチャ Aws cognito + s3 + ses + lambda編
俺とサーバレスアーキテクチャ Aws cognito + s3 + ses + lambda編
Masayuki KaToH
VSCode Conference Japan 2021 kyusque
VSCode Conference Japan 2021 kyusque
kyusque
TechBuzz第5回cocos2d-x勉強会 BrainWars発表資料
TechBuzz第5回cocos2d-x勉強会 BrainWars発表資料
Takuma Kudo
What's hot
(20)
フロントエンド制作向け ビルドツールGruntを PHPバックエンド開発で利用する @M_Ishikawa #phpcon2013
フロントエンド制作向け ビルドツールGruntを PHPバックエンド開発で利用する @M_Ishikawa #phpcon2013
Ruby向け帳票ソリューション「ThinReports」の開発で知るOSSの威力
Ruby向け帳票ソリューション「ThinReports」の開発で知るOSSの威力
T4でts生成するメタプログラミング
T4でts生成するメタプログラミング
Ruby Kaigi LT - unshiu
Ruby Kaigi LT - unshiu
【Unite 2017 Tokyo】WebGL:ゲームプラットフォームとしてのWebと現在と未来
【Unite 2017 Tokyo】WebGL:ゲームプラットフォームとしてのWebと現在と未来
Mbed祭り 2017@春の新横浜 20170225 竹之下
Mbed祭り 2017@春の新横浜 20170225 竹之下
C# Tokyo Guide 2020/04/03
C# Tokyo Guide 2020/04/03
楽しいVR空間を作る技術と支える技術 #osc19do
楽しいVR空間を作る技術と支える技術 #osc19do
俺とGitHubとcodeシリーズ
俺とGitHubとcodeシリーズ
JAWS-UG三都物語 クラウドとデバイスが連携するアジェンダ
JAWS-UG三都物語 クラウドとデバイスが連携するアジェンダ
Obj-CをSwiftにリプレースするお話
Obj-CをSwiftにリプレースするお話
Rustで楽しむ競技プログラミング
Rustで楽しむ競技プログラミング
OSS Reporting Solution ThinReports
OSS Reporting Solution ThinReports
OSC 2013 .Enterprise
OSC 2013 .Enterprise
BricRoboEV3RT開発環境の使い方
BricRoboEV3RT開発環境の使い方
msgraph-sshpubkey
msgraph-sshpubkey
最近のフロントエンドツールの紹介
最近のフロントエンドツールの紹介
俺とサーバレスアーキテクチャ Aws cognito + s3 + ses + lambda編
俺とサーバレスアーキテクチャ Aws cognito + s3 + ses + lambda編
VSCode Conference Japan 2021 kyusque
VSCode Conference Japan 2021 kyusque
TechBuzz第5回cocos2d-x勉強会 BrainWars発表資料
TechBuzz第5回cocos2d-x勉強会 BrainWars発表資料
Similar to Feature Store in DRIVE CHART
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM,INC
先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際
Tetsutaro Watanabe
メルペイあと払いを実現するData Pipeline
メルペイあと払いを実現するData Pipeline
SatoshiMatsuzaki1
EmbulkのGCS/BigQuery周りのプラグインについて
EmbulkのGCS/BigQuery周りのプラグインについて
Satoshi Akama
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて
Hironori Washizaki
スマートデバイス×HTML5で 企業情報システムはどう変わる? ~最新動向から考えるエンタープライズWebの現在と未来~
スマートデバイス×HTML5で 企業情報システムはどう変わる? ~最新動向から考えるエンタープライズWebの現在と未来~
Shinichi Tomita
機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観
Hironori Washizaki
Only Logic Apps
Only Logic Apps
Tomoyuki Obi
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
HironoriTAKEUCHI1
Ims@sparqlではじめるr markdownとgitbookによるレポート生成
Ims@sparqlではじめるr markdownとgitbookによるレポート生成
Takeshi Mikami
マイクロサービスとそれを支えるアーキテクチャー
マイクロサービスとそれを支えるアーキテクチャー
Tsukasa Kato
ドライブレコーダの画像認識による道路情報の自動差分抽出
ドライブレコーダの画像認識による道路情報の自動差分抽出
Tetsutaro Watanabe
160608 01
160608 01
openrtm
SORACOM UG 宮城 初心者向けSORACOMワークショップ (もくもく会) | SORACOM とは?サービスや最新情報の紹介【2019春】
SORACOM UG 宮城 初心者向けSORACOMワークショップ (もくもく会) | SORACOM とは?サービスや最新情報の紹介【2019春】
SORACOM,INC
はじめよう!PowerAppsキホンのキ kintone × Microsoft Flow / Logic Appsの話
はじめよう!PowerAppsキホンのキ kintone × Microsoft Flow / Logic Appsの話
典子 松本
機械学習システムの33のアーキテクチャパターンおよびデザインパターン
機械学習システムの33のアーキテクチャパターンおよびデザインパターン
Hironori Washizaki
機械学習アーキテクチャ・デザインパターン
機械学習アーキテクチャ・デザインパターン
Hironori Washizaki
スマートエスイーセミナー:機外学習応用システムパターンの例
スマートエスイーセミナー:機外学習応用システムパターンの例
HironoriTAKEUCHI1
.net micro framework for toppers
.net micro framework for toppers
Kiyoshi Ogawa
キャリアコンサルタント向け「企業で求められるITスキルの実態」と実践スキル向上研修
キャリアコンサルタント向け「企業で求められるITスキルの実態」と実践スキル向上研修
Daiyu Hatakeyama
Similar to Feature Store in DRIVE CHART
(20)
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
SORACOM Technology Camp 2018 アドバンストラック4 | スモールスタートの次の一手は?成長できるIoTシステムの実例と回避した...
先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際
メルペイあと払いを実現するData Pipeline
メルペイあと払いを実現するData Pipeline
EmbulkのGCS/BigQuery周りのプラグインについて
EmbulkのGCS/BigQuery周りのプラグインについて
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて
新しいソフトウェアエンジニアリングのためのパターンランゲージに向けて
スマートデバイス×HTML5で 企業情報システムはどう変わる? ~最新動向から考えるエンタープライズWebの現在と未来~
スマートデバイス×HTML5で 企業情報システムはどう変わる? ~最新動向から考えるエンタープライズWebの現在と未来~
機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観
Only Logic Apps
Only Logic Apps
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
Ims@sparqlではじめるr markdownとgitbookによるレポート生成
Ims@sparqlではじめるr markdownとgitbookによるレポート生成
マイクロサービスとそれを支えるアーキテクチャー
マイクロサービスとそれを支えるアーキテクチャー
ドライブレコーダの画像認識による道路情報の自動差分抽出
ドライブレコーダの画像認識による道路情報の自動差分抽出
160608 01
160608 01
SORACOM UG 宮城 初心者向けSORACOMワークショップ (もくもく会) | SORACOM とは?サービスや最新情報の紹介【2019春】
SORACOM UG 宮城 初心者向けSORACOMワークショップ (もくもく会) | SORACOM とは?サービスや最新情報の紹介【2019春】
はじめよう!PowerAppsキホンのキ kintone × Microsoft Flow / Logic Appsの話
はじめよう!PowerAppsキホンのキ kintone × Microsoft Flow / Logic Appsの話
機械学習システムの33のアーキテクチャパターンおよびデザインパターン
機械学習システムの33のアーキテクチャパターンおよびデザインパターン
機械学習アーキテクチャ・デザインパターン
機械学習アーキテクチャ・デザインパターン
スマートエスイーセミナー:機外学習応用システムパターンの例
スマートエスイーセミナー:機外学習応用システムパターンの例
.net micro framework for toppers
.net micro framework for toppers
キャリアコンサルタント向け「企業で求められるITスキルの実態」と実践スキル向上研修
キャリアコンサルタント向け「企業で求められるITスキルの実態」と実践スキル向上研修
More from emakryo
MediaPipeの紹介
MediaPipeの紹介
emakryo
Feature StoreをRustで実装した話
Feature StoreをRustで実装した話
emakryo
なぜRustか?
なぜRustか?
emakryo
rustdef: Rust on jupyter notebook
rustdef: Rust on jupyter notebook
emakryo
Machine Learning on Graph Data @ ICML 2019
Machine Learning on Graph Data @ ICML 2019
emakryo
Neural networks for Graph Data NeurIPS2018読み会@PFN
Neural networks for Graph Data NeurIPS2018読み会@PFN
emakryo
More from emakryo
(6)
MediaPipeの紹介
MediaPipeの紹介
Feature StoreをRustで実装した話
Feature StoreをRustで実装した話
なぜRustか?
なぜRustか?
rustdef: Rust on jupyter notebook
rustdef: Rust on jupyter notebook
Machine Learning on Graph Data @ ICML 2019
Machine Learning on Graph Data @ ICML 2019
Neural networks for Graph Data NeurIPS2018読み会@PFN
Neural networks for Graph Data NeurIPS2018読み会@PFN
Feature Store in DRIVE CHART
1.
2020.10.29 Ryosuke Kamesawa 株式会社 Mobility
Technologies Feature Store in DRIVE CHART
2.
2 亀澤諒亮 / Ryosuke
Kamesawa - DeNA18新卒 - AI創薬: 2018/04 ~ 2019/09 - グラフML - CHART: 2019/10 ~ (MoT 2020/04 ~) - エッジML、MLOps - 趣味とか - Rust https://github.com/emakryo/rustdef - 竸プロ (MoT #雑談_競技プログラミング) - ボルダリング 自己紹介
3.
3 Outline 01|Feature Storeとは 02|事例の紹介 03|OSSの紹介 04|DRIVE CHART
Feature Store
4.
4 中央集約的な特徴量管理システム - 最近の機械学習システムの多くが大規模、複雑化 - データソース、特徴量、モデルの組み合わせが複数存在 -
問題点 - 開発環境と本番環境の違いによるデグレ - モデル開発からデプロイまでが長期間化 - デプロイ後の検証が困難 - これらを解消する手段としてFeature Storeと 呼ばれるものを用意するケースが増えてきている Feature Store とは https://www.featurestore.org
5.
5 - どこまでをFeature Storeと呼ぶかは結構曖昧 -
APIやETL(前処理)のワーカーなどを含むこともあれば 特徴量保存のストレージだけを指すことも - 機能、特色 - 特徴量の保存/取得/共有 - Online/Offlineで共通のAPI - Online: 推論、本番用、高速小容量 - Offline: 学習、検証用、低速大容量 - APIを通したfeature engineering とmodel training の分離 - 共通の特徴量の再利用、再現性の担保 - Time travel: 特定の時点の特徴量の取得 Feature Store とは
6.
6 - 各社事例 - Michelangelo
(Uber) - Zipline (Airbnb) - Comcast - and more https://www.featurestore.org/ - OSS - Hopsworks - Feast (GoJek/Google) - SaaS - Tecton https://www.tecton.ai/blog/what-is-a-feature-store/ 事例・OSS
7.
7 Uberの機械学習パイプライン Michelangelo https://eng.uber.com/michelangelo-machine-learning-platform/
8.
8 Uberの機械学習パイプライン Michelangelo https://eng.uber.com/michelangelo-machine-learning-platform/ Feature Store
9.
9 Uberの機械学習パイプライン Michelangelo https://eng.uber.com/michelangelo-machine-learning-platform/ 特徴量取得・前処理は 専用DSLを利用
10.
10 AirBnBのデータ管理プラットフォーム(特徴量計算エンジン) - 宣言的な特徴量計算DSL - イベントデータ(時系列) Zipline https://www.topbots.com/zipline-data-management-framework-by-airbnb/
11.
11 AIアシスタントのためのMLパイプライン - Online/Offline Feature
Store - 特徴量生成パイプライン - Streaming / On-Demand Comcast https://www.slideshare.net/databricks/operationalizing-machine-learningmanaging-pro venance-from-raw-data-to-predictions-with-nabeel-sarwar
12.
12 シンプルなFeature Store OSS -
Online/Offline - Historical retrieval - Python / Java / Go SDK Feast https://docs.feast.dev/user-guide/architecture
13.
13 For data engineer Feast
- Python example
14.
14 For data scientist Feast
- Python example
15.
15 機械学習プラットフォームOSS - 多機能 - ユーザー管理 -
クラスタ管理 - 管理UI - Notebook管理 - Feature Store Hopsworks https://hopsworks.readthedocs.io/en/stable/featurestore/guides/featurestore.html
16.
16 - Online/Offline store -
On-demand/cached features - Time travel (w/ Apache Hudi) - Python SDK / Scale SDK / SparkSQL Hopsworks Feature Store https://hopsworks.readthedocs.io/en/stable/featurestore/guides/featurestore.html
17.
17 DRIVE CHART Feature
Store
18.
18 - 生データ(ドライブレコーダーから取得) - センサーデータ(加速度、GPS、etc) -
エッジ推論データ(ドライバー顔ランドマーク、前方物体検出、etc) - AWS EFS上に生データをCSVで保存 - 特徴量(前処理済データ)生成はデータサイエンティストが都度実行 - CSV以外のデータソースにアクセスする必要があり再現が大変 - EFSによるコスト(> S3) - 明示的なCSVのスキーマ管理はなし - 低コストでCSV管理を置き換えるようなFeature Storeが必要 DRIVE CHARTでのデータ管理(これまで)
19.
19 方針 - 内製 - Feast:
GCP (BQ, GCS) が前提(CHARTはAWS) - Hopsworks: 必要以上に複雑、運用が大変そう - まずは現状のCSV管理を置き換える - Data lakeのWrapper APIという側面 - 最初はミニマルな構成でOffline (学習用)だけを実装 - 最低限のAPI - 保存/取得/削除 - スキーマ管理(validation / versioning) DRIVE CHARTでのFeature Store
20.
20 構成: 単純なサーバー・クライアント - サーバー:ストレージの実体を隠蔽したい -
将来的にOffline/Onlineでストレージを切り替えても問題がないように - Offline - S3: 特徴量(parquet encoding) - MySQL: メタデータ(スキーマ、バージョン) - Offlineといってもサーバーをボトルネックにしない - 実装はRust(高速・安全) DRIVE CHARTでのFeature Store ECS
21.
21 構成: 単純なサーバー・クライアント - クライアント:ユーザーは基本的にPython -
APIはFeastを参考 - pandas DataFrameを用いるAPI - スキーマとデータの分離 - キャッシュの管理も行う - S3の遅さを補う - 内部的にはgRPCなので他言語からも利用可能 - gRPC: 高速・Streaming DRIVE CHARTでのFeature Store ECS
22.
22 - Web UI -
再利用性、一覧性、検索性 - 統計量のモニタリング - Data driftの検出 - 複雑なクエリ - 複数entities (primary key)の join - Time travel - 過去の特定の時点の特徴量の取得 DRIVE CHART Feature Store - Future Direction
23.
23 - Feature Store -
中央集約的な特徴量管理 - 大規模な機械学習システムではよく用いられる - DRIVE CHARTでは内製 - 低コストでCSV管理を置き換えたい - 現状はシンプルな構成、API - 拡張の余地はある まとめ
Download now