SlideShare una empresa de Scribd logo
1 de 17
Descargar para leer sin conexión
機械学習キャンバス ver. 0.1
2016-11-08
サイボウズラボ 西尾泰和
目的
「機械学習や人工知能で解決できないか」という相談を
しばしば受ける。特にエンジニアではない人に経営学の言葉で
説明する時に、手持ちの道具では不足を感じる。
「ビジネスモデル」という漠然としたものの設計をわかりやすく
するために「リーンキャンバス」というフレームワークが生まれ
たみたいに「機械学習・人工知能」に対してもキャンバスがあれ
ばいいのではないか?そこでver. 0.1を作ってみた。
リーンキャンバスの肝は「方法に固執するな」だと思うので、
こちらも方法は最後に考える仕組みにした。
2
機械学習キャンバス ver. 0.1
3
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
(2) Solution by hand:人手でそれを実現する方法
(3) Input:使え
る入力データ
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
スパムフィルタを世界で初めて設計する人の立場に立って
このキャンバスを埋めていきながら考えてみよう。
4
スパムフィルタ
5
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
(3) Input:使え
る入力データ
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
6
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける(3) Input:使え
る入力データ
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
7
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける(3) Input:使え
る入力データ
メールの文面
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
8
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける
(3) Input:使え
る入力データ
メールの文面
(5) Output:得
たい出力データ
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
顧客のメール文
面を見る権限が
必要、メール
サーバかメーラ
かに手を加える
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
9
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける
(3) Input:使え
る入力データ
メールの文面
(5) Output:得
たい出力データ
「スパムである
/ない」の情報(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
顧客のメール文
面を見る権限が
必要、メール
サーバかメーラ
かに手を加える
(6) 出力データ
をどう顧客価値
に結びつけるか
スパムフィルタ
10
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける
(3) Input:使え
る入力データ
メールの文面 (5) Output:得
たい出力データ
「スパムである
/ない」の情報
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
顧客のメール文
面を見る権限が
必要、メール
サーバかメーラ
かに手を加える
(6) 出力データ
をどう顧客価値
に結びつけるか
「スパムであ
る」と判定され
たメールを自動
でInboxから別
のフォルダに移
動する
スパムフィルタ
11
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムメールがInboxからなくなってほしい
(2) Solution by hand:人手でそれを実現する方法
秘書がメールの内容を見て、スパムとそうでないものに分ける
(3) Input:使え
る入力データ
メールの文面 (5) Output:得
たい出力データ
「スパムである
/ない」の情報
(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
怪しいキーワードが含まれているメールをスパムと判定。キー
ワードは人間が追加する。
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
顧客のメール文
面を見る権限が
必要、メール
サーバかメーラ
かに手を加える
(6) 出力データ
をどう顧客価値
に結びつけるか
「スパムであ
る」と判定され
たメールを自動
でInboxから別
のフォルダに移
動する
素朴アルゴリズム
怪しいキーワードが含まれているメールをスパムと判定。キー
ワードは人間が追加する。
実現可能性:簡単に実装できそう
計算コスト:各メールをキーワードの個数だけ全文検索
必要なデータ:「怪しいキーワードのリスト」
これどうやって準備する?→サブタスク発生!
12
サブタスク
顧客が「スパムフィルタの利用者」ではなく
「スパムフィルタの設計者」である自分に変わる。
それによって得られるデータも変わる。
達成したい目標もかわる
13
スパムフィルタのサブタスク
14
(1) Customer Happiness:顧客は何がどうなるとうれしいのか
スパムっぽい怪しいキーワードのリストが欲しい
(2) Solution by hand:人手でそれを実現する方法
メールの内容を見て、スパムによく出て来て普通のメールに出
てこない単語をリストアップする
(3) Input:使え
る入力データ
メールの文面と
それがスパムで
あるかどうか
(5) Output:得
たい出力データ
スパムっぽい怪
しい単語(7) Solution by computer:コンピュータで実現する方法(素朴な
アルゴリズム、ルールベースなど)
(10) Solution by ML/AI:機械学習や人工知能で実現する方法
(8) Training data:正解データ
の獲得方法・量
(9) Target Function:評価関数
(出力がどうだと好ましいのか)
(4) 入力データ
をどう得るか
自分のメールを
使う
(6) 出力データ
をどう顧客価値
に結びつけるか
単にリストを作
るだけ
機械的に作る方法
スパムメールと普通のメールをそれぞれ単語分割して
各単語の「スパムメール中の出現頻度」と
「普通のメール中の出現頻度」をカウント。
スパムメール中での出現頻度が普通の出現頻度より
大きいほど「スパムっぽい度」が高いと考えて
適当な閾値以上のものを選択。
実現可能性:できそう。
15
作者の誤算
ナイーブベイズでのスパムフィルタを作る話になる予定だったが
ナイーブベイズを使わないまま解決してしまった。
実際にこのスパムフィルタを作って実験してみると
• 「キーワードが含まれていたら問答無用でスパム」という処理
のために誤判定が多い
• キーワードリストの更新やパーソナライズが行われないので、
新しいパターンのスパムや、特定の人だけが受け取るスパムに
対処ができない。
という問題が起きるはず。
16
ルールの確率化
>「キーワードが含まれていたら問答無用でスパム」という処理
のために誤判定が多い
こういう「TrueかFalseかで判断しているルールの誤判定が起きて
しまう問題」を緩和するために、真偽値の代わりに確率値を使う
ことはよく行われている。
ナイーブベイズでのスパムフィルタも「スパムである/ない」の真
偽値の代わりに「スパムである確率が高い/低い」の確率値を使う
17
see: 「ルールベースから機械学習への道 公開用」
http://www.slideshare.net/nishio/ss-53221829

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

PRML輪読#7
PRML輪読#7PRML輪読#7
PRML輪読#7
 
4 データ間の距離と類似度
4 データ間の距離と類似度4 データ間の距離と類似度
4 データ間の距離と類似度
 
PRML輪読#13
PRML輪読#13PRML輪読#13
PRML輪読#13
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
 
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
 
Hessian free
Hessian freeHessian free
Hessian free
 
最適化超入門
最適化超入門最適化超入門
最適化超入門
 
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep Learning
 
全脳アーキテクチャ若手の会 強化学習
全脳アーキテクチャ若手の会 強化学習全脳アーキテクチャ若手の会 強化学習
全脳アーキテクチャ若手の会 強化学習
 
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習
 
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
 
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
 
TDDBC Fukuoka Day1
TDDBC Fukuoka Day1TDDBC Fukuoka Day1
TDDBC Fukuoka Day1
 
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
 
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
 
PRML輪読#1
PRML輪読#1PRML輪読#1
PRML輪読#1
 
プログラミングコンテストでのデータ構造 2 ~平衡二分探索木編~
プログラミングコンテストでのデータ構造 2 ~平衡二分探索木編~プログラミングコンテストでのデータ構造 2 ~平衡二分探索木編~
プログラミングコンテストでのデータ構造 2 ~平衡二分探索木編~
 
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
 

Similar a 機械学習キャンバス0.1

おばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフトおばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフト
atmarkit
 
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
満徳 関
 

Similar a 機械学習キャンバス0.1 (10)

機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
機械学習を使った「ビジネスになる」アプリケーションの作り方 v1
 
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
機械学習を使った「ビジネスになる」アプリケーションの作り方 V2
 
おばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフトおばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフト
 
カスタマーサクセスとプロダクトUX_uxjam#30_20190722
カスタマーサクセスとプロダクトUX_uxjam#30_20190722カスタマーサクセスとプロダクトUX_uxjam#30_20190722
カスタマーサクセスとプロダクトUX_uxjam#30_20190722
 
【Schoo web campus】8ヶ月で会員1万人と、総額8億円を集めたux改善 先生:吉田浩一郎
【Schoo web campus】8ヶ月で会員1万人と、総額8億円を集めたux改善 先生:吉田浩一郎【Schoo web campus】8ヶ月で会員1万人と、総額8億円を集めたux改善 先生:吉田浩一郎
【Schoo web campus】8ヶ月で会員1万人と、総額8億円を集めたux改善 先生:吉田浩一郎
 
WO!|vol.49|AI×コールセンター
WO!|vol.49|AI×コールセンターWO!|vol.49|AI×コールセンター
WO!|vol.49|AI×コールセンター
 
HTML5な今日この頃に贈る、Webデザイナーこれからの生きる道
HTML5な今日この頃に贈る、Webデザイナーこれからの生きる道HTML5な今日この頃に贈る、Webデザイナーこれからの生きる道
HTML5な今日この頃に贈る、Webデザイナーこれからの生きる道
 
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
POStudy Day 2013 Spring in Tokyo - Lunch Special Talk Event - 課題検証インタビュー(Prob...
 
Shitsumonprezentation#1 20180108
Shitsumonprezentation#1 20180108Shitsumonprezentation#1 20180108
Shitsumonprezentation#1 20180108
 
「人工知能」との正しい付き合い方
「人工知能」との正しい付き合い方「人工知能」との正しい付き合い方
「人工知能」との正しい付き合い方
 

Más de nishio

Más de nishio (20)

量子アニーリングマシンのプログラミング
量子アニーリングマシンのプログラミング量子アニーリングマシンのプログラミング
量子アニーリングマシンのプログラミング
 
夏プロ報告
夏プロ報告夏プロ報告
夏プロ報告
 
ITと経営
ITと経営ITと経営
ITと経営
 
部分観測モンテカルロ計画法を用いたガイスターAI
部分観測モンテカルロ計画法を用いたガイスターAI部分観測モンテカルロ計画法を用いたガイスターAI
部分観測モンテカルロ計画法を用いたガイスターAI
 
交渉力について
交渉力について交渉力について
交渉力について
 
If文から機械学習への道
If文から機械学習への道If文から機械学習への道
If文から機械学習への道
 
組織横断型研究室構想
組織横断型研究室構想組織横断型研究室構想
組織横断型研究室構想
 
2017首都大学東京情報通信特別講義
2017首都大学東京情報通信特別講義2017首都大学東京情報通信特別講義
2017首都大学東京情報通信特別講義
 
強化学習その5
強化学習その5強化学習その5
強化学習その5
 
良いアイデアを出すための方法
良いアイデアを出すための方法良いアイデアを出すための方法
良いアイデアを出すための方法
 
強化学習その4
強化学習その4強化学習その4
強化学習その4
 
強化学習その3
強化学習その3強化学習その3
強化学習その3
 
強化学習その2
強化学習その2強化学習その2
強化学習その2
 
強化学習その1
強化学習その1強化学習その1
強化学習その1
 
線形?非線形?
線形?非線形?線形?非線形?
線形?非線形?
 
首都大学東京「情報通信特別講義」2016年西尾担当分
首都大学東京「情報通信特別講義」2016年西尾担当分首都大学東京「情報通信特別講義」2016年西尾担当分
首都大学東京「情報通信特別講義」2016年西尾担当分
 
勾配降下法の 最適化アルゴリズム
勾配降下法の最適化アルゴリズム勾配降下法の最適化アルゴリズム
勾配降下法の 最適化アルゴリズム
 
Wifiで位置推定
Wifiで位置推定Wifiで位置推定
Wifiで位置推定
 
ESP8266EXで位置推定
ESP8266EXで位置推定ESP8266EXで位置推定
ESP8266EXで位置推定
 
Raspberry Piで Wifiルータを作る
Raspberry PiでWifiルータを作るRaspberry PiでWifiルータを作る
Raspberry Piで Wifiルータを作る
 

機械学習キャンバス0.1