SlideShare una empresa de Scribd logo
1 de 51
Tech Trend Talk 5
2018年7月25日(水)
WIFI
SSID : GIG_GUEST_A
PW : gigguest
A.Iと言いたくないけど
A.I.の話 part 3
Masanori Nakashima
2018
中島
中島 正成
▪ Institution for a Global Society株式会社
▪ 執行役員CTO
▪ 人材データの分析・機械学習
▪ 人工知能をつかった評価システム GROW360開発
▪ 英作文採点システム開発
▪ エン・ジャパン株式会社
▪ 株式会社不満買取センターCTO
▪ 自然言語処理によるマーケティングデータ分類
▪ 株式会社メタップス
▪ 取締役CTO
▪ 広告プラットフォームmetapsリワード開発
▪ メタップスアナリティクスプロトタイプ開発
▪ 決済プラットフォームSpikeプロトタイプ開発
Overview
▪ 前回のおさらい
▪ 教師なし学習をやってみよう
A.I(人工知能)とはなんですか?
人
工
知
能
今日は教師あり学習をやります
物すごく短くいうと、多
くのデータに対してもっ
ともらしい関数を自動的
につくる。
回帰モデル
分類モデル、ツリーモデ
ルとも。ツリー型に条件
分岐して答えを出すため
の分岐条件を自動的につ
くっていく。
判別モデル
手法ではなく枠組み。
統計的にもっともらしい
答えを推定していく手法
。
統計モデリング
脳機能に見られるいく
つかの特性を計算機上
のシミュレーションに
よって表現することを
目指した数学モデル。
ニューラル
ネットワーク
抑えるべき機械学習の言葉の話
回帰モデルの基本の話
判別モデルの進化の話
• 回帰
• 線形回帰
• ロジスティック回帰
• SVM
• ツリー
• 決定木
• 回帰木
• ランダムフォレスト
• 勾配ブースティング
• ニューラルネットワーク
• CNN
• RNN
• パーセプトロン
教師あり学習
• 階層型クラスタリング
• 非階層型クラスタリング
• K-means
• トピックモデル
• LDA
• 協調フィルタリング
• 自己組織化マップ
教師なし学習
教師あり学習と教師なし学習
これから
▪ 第一回 機械学習の概要
▪ 第二回 環境準備と教師なし学習の実践
▪ 第三回 教師あり学習とプロダクトへの活用
▪ 第四回 スコア予測の事例の実践
▪ 第五回 適切なアルゴリズムの探索
▪ 第六回 自然言語処理の入り口
index
教師あり学習とは
やってみよう分類問題
教師あり学習とは
過去のデータをもとに
予測・分類する
教師あり学
習
とは?
教師あり学習(きょうしありがくしゅう, 英: Supervised
learning)とは、機械学習の手法の一つである。事前に与え
られたデータをいわば「例題(=先生からの助言)」とみ
なして、それをガイドに学習(=データへの何らかのフィ
ッティング)を行うところからこの名がある。
予測や分類をするときに使う
提案や予測をするときに用いられます。ときにプロダクトで
も利用される。
SVMとは
● SVM
サポートベクターマシン(英: support vector machine, SVM)は、教師あり学習を用いるパターン認識モデルの一
つである。分類や回帰へ適用できる。1963年に Vladimir N. Vapnik, Alexey Ya. Chervonenkis が線形サポートベク
ターマシンを発表し[1]、1992年に Bernhard E. Boser, Isabelle M. Guyon, Vladimir N. Vapnik が非線形へと拡張し
た。
サポートベクターマシンは、現在知られている手法の中でも認識性能が優れた学習モデルの一つである。サポート
ベクターマシンが優れた認識性能を発揮することができる理由は、未学習データに対して高い識別性能を得るため
の工夫があるためである。
マージン最大化とサポートベクトル
すでにカテゴリ分けした
パラメータ付きデータが
たくさんある
SVMってどんな時に使うの?
SVMで分類器作る
同じパラメータを
もった未分類の
データがきた
SVMで新しいデータに
カテゴリをつける!
カテゴリ分けをしたい時に使います
こんなことで使えます
投稿された記事を自動的に分類する 商品を自動的に分類する
人の情報から分類する 人の情報から分類する
パターン認識なので、自動的にデータを分類したい場合に力を発揮します。
環境構築
やってみよう
Pythonをいれよう ①
● pyenvはpythonの複数のバージョンをインストールして、用途に応じて切り替えることができるpython
環境管理ツールです。 本日はmacとubuntuのインストール方法だけさらっと説明します。
pyenv をいれるのがおすすめです!
初心者はとりあえずpyenvとanaconda2, anaconda3をいれましょう!
# pyenvのインストール
brew install pyenv
# anacondaのインストール
pyenv install anaconda2-5.0.1
pyenv install anaconda3-5.0.1
# インストール確認
pyenv versions
# anaconda3利用の設定
pyenv global anaconda3-5.0.1
# 必要パッケージのインストール
sudo apt-get install git gcc make openssl libssl-dev libbz2-dev
libreadline-dev libsqlite3-dev
# pyenvのインストール
sudo git clone git://github.com/yyuu/pyenv.git ./pyenv
# .bash_profile
export PYENV_ROOT=$HOME/.pyenv
export PATH=$PYENV_ROOT/bin:$PATH
eval "$(pyenv init -)”
# anacondaのインストール
pyenv install anaconda2-5.0.1
pyenv install anaconda3-5.0.1
# ..あとはmacと同じ
Pythonをいれよう ②
gist for mac os
https://bit.ly/2KLwk5E
gist for ubuntu
https://bit.ly/2rZOZ6J
jupyter-notebookをいれよう
● jupyterはpythonのcliを気軽に試して保存できる便利なノートブックツールです。
# pyenvのインストール
pip install jupyter
# jupyter notebook起動
jupyter notebook
分析開始
やってみよう
ケース
▪ あやめデータセットで学習させて分類してみます。
今日使うデータ
sklearn.datasetsのIrisデータセットを使います
インポートするだけで使えます
新しいnotebookを作ろう
● NewタブからPython3をクリックして新しいノートブックを作ってみましょう。
ノートに名前をつけよう
● Untitledのところをクリックするとノートブックの名前を変更して保存できます。
Pythonを書き始めよう
● フォームにPythonプログラムを書いて実行しながら結果をみていくことができます。保存もノートブッ
クのダウンロードも共有もできるよ。
さっそくデータ読み込み
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn import svm
from sklearn.svm import SVC
from sklearn import cross_validation
from sklearn.cross_validation import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.grid_search import GridSearchCV
from sklearn import preprocessing
iris = datasets.load_iris()
X = iris.data
Y = iris.target
Pandas, numpy, scikit-learn, matplotlib等必要なライブラリを読み込みます。
今回はscikit-learnのdatasetsに用意されているIrisデータセットをload_iris()で読み込みます。
とりあえず実行してみる
● 読み込まれたCSVがデータフレームに取り込まれて表になっています。Pythonでは最後の行の式がOutとして評価されますよ。
実演中。。。
データを学習用と検証用にわけて標準化します
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=None )
sc = StandardScaler()
sc.fit(X_train)
X_train_std = sc.transform(X_train)
X_test_std = sc.transform(X_test)
X_train_std
実行してみます
実演中。。。
データを使ってトレーニングします
model = SVC()
model.fit(X_train_std, Y_train)
難しいことは考えないでfit関数でトレーニングしてみましょう
実行してみます
● トレーニングが完了します
実演中。。。
正解率を検証してみます
pred_train = model.predict(X_train_std)
accuracy_train = accuracy_score(Y_train, pred_train)
print('正解率: %.2f' % accuracy_train)
pred_test = model.predict(X_test_std)
accuracy_test = accuracy_score(Y_test, pred_test)
print('正解率: %.2f' % accuracy_test)
実行してみます
実演中。。。
まとめ
人材データの分類機の話
まとめ
● 二次元のデータを分類してみました
● https://bit.ly/2KIRH7A
● 予測は毎回同じになるとは限らない
● 次回は次元削減
宣伝1
https://grow-360.com/
勇者募集中, Go, Python, Vue, Scala
宣伝2 小学生向け
サマースクールやります!
• 小学1年生〜3年生対象のデータを活用した新しい教育
を模索するサマースクールやります!
• 対象のお子様がいらっしゃる方はぜひご参加を!
• https://any-school.org/
• IT関係のボランティアスタッフ募集!
• デザイン、コーディング
• IoT機器の設定やデータ取得・管理
• データ分析
• その他Webやアプリケーション開発
財団法人エニースクール
勇者求む!
【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」
【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」

Más contenido relacionado

La actualidad más candente

La actualidad más candente (15)

Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
 
NRIが全社利用するビジネスチャットツールMattermostのご紹介
NRIが全社利用するビジネスチャットツールMattermostのご紹介NRIが全社利用するビジネスチャットツールMattermostのご紹介
NRIが全社利用するビジネスチャットツールMattermostのご紹介
 
Tableau データサイエンス勉強会 第2回の予告 Forecast FlowでAIとBIのマリアージュ
Tableau データサイエンス勉強会 第2回の予告 Forecast FlowでAIとBIのマリアージュTableau データサイエンス勉強会 第2回の予告 Forecast FlowでAIとBIのマリアージュ
Tableau データサイエンス勉強会 第2回の予告 Forecast FlowでAIとBIのマリアージュ
 
Tableau data science_20190627_distribute
Tableau data science_20190627_distributeTableau data science_20190627_distribute
Tableau data science_20190627_distribute
 
Tableau data science_20201209
Tableau data science_20201209Tableau data science_20201209
Tableau data science_20201209
 
Augmented tableau tug_ds_20201111
Augmented tableau tug_ds_20201111Augmented tableau tug_ds_20201111
Augmented tableau tug_ds_20201111
 
NRI事例に学ぶ、”検索”による大規模システム開発の生産性向上
NRI事例に学ぶ、”検索”による大規模システム開発の生産性向上NRI事例に学ぶ、”検索”による大規模システム開発の生産性向上
NRI事例に学ぶ、”検索”による大規模システム開発の生産性向上
 
人類kintoneマスター化計画
人類kintoneマスター化計画人類kintoneマスター化計画
人類kintoneマスター化計画
 
Io t labo20180312pub
Io t labo20180312pubIo t labo20180312pub
Io t labo20180312pub
 
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
 
楽天技術研究所 Society 5.0 のクリエイティブ都市
楽天技術研究所 Society 5.0 のクリエイティブ都市楽天技術研究所 Society 5.0 のクリエイティブ都市
楽天技術研究所 Society 5.0 のクリエイティブ都市
 
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
 
楽天の次世代を支える AI Platform ~ チャットボット、マーケティング、そしてCreative AI
楽天の次世代を支える AI Platform ~ チャットボット、マーケティング、そしてCreative AI楽天の次世代を支える AI Platform ~ チャットボット、マーケティング、そしてCreative AI
楽天の次世代を支える AI Platform ~ チャットボット、マーケティング、そしてCreative AI
 
PM Meetup 20180125
PM Meetup 20180125PM Meetup 20180125
PM Meetup 20180125
 
楽天における企業内スタートアップの取り組み
楽天における企業内スタートアップの取り組み楽天における企業内スタートアップの取り組み
楽天における企業内スタートアップの取り組み
 

Similar a 【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」

機械学習で導入でつまった3つの事
機械学習で導入でつまった3つの事機械学習で導入でつまった3つの事
機械学習で導入でつまった3つの事
創史 花村
 
第7回SIA研究会(例会)プレゼン資料 油野様
第7回SIA研究会(例会)プレゼン資料 油野様第7回SIA研究会(例会)プレゼン資料 油野様
第7回SIA研究会(例会)プレゼン資料 油野様
Tae Yoshida
 
20240119_Slide Share Ligla infomation.pdf
20240119_Slide Share Ligla infomation.pdf20240119_Slide Share Ligla infomation.pdf
20240119_Slide Share Ligla infomation.pdf
manabuasari
 

Similar a 【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」 (20)

【Tech Trend Talk vol.11】社外向け勉強会「自然言語処理の初歩と活用 -(GIG)」
【Tech Trend Talk vol.11】社外向け勉強会「自然言語処理の初歩と活用  -(GIG)」【Tech Trend Talk vol.11】社外向け勉強会「自然言語処理の初歩と活用  -(GIG)」
【Tech Trend Talk vol.11】社外向け勉強会「自然言語処理の初歩と活用 -(GIG)」
 
RTC2023_ChatGPT_YukiTsukamae.pdf
RTC2023_ChatGPT_YukiTsukamae.pdfRTC2023_ChatGPT_YukiTsukamae.pdf
RTC2023_ChatGPT_YukiTsukamae.pdf
 
RTC2023_ChatGPT_YukiTsukamae.pptx
RTC2023_ChatGPT_YukiTsukamae.pptxRTC2023_ChatGPT_YukiTsukamae.pptx
RTC2023_ChatGPT_YukiTsukamae.pptx
 
機械学習で導入でつまった3つの事
機械学習で導入でつまった3つの事機械学習で導入でつまった3つの事
機械学習で導入でつまった3つの事
 
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
 
成長期のスタートアップにおけるチーム開発の罠
成長期のスタートアップにおけるチーム開発の罠成長期のスタートアップにおけるチーム開発の罠
成長期のスタートアップにおけるチーム開発の罠
 
Dlc ri
Dlc riDlc ri
Dlc ri
 
DMPの分析機能を実現する技術
DMPの分析機能を実現する技術DMPの分析機能を実現する技術
DMPの分析機能を実現する技術
 
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
 
クラウドで実現!!マーケティングにおけるIoT活用事例
クラウドで実現!!マーケティングにおけるIoT活用事例クラウドで実現!!マーケティングにおけるIoT活用事例
クラウドで実現!!マーケティングにおけるIoT活用事例
 
Ridge-iの画像解析アルゴリズムの実用事例の紹介_DLLAB Case Study Day
Ridge-iの画像解析アルゴリズムの実用事例の紹介_DLLAB Case Study DayRidge-iの画像解析アルゴリズムの実用事例の紹介_DLLAB Case Study Day
Ridge-iの画像解析アルゴリズムの実用事例の紹介_DLLAB Case Study Day
 
[GTC 2018] Inception Award Ridge-i発表資料
[GTC 2018] Inception Award Ridge-i発表資料[GTC 2018] Inception Award Ridge-i発表資料
[GTC 2018] Inception Award Ridge-i発表資料
 
第7回SIA研究会(例会)プレゼン資料 油野様
第7回SIA研究会(例会)プレゼン資料 油野様第7回SIA研究会(例会)プレゼン資料 油野様
第7回SIA研究会(例会)プレゼン資料 油野様
 
[GTC 2018] DGXフォーラム Ridge-i発表資料
[GTC 2018] DGXフォーラム Ridge-i発表資料[GTC 2018] DGXフォーラム Ridge-i発表資料
[GTC 2018] DGXフォーラム Ridge-i発表資料
 
ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎
ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎
ヒートマップで、アクセス解析・仮説検証力を磨く 先生:小原 良太郎
 
データサイエンスの現場で役立つスキルを磨きやすい職場環境
データサイエンスの現場で役立つスキルを磨きやすい職場環境データサイエンスの現場で役立つスキルを磨きやすい職場環境
データサイエンスの現場で役立つスキルを磨きやすい職場環境
 
20190606_ml_and_buisiness
20190606_ml_and_buisiness20190606_ml_and_buisiness
20190606_ml_and_buisiness
 
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
2018/8/6 トレLABO2 AI案件のよくある落とし穴と人材育成
 
20240119_Slide Share Ligla infomation.pdf
20240119_Slide Share Ligla infomation.pdf20240119_Slide Share Ligla infomation.pdf
20240119_Slide Share Ligla infomation.pdf
 
ランプライト
ランプライトランプライト
ランプライト
 

Más de GIG inc.

Más de GIG inc. (20)

Lt41
Lt41Lt41
Lt41
 
Lt40
Lt40Lt40
Lt40
 
Lt39
Lt39Lt39
Lt39
 
LT38テーマ3-2
LT38テーマ3-2LT38テーマ3-2
LT38テーマ3-2
 
LT38テーマ3-1
LT38テーマ3-1LT38テーマ3-1
LT38テーマ3-1
 
LT38テーマ2-2
LT38テーマ2-2LT38テーマ2-2
LT38テーマ2-2
 
LT38テーマ2-1
LT38テーマ2-1LT38テーマ2-1
LT38テーマ2-1
 
LT38テーマ1-2
LT38テーマ1-2LT38テーマ1-2
LT38テーマ1-2
 
LT38テーマ1-1
LT38テーマ1-1LT38テーマ1-1
LT38テーマ1-1
 
lt37
lt37lt37
lt37
 
lt23後半
lt23後半lt23後半
lt23後半
 
lt23前半
lt23前半lt23前半
lt23前半
 
LT.22 GitHub Actionsを触ってみた話
LT.22 GitHub Actionsを触ってみた話LT.22 GitHub Actionsを触ってみた話
LT.22 GitHub Actionsを触ってみた話
 
LT.22 機械学習におけるPDCAを回せる環境構築の話
LT.22 機械学習におけるPDCAを回せる環境構築の話 LT.22 機械学習におけるPDCAを回せる環境構築の話
LT.22 機械学習におけるPDCAを回せる環境構築の話
 
LT.21 SPIN法を活用した人心掌握術
LT.21 SPIN法を活用した人心掌握術LT.21 SPIN法を活用した人心掌握術
LT.21 SPIN法を活用した人心掌握術
 
LT.21 スゴいチームになるフィードバック術
LT.21 スゴいチームになるフィードバック術LT.21 スゴいチームになるフィードバック術
LT.21 スゴいチームになるフィードバック術
 
LT.20 コーディングとマジックナンバー
LT.20 コーディングとマジックナンバーLT.20 コーディングとマジックナンバー
LT.20 コーディングとマジックナンバー
 
LT.20 Wordpress x nuxt.jsで実現するSPA
LT.20 Wordpress x nuxt.jsで実現するSPALT.20 Wordpress x nuxt.jsで実現するSPA
LT.20 Wordpress x nuxt.jsで実現するSPA
 
【Tech Trend Talk vol.19】社外向け勉強会「拡張するデザイン -(DONGURI)」
【Tech Trend Talk vol.19】社外向け勉強会「拡張するデザイン -(DONGURI)」【Tech Trend Talk vol.19】社外向け勉強会「拡張するデザイン -(DONGURI)」
【Tech Trend Talk vol.19】社外向け勉強会「拡張するデザイン -(DONGURI)」
 
【Tech Trend Talk vol.19】社外向け勉強会「拡張するデザイン -(GIG)」
 【Tech Trend Talk vol.19】社外向け勉強会「拡張するデザイン -(GIG)」 【Tech Trend Talk vol.19】社外向け勉強会「拡張するデザイン -(GIG)」
【Tech Trend Talk vol.19】社外向け勉強会「拡張するデザイン -(GIG)」
 

【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」