SlideShare una empresa de Scribd logo
1 de 20
Descargar para leer sin conexión
機械学習と
                jubatus

                 IPROS 2013/04/09
              株式会社イプロス 山口隼也
                   @junya100
13年4月10日水曜日
機械学習
               とは?
13年4月10日水曜日
人間が自然に行っている学習能力
  と同様の機能をコンピュータで実
  現しようとする技術・手法のこと
      by wikipedia


13年4月10日水曜日
機械学習とは、
       人間では到底処理できない
         膨大なデータを元に
       学習&判断を行ってくれる
            仕組み!

13年4月10日水曜日
これで何ができるのか?




13年4月10日水曜日
・予測(不良検知、株価予測…)
    ・分類(スパム検出、Gmail優先フォル
    ダ、カテゴリ付与、DNA配列…)
    ・パターン認識(音声認識、文字認識…)
    ・検索エンジン(ランクアルゴリズム)
    ・レコメンドエンジン
    ・機械翻訳
    ・ロボット
    ・・・
13年4月10日水曜日
機械学習システムは、
       どういうものがあるのか?



13年4月10日水曜日
最も有名なのは、
              Apache Mahout



13年4月10日水曜日
Mahoutは、既に旧世代の
     MLエンジンと言われている



13年4月10日水曜日
では、
         最新のMLエンジンとは?
          (第3世代機械学習)


13年4月10日水曜日
1. リアルタイム
                 2. 深い解析
                 3. 分散処理

              これらを同時に満たす!
                ※Mahoutは3のみ。

13年4月10日水曜日
○BSP(Bulk Synchronous Parallel)ベース
              Google Pregel
              Apache Hama
             Apache Giraph


              ○Iterative MRベース
                     Spark
                    HaLoop
                    Twister
                    Piccolo
13年4月10日水曜日
BSP、MR、IterativeMR
              の関係性




       出展元:http://sssslide.com/www.slideshare.net/doryokujin/largescale-graph-processingintroduction



13年4月10日水曜日
本命は、
              Jubatus


13年4月10日水曜日
Jubatusとは、

         NTTとPFIが共同開発した
            オープンソースの
           MLフレームワーク

13年4月10日水曜日
機械学習の基本
              (教師データありの分類の場合)


         教師データ

                                  機械学習
                  特徴抽出
  文書
                 (ベクトル化)
                                   分類

          実データ             ベクトル          分類器   モデル




13年4月10日水曜日
リアルタイムのオ
                   大規模データでも
       ンライン機械学習
                    スケール可能
        (パーセプトロ
       ン、PA・・・)

                                     モデルの一部を
                                      共有するだけ
                                     で、全体の精度
                                        を保つ
    センサー
    (Jubatus
   クライアント)
                  Jubatusサーバ   モデル



13年4月10日水曜日
Demo
              製品の自動カテゴリ付け


13年4月10日水曜日
■jubatusとmecabのインストール
          $ brew tap jubatus/jubatus
          $ brew install --HEAD pficommon
          $ brew install --HEAD re2
          $ brew install mecab
          $ brew install jubatus


          ※注意
          brewでインストールすると以下のようにre2が無効になってしまうし、
          mecabが入らないので
          $ ./waf configure --prefix=/usr/local/Cellar/jubatus/0.4.2 --disable-re2


          以下のコマンドを自分で打つ
          $ ./waf configure --prefix=/usr/local/Cellar/jubatus/0.4.2 --enable-mecab
          $ ./waf build
          $ ./waf install


          ■ipadicも忘れずにインストール
          $ ./configure --with-mecab-config=
          /usr/local/Cellar/mecab/0.994/bin/mecab-config --with-charset=utf8
          $ make
          $ sudo make install


          ■jubatusクライアントのインストール
          $ sudo pip install jubatus
13年4月10日水曜日
■jubatusサーバとして、分類器(jubaclassifier)を起動
  $ jubaclassifier --configpath config.json


  ■config.jsonの設定
  {
    "method": "PA",
    "converter": {
       "string_filter_types": {},
       "string_filter_rules": [],
       "num_filter_types": {},
       "num_filter_rules": [],
       "string_types": {
          "mecab": { "method": "dynamic", "function": "create", "path": "/usr/local/Cellar/jubatus/0.4.2/
  lib/jubatus/plugin/libmecab_splitter.dylib"}
       },
       "string_rules": [
          { "key": "*", "type": "mecab", "sample_weight": "tf", "global_weight": "idf" }
       ],
       "num_types": {},
       "num_rules": []
    },
    "parameter": {}
  }



13年4月10日水曜日

Más contenido relacionado

Destacado

Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会Yuya Unno
 
世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイント世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイントNTT DATA OSS Professional Services
 
Jubatus分類器の活用テクニック
Jubatus分類器の活用テクニックJubatus分類器の活用テクニック
Jubatus分類器の活用テクニックJubatusOfficial
 
Tech-Circle Pepperで機械学習体験ハンズオン勉強会inアトリエ秋葉原
Tech-Circle Pepperで機械学習体験ハンズオン勉強会inアトリエ秋葉原Tech-Circle Pepperで機械学習体験ハンズオン勉強会inアトリエ秋葉原
Tech-Circle Pepperで機械学習体験ハンズオン勉強会inアトリエ秋葉原Koji Shiraishi
 
HR Tech x 機械学習 導入事例紹介
HR Tech x 機械学習 導入事例紹介HR Tech x 機械学習 導入事例紹介
HR Tech x 機械学習 導入事例紹介dcubeio
 
Chainer v2 alpha
Chainer v2 alphaChainer v2 alpha
Chainer v2 alphaSeiya Tokui
 
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)
TensorFlow を使った機械学習ことはじめ (GDG京都 機械学習勉強会)TensorFlow を使った機械学習ことはじめ (GDG京都 機械学習勉強会)
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)徹 上野山
 
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。tak9029
 
Chainerの使い方と自然言語処理への応用
Chainerの使い方と自然言語処理への応用Chainerの使い方と自然言語処理への応用
Chainerの使い方と自然言語処理への応用Seiya Tokui
 

Destacado (10)

Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
 
世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイント世界征服を目指すJubatusだからこそ期待する5つのポイント
世界征服を目指すJubatusだからこそ期待する5つのポイント
 
Jubatus分類器の活用テクニック
Jubatus分類器の活用テクニックJubatus分類器の活用テクニック
Jubatus分類器の活用テクニック
 
Tech-Circle Pepperで機械学習体験ハンズオン勉強会inアトリエ秋葉原
Tech-Circle Pepperで機械学習体験ハンズオン勉強会inアトリエ秋葉原Tech-Circle Pepperで機械学習体験ハンズオン勉強会inアトリエ秋葉原
Tech-Circle Pepperで機械学習体験ハンズオン勉強会inアトリエ秋葉原
 
Go入門
Go入門Go入門
Go入門
 
HR Tech x 機械学習 導入事例紹介
HR Tech x 機械学習 導入事例紹介HR Tech x 機械学習 導入事例紹介
HR Tech x 機械学習 導入事例紹介
 
Chainer v2 alpha
Chainer v2 alphaChainer v2 alpha
Chainer v2 alpha
 
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)
TensorFlow を使った機械学習ことはじめ (GDG京都 機械学習勉強会)TensorFlow を使った機械学習ことはじめ (GDG京都 機械学習勉強会)
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)
 
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
 
Chainerの使い方と自然言語処理への応用
Chainerの使い方と自然言語処理への応用Chainerの使い方と自然言語処理への応用
Chainerの使い方と自然言語処理への応用
 

Similar a 機械学習とJubatus

DeNAインフラの今とこれから - 今編 -
DeNAインフラの今とこれから - 今編 -DeNAインフラの今とこれから - 今編 -
DeNAインフラの今とこれから - 今編 -Tomoya Kabe
 
Should we write such like plugin or not?
Should we write such like plugin or not?Should we write such like plugin or not?
Should we write such like plugin or not?SATOSHI TAGOMORI
 
Terraformディレクトリ構成のベスプラを考えてみた
Terraformディレクトリ構成のベスプラを考えてみたTerraformディレクトリ構成のベスプラを考えてみた
Terraformディレクトリ構成のベスプラを考えてみた山下 達也
 
Backlog、Cacoo にみるAWS運用の勘所 - JAWS UG 三都物語
Backlog、Cacoo にみるAWS運用の勘所 - JAWS UG 三都物語Backlog、Cacoo にみるAWS運用の勘所 - JAWS UG 三都物語
Backlog、Cacoo にみるAWS運用の勘所 - JAWS UG 三都物語Takashi Someda
 
mruby/c機能紹介20160329
mruby/c機能紹介20160329mruby/c機能紹介20160329
mruby/c機能紹介20160329shimane-itoc
 
JavaScript.Next Returns
JavaScript.Next ReturnsJavaScript.Next Returns
JavaScript.Next Returnsdynamis
 
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~Dai Iwai
 
マルチデバイス対応のコーディング・マークアップのポイント
マルチデバイス対応のコーディング・マークアップのポイントマルチデバイス対応のコーディング・マークアップのポイント
マルチデバイス対応のコーディング・マークアップのポイントMasayuki Maekawa
 
スマフォ時代に乗り遅れない為のレスポンシブ・ウェブデザイン
スマフォ時代に乗り遅れない為のレスポンシブ・ウェブデザインスマフォ時代に乗り遅れない為のレスポンシブ・ウェブデザイン
スマフォ時代に乗り遅れない為のレスポンシブ・ウェブデザインinvogue
 
2013OSC関西@京都_CloudStackとCloudFoundaryがまるわかり!
2013OSC関西@京都_CloudStackとCloudFoundaryがまるわかり!2013OSC関西@京都_CloudStackとCloudFoundaryがまるわかり!
2013OSC関西@京都_CloudStackとCloudFoundaryがまるわかり!Midori Oge
 
『JUnit実践入門』写経・実践会 in 横浜 #2
『JUnit実践入門』写経・実践会 in 横浜 #2『JUnit実践入門』写経・実践会 in 横浜 #2
『JUnit実践入門』写経・実践会 in 横浜 #2shinyaa31
 
How_to_install_OpenCV_ver1.0
How_to_install_OpenCV_ver1.0How_to_install_OpenCV_ver1.0
How_to_install_OpenCV_ver1.0Satoshi Kume
 
Rubyによるお手軽分散処理
Rubyによるお手軽分散処理Rubyによるお手軽分散処理
Rubyによるお手軽分散処理maebashi
 
できる!KickstartとAnsible!
できる!KickstartとAnsible!できる!KickstartとAnsible!
できる!KickstartとAnsible!Wataru NOGUCHI
 
大(中)規模Java script開発について
大(中)規模Java script開発について大(中)規模Java script開発について
大(中)規模Java script開発についてYuki Tanaka
 

Similar a 機械学習とJubatus (20)

DeNAインフラの今とこれから - 今編 -
DeNAインフラの今とこれから - 今編 -DeNAインフラの今とこれから - 今編 -
DeNAインフラの今とこれから - 今編 -
 
Should we write such like plugin or not?
Should we write such like plugin or not?Should we write such like plugin or not?
Should we write such like plugin or not?
 
Terraformディレクトリ構成のベスプラを考えてみた
Terraformディレクトリ構成のベスプラを考えてみたTerraformディレクトリ構成のベスプラを考えてみた
Terraformディレクトリ構成のベスプラを考えてみた
 
What is chef
What is chefWhat is chef
What is chef
 
Backlog、Cacoo にみるAWS運用の勘所 - JAWS UG 三都物語
Backlog、Cacoo にみるAWS運用の勘所 - JAWS UG 三都物語Backlog、Cacoo にみるAWS運用の勘所 - JAWS UG 三都物語
Backlog、Cacoo にみるAWS運用の勘所 - JAWS UG 三都物語
 
mruby/c機能紹介20160329
mruby/c機能紹介20160329mruby/c機能紹介20160329
mruby/c機能紹介20160329
 
JavaScript.Next Returns
JavaScript.Next ReturnsJavaScript.Next Returns
JavaScript.Next Returns
 
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
 
マルチデバイス対応のコーディング・マークアップのポイント
マルチデバイス対応のコーディング・マークアップのポイントマルチデバイス対応のコーディング・マークアップのポイント
マルチデバイス対応のコーディング・マークアップのポイント
 
Soft neuro
Soft neuroSoft neuro
Soft neuro
 
エンジニア勉強会_DECIDE
エンジニア勉強会_DECIDEエンジニア勉強会_DECIDE
エンジニア勉強会_DECIDE
 
スマフォ時代に乗り遅れない為のレスポンシブ・ウェブデザイン
スマフォ時代に乗り遅れない為のレスポンシブ・ウェブデザインスマフォ時代に乗り遅れない為のレスポンシブ・ウェブデザイン
スマフォ時代に乗り遅れない為のレスポンシブ・ウェブデザイン
 
2013OSC関西@京都_CloudStackとCloudFoundaryがまるわかり!
2013OSC関西@京都_CloudStackとCloudFoundaryがまるわかり!2013OSC関西@京都_CloudStackとCloudFoundaryがまるわかり!
2013OSC関西@京都_CloudStackとCloudFoundaryがまるわかり!
 
WPFことはじめ
WPFことはじめWPFことはじめ
WPFことはじめ
 
『JUnit実践入門』写経・実践会 in 横浜 #2
『JUnit実践入門』写経・実践会 in 横浜 #2『JUnit実践入門』写経・実践会 in 横浜 #2
『JUnit実践入門』写経・実践会 in 横浜 #2
 
How_to_install_OpenCV_ver1.0
How_to_install_OpenCV_ver1.0How_to_install_OpenCV_ver1.0
How_to_install_OpenCV_ver1.0
 
Rubyによるお手軽分散処理
Rubyによるお手軽分散処理Rubyによるお手軽分散処理
Rubyによるお手軽分散処理
 
できる!KickstartとAnsible!
できる!KickstartとAnsible!できる!KickstartとAnsible!
できる!KickstartとAnsible!
 
SensorBeeの紹介
SensorBeeの紹介SensorBeeの紹介
SensorBeeの紹介
 
大(中)規模Java script開発について
大(中)規模Java script開発について大(中)規模Java script開発について
大(中)規模Java script開発について
 

Más de Junya Yamaguchi

戦国時代を生きた「黒田官兵衛」とWeb時代を生きる「エンジニア」
戦国時代を生きた「黒田官兵衛」とWeb時代を生きる「エンジニア」戦国時代を生きた「黒田官兵衛」とWeb時代を生きる「エンジニア」
戦国時代を生きた「黒田官兵衛」とWeb時代を生きる「エンジニア」Junya Yamaguchi
 
量子コンピュータ(Quantum Computer)
量子コンピュータ(Quantum Computer)量子コンピュータ(Quantum Computer)
量子コンピュータ(Quantum Computer)Junya Yamaguchi
 
Twilio Usecase at iPROS in Japan
Twilio Usecase at iPROS in JapanTwilio Usecase at iPROS in Japan
Twilio Usecase at iPROS in JapanJunya Yamaguchi
 
イプロス・リーン・マニフェスト
イプロス・リーン・マニフェストイプロス・リーン・マニフェスト
イプロス・リーン・マニフェストJunya Yamaguchi
 
デジタルマーケティグ基礎用語(1)
デジタルマーケティグ基礎用語(1)デジタルマーケティグ基礎用語(1)
デジタルマーケティグ基礎用語(1)Junya Yamaguchi
 
TACについて調べてみました
TACについて調べてみましたTACについて調べてみました
TACについて調べてみましたJunya Yamaguchi
 
Makersを題材にソフトウェア開発を考える
Makersを題材にソフトウェア開発を考えるMakersを題材にソフトウェア開発を考える
Makersを題材にソフトウェア開発を考えるJunya Yamaguchi
 
Marketing Automation Study
Marketing Automation StudyMarketing Automation Study
Marketing Automation StudyJunya Yamaguchi
 
ソフトウェア開発の7つのなぜに答えます
ソフトウェア開発の7つのなぜに答えますソフトウェア開発の7つのなぜに答えます
ソフトウェア開発の7つのなぜに答えますJunya Yamaguchi
 
boudio ライトニングトーク
boudio ライトニングトークboudio ライトニングトーク
boudio ライトニングトークJunya Yamaguchi
 

Más de Junya Yamaguchi (15)

MBaaS - Parse
MBaaS - ParseMBaaS - Parse
MBaaS - Parse
 
戦国時代を生きた「黒田官兵衛」とWeb時代を生きる「エンジニア」
戦国時代を生きた「黒田官兵衛」とWeb時代を生きる「エンジニア」戦国時代を生きた「黒田官兵衛」とWeb時代を生きる「エンジニア」
戦国時代を生きた「黒田官兵衛」とWeb時代を生きる「エンジニア」
 
量子コンピュータ(Quantum Computer)
量子コンピュータ(Quantum Computer)量子コンピュータ(Quantum Computer)
量子コンピュータ(Quantum Computer)
 
Twilio Usecase at iPROS in Japan
Twilio Usecase at iPROS in JapanTwilio Usecase at iPROS in Japan
Twilio Usecase at iPROS in Japan
 
Data Onboarding
Data OnboardingData Onboarding
Data Onboarding
 
イプロス・リーン・マニフェスト
イプロス・リーン・マニフェストイプロス・リーン・マニフェスト
イプロス・リーン・マニフェスト
 
デジタルマーケティグ基礎用語(1)
デジタルマーケティグ基礎用語(1)デジタルマーケティグ基礎用語(1)
デジタルマーケティグ基礎用語(1)
 
TACについて調べてみました
TACについて調べてみましたTACについて調べてみました
TACについて調べてみました
 
Makersを題材にソフトウェア開発を考える
Makersを題材にソフトウェア開発を考えるMakersを題材にソフトウェア開発を考える
Makersを題材にソフトウェア開発を考える
 
Marketing Automation Study
Marketing Automation StudyMarketing Automation Study
Marketing Automation Study
 
Google bigqueryとは
Google bigqueryとはGoogle bigqueryとは
Google bigqueryとは
 
ソフトウェア開発の7つのなぜに答えます
ソフトウェア開発の7つのなぜに答えますソフトウェア開発の7つのなぜに答えます
ソフトウェア開発の7つのなぜに答えます
 
Strata conference 2012
Strata conference 2012Strata conference 2012
Strata conference 2012
 
boudio ライトニングトーク
boudio ライトニングトークboudio ライトニングトーク
boudio ライトニングトーク
 
P2Pって何?
P2Pって何?P2Pって何?
P2Pって何?
 

Último

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 

Último (9)

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 

機械学習とJubatus

  • 1. 機械学習と jubatus IPROS 2013/04/09 株式会社イプロス 山口隼也 @junya100 13年4月10日水曜日
  • 2. 機械学習 とは? 13年4月10日水曜日
  • 3. 人間が自然に行っている学習能力 と同様の機能をコンピュータで実 現しようとする技術・手法のこと by wikipedia 13年4月10日水曜日
  • 4. 機械学習とは、 人間では到底処理できない 膨大なデータを元に 学習&判断を行ってくれる 仕組み! 13年4月10日水曜日
  • 6. ・予測(不良検知、株価予測…) ・分類(スパム検出、Gmail優先フォル ダ、カテゴリ付与、DNA配列…) ・パターン認識(音声認識、文字認識…) ・検索エンジン(ランクアルゴリズム) ・レコメンドエンジン ・機械翻訳 ・ロボット ・・・ 13年4月10日水曜日
  • 7. 機械学習システムは、 どういうものがあるのか? 13年4月10日水曜日
  • 8. 最も有名なのは、 Apache Mahout 13年4月10日水曜日
  • 9. Mahoutは、既に旧世代の MLエンジンと言われている 13年4月10日水曜日
  • 10. では、 最新のMLエンジンとは? (第3世代機械学習) 13年4月10日水曜日
  • 11. 1. リアルタイム 2. 深い解析 3. 分散処理 これらを同時に満たす! ※Mahoutは3のみ。 13年4月10日水曜日
  • 12. ○BSP(Bulk Synchronous Parallel)ベース Google Pregel Apache Hama Apache Giraph ○Iterative MRベース Spark HaLoop Twister Piccolo 13年4月10日水曜日
  • 13. BSP、MR、IterativeMR の関係性 出展元:http://sssslide.com/www.slideshare.net/doryokujin/largescale-graph-processingintroduction 13年4月10日水曜日
  • 14. 本命は、 Jubatus 13年4月10日水曜日
  • 15. Jubatusとは、 NTTとPFIが共同開発した オープンソースの MLフレームワーク 13年4月10日水曜日
  • 16. 機械学習の基本 (教師データありの分類の場合) 教師データ 機械学習 特徴抽出 文書 (ベクトル化) 分類 実データ ベクトル 分類器 モデル 13年4月10日水曜日
  • 17. リアルタイムのオ 大規模データでも ンライン機械学習 スケール可能 (パーセプトロ ン、PA・・・) モデルの一部を 共有するだけ で、全体の精度 を保つ センサー (Jubatus クライアント) Jubatusサーバ モデル 13年4月10日水曜日
  • 18. Demo 製品の自動カテゴリ付け 13年4月10日水曜日
  • 19. ■jubatusとmecabのインストール $ brew tap jubatus/jubatus $ brew install --HEAD pficommon $ brew install --HEAD re2 $ brew install mecab $ brew install jubatus ※注意 brewでインストールすると以下のようにre2が無効になってしまうし、 mecabが入らないので $ ./waf configure --prefix=/usr/local/Cellar/jubatus/0.4.2 --disable-re2 以下のコマンドを自分で打つ $ ./waf configure --prefix=/usr/local/Cellar/jubatus/0.4.2 --enable-mecab $ ./waf build $ ./waf install ■ipadicも忘れずにインストール $ ./configure --with-mecab-config= /usr/local/Cellar/mecab/0.994/bin/mecab-config --with-charset=utf8 $ make $ sudo make install ■jubatusクライアントのインストール $ sudo pip install jubatus 13年4月10日水曜日
  • 20. ■jubatusサーバとして、分類器(jubaclassifier)を起動 $ jubaclassifier --configpath config.json ■config.jsonの設定 { "method": "PA", "converter": { "string_filter_types": {}, "string_filter_rules": [], "num_filter_types": {}, "num_filter_rules": [], "string_types": { "mecab": { "method": "dynamic", "function": "create", "path": "/usr/local/Cellar/jubatus/0.4.2/ lib/jubatus/plugin/libmecab_splitter.dylib"} }, "string_rules": [ { "key": "*", "type": "mecab", "sample_weight": "tf", "global_weight": "idf" } ], "num_types": {}, "num_rules": [] }, "parameter": {} } 13年4月10日水曜日