SlideShare una empresa de Scribd logo
1 de 24
Descargar para leer sin conexión
Copyright 2014 Shiroyagi Corporation. All rights reserved.
シバタアキラ, Ph.D.
世界最大級分析モデルコンペ
「Kaggle」の最新動向
白ヤギコーポレーション
堅田洋資
白ヤギコーポレーション
田中秀樹
PyData.Tokyo
Copyright 2015 Shiroyagi Corporation. All rights reserved. 2
PyData.Tokyoかなり盛り上がってます
シバタアキラ, Ph.D. @madyagi
• 2013 -:CEO @白ヤギコーポレーション
• カメリオ : 人工知能型キュレーションニュースアプリ
• カメリオ API: コンテンツレコメンデーション API
• 2010 - 2013: 戦略コンサルティング @BCG
• 2007 - 2010: データサイエンティスト @NYU
• ヒッグス粒子の発見のためのデータ解析 @LHC, CERN
• 2004 - 2007: Ph.D. 高エネルギー物理学 @London大学
Copyright 2014 Shiroyagi Corporation. All rights reserved. 3
ビッグデータ
データ 機械学習
ディープラーニング
KPI
人工知能
Hadoop
AWS
統計モデリング
IoT
オープンデータ
予測モデル
データサイエンティスト
自然言語処理
Apache Spark 統計学
ニューラルネットワーク
ニューラルネットワーク
ログ解析
Python
グロースハック
Copyright 2015 Shiroyagi Corporation. All rights reserved. 4
PyData.Tokyo:

データサイエンティストのためのコミュニティー
Copyright 2015 Shiroyagi Corporation. All rights reserved. 5
これまでの活動
30人の座席にに毎回百人近い応募
• ディープラーニング
• 分散型機械学習
• データ解析インフラ
などの旬なテーマを扱い、毎回その
分野で活躍するデータサイエンティ
ストにご登壇いただいています。
実際に現場で活躍するデータサイエ
ンティストによる「濃い」議論が毎
回繰り広げられます。
Copyright 2015 Shiroyagi Corporation. All rights reserved. 6
イベントは渋谷のデンソーアイティーラボラトリにて開催
PyData.Tokyoチュートリアルの様子
Copyright 2015 Shiroyagi Corporation. All rights reserved. 7
タイタニックの生存者予測
Copyright 2015 Shiroyagi Corporation. All rights reserved. 8
イベント詳細は連載中
Copyright 2015 Shiroyagi Corporation. All rights reserved. 9
Kaggleとは(kaggle.com)
企業とデータサイエンティストとをつなぐ新しい仕組み
Copyright 2015 Shiroyagi Corporation. All rights reserved. 10
Kaggleのコンペの種類(一部)
Featured: 企業がデータを公開し、参加者は予測モデルの精度
を競う。チームでの参加も可能で、上位参加者には賞金。
Research: 科学的なデータの分析コンペ。入賞者は、賞金に
加え学会へ招待されることも。
Masters: 総合ランキング上位のデータサイエンティストが招
待参加。ほぼ全員に報酬が支払われる。
Recruiting: 企業が採用目的で行うコンペ。参加者は匿名的に
エントリーすることができる。
Copyright 2015 Shiroyagi Corporation. All rights reserved. 11
現在のアクティブコンペ
Featured
Recruiting
Research
Copyright 2015 Shiroyagi Corporation. All rights reserved. 12
データサイエンティスト
@白ヤギコーポレーション
その他 15コンペに参加
• Kaggle歴: 2年
• University of San Franciscoの

MS in Analyticsに留学
• 大学ではデータサイエンス専攻
堅田 洋資
Copyright 2015 Shiroyagi Corporation. All rights reserved. 13
田中 秀樹 上位0.1%
Copyright 2015 Shiroyagi Corporation. All rights reserved. 14
たった137店舗のデータで100,000店舗の売上を予測
賞金:$30,000 (約360万円)
参加者:1,714チーム(4/17時点)
ファストフードレストランの売上予測
Copyright 2015 Shiroyagi Corporation. All rights reserved. 15
・・・
丁寧な異常値除去で現在97位/1714位
Copyright 2015 Shiroyagi Corporation. All rights reserved. 16
ヒッグス機械学習チャレンジ
Copyright 2015 Shiroyagi Corporation. All rights reserved. 17
ヒッグス機械学習チャレンジ
Copyright 2015 Shiroyagi Corporation. All rights reserved. 18
犬 vs 猫
Copyright 2015 Shiroyagi Corporation. All rights reserved. 19
Training
Test
: 25,000 images
: 12,500 images
Copyright 2015 Shiroyagi Corporation. All rights reserved. 20
Deep Learningの研究者@NYU
GPUのエンジニア@NVIDIA
Deep Learningの研究者
Deep Learningで圧倒的な成果
Copyright 2015 Shiroyagi Corporation. All rights reserved. 21
Walmartの商品の売上予測
過去の実績と天気から
店舗別・日別・アイテム別で販売個数を予測する
賞品:ウォルマートでのデータサイエンティスト職(※インタビュー後)
参加者:194チーム(4/17時点)
Copyright 2015 Shiroyagi Corporation. All rights reserved. 22
Skills	
  required:	
  	
  
• Knowledge	
  of	
  applied	
  statistics,	
  including	
  regression	
  models.	
  	
  
• Knowledge	
  of	
  SQL	
  and	
  Python.	
  	
  
• Knowledge	
  of	
  data	
  analysis	
  with	
  Python	
  or	
  R.	
  	
  
• Knowledge	
  of	
  Java.	
  	
  
• Experience	
  in	
  Hadoop	
  or	
  other	
  MapReduce	
  paradigms	
  and	
  
associated	
  languages	
  such	
  as	
  Hive	
  or	
  Pig.
ウォルマート(US) Data scientistに求めるスキル
Kaggleを採用活動に使うメリット
ツールが使える人材は増えてきた
結果が出せる人材はどこにいるか?
Copyright 2015 Shiroyagi Corporation. All rights reserved. 23
Job Board
Copyright 2015 Shiroyagi Corporation. All rights reserved. 24
@
一緒にプレイしてくれる
データサイエンティストを募集中!

Más contenido relacionado

Destacado

人工知能をビジネスに活かす
人工知能をビジネスに活かす人工知能をビジネスに活かす
人工知能をビジネスに活かすAkira Shibata
 
DataRobot活用状況@リクルートテクノロジーズ
DataRobot活用状況@リクルートテクノロジーズDataRobot活用状況@リクルートテクノロジーズ
DataRobot活用状況@リクルートテクノロジーズRecruit Technologies
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組Recruit Technologies
 
Analysis Software Development
Analysis Software DevelopmentAnalysis Software Development
Analysis Software DevelopmentAkira Shibata
 
PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1Akira Shibata
 
素人がDeep Learningと他の機械学習の性能を比較してみた
素人がDeep Learningと他の機械学習の性能を比較してみた素人がDeep Learningと他の機械学習の性能を比較してみた
素人がDeep Learningと他の機械学習の性能を比較してみたToru Imai
 
あなたの業務に機械学習を活用する5つのポイント
あなたの業務に機械学習を活用する5つのポイントあなたの業務に機械学習を活用する5つのポイント
あなたの業務に機械学習を活用する5つのポイントShohei Hido
 
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual TalksYuya Unno
 
『人工知能のための哲学塾』刊行記念イベント〜「人工知能×ビジネス」〜
『人工知能のための哲学塾』刊行記念イベント〜「人工知能×ビジネス」〜『人工知能のための哲学塾』刊行記念イベント〜「人工知能×ビジネス」〜
『人工知能のための哲学塾』刊行記念イベント〜「人工知能×ビジネス」〜Youichiro Miyake
 
人工知能はビジネスを変えるのか
人工知能はビジネスを変えるのか人工知能はビジネスを変えるのか
人工知能はビジネスを変えるのかKohki Obata
 
Top Cross Section Measurement
Top Cross Section MeasurementTop Cross Section Measurement
Top Cross Section MeasurementAkira Shibata
 
The LHC Explained by CNN
The LHC Explained by CNNThe LHC Explained by CNN
The LHC Explained by CNNAkira Shibata
 
niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例Makoto SHIMURA
 
Map reduce programming model to solve graph problems
Map reduce programming model to solve graph problemsMap reduce programming model to solve graph problems
Map reduce programming model to solve graph problemsNishant Gandhi
 
【19-D-1】人間と機械学習のはざま:どこまでアルゴリズムに任せるか
【19-D-1】人間と機械学習のはざま:どこまでアルゴリズムに任せるか【19-D-1】人間と機械学習のはざま:どこまでアルゴリズムに任せるか
【19-D-1】人間と機械学習のはざま:どこまでアルゴリズムに任せるかShiroyagi Corporation
 
20161112 第17回 全脳アーキテクチャ若手の会 勉強会 カジュアルトーク 「AI技術をサービスで活用するには?」 アディッシュ池谷
20161112 第17回 全脳アーキテクチャ若手の会 勉強会 カジュアルトーク 「AI技術をサービスで活用するには?」 アディッシュ池谷20161112 第17回 全脳アーキテクチャ若手の会 勉強会 カジュアルトーク 「AI技術をサービスで活用するには?」 アディッシュ池谷
20161112 第17回 全脳アーキテクチャ若手の会 勉強会 カジュアルトーク 「AI技術をサービスで活用するには?」 アディッシュ池谷Masao Ikeya
 
JAWS re:Mote 2015 Nagoya
JAWS re:Mote 2015 NagoyaJAWS re:Mote 2015 Nagoya
JAWS re:Mote 2015 Nagoya陽平 山口
 
ログ分析で支えるゲームパラメータ設計 #denatechcon
ログ分析で支えるゲームパラメータ設計 #denatechconログ分析で支えるゲームパラメータ設計 #denatechcon
ログ分析で支えるゲームパラメータ設計 #denatechconDeNA
 
AiとIoTによる産業最適化と社会問題解決
AiとIoTによる産業最適化と社会問題解決AiとIoTによる産業最適化と社会問題解決
AiとIoTによる産業最適化と社会問題解決Osaka University
 

Destacado (20)

人工知能をビジネスに活かす
人工知能をビジネスに活かす人工知能をビジネスに活かす
人工知能をビジネスに活かす
 
DataRobot活用状況@リクルートテクノロジーズ
DataRobot活用状況@リクルートテクノロジーズDataRobot活用状況@リクルートテクノロジーズ
DataRobot活用状況@リクルートテクノロジーズ
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組
 
Analysis Software Development
Analysis Software DevelopmentAnalysis Software Development
Analysis Software Development
 
PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1
 
素人がDeep Learningと他の機械学習の性能を比較してみた
素人がDeep Learningと他の機械学習の性能を比較してみた素人がDeep Learningと他の機械学習の性能を比較してみた
素人がDeep Learningと他の機械学習の性能を比較してみた
 
あなたの業務に機械学習を活用する5つのポイント
あなたの業務に機械学習を活用する5つのポイントあなたの業務に機械学習を活用する5つのポイント
あなたの業務に機械学習を活用する5つのポイント
 
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
 
『人工知能のための哲学塾』刊行記念イベント〜「人工知能×ビジネス」〜
『人工知能のための哲学塾』刊行記念イベント〜「人工知能×ビジネス」〜『人工知能のための哲学塾』刊行記念イベント〜「人工知能×ビジネス」〜
『人工知能のための哲学塾』刊行記念イベント〜「人工知能×ビジネス」〜
 
人工知能はビジネスを変えるのか
人工知能はビジネスを変えるのか人工知能はビジネスを変えるのか
人工知能はビジネスを変えるのか
 
Top Cross Section Measurement
Top Cross Section MeasurementTop Cross Section Measurement
Top Cross Section Measurement
 
The LHC Explained by CNN
The LHC Explained by CNNThe LHC Explained by CNN
The LHC Explained by CNN
 
niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例
 
Map reduce programming model to solve graph problems
Map reduce programming model to solve graph problemsMap reduce programming model to solve graph problems
Map reduce programming model to solve graph problems
 
【19-D-1】人間と機械学習のはざま:どこまでアルゴリズムに任せるか
【19-D-1】人間と機械学習のはざま:どこまでアルゴリズムに任せるか【19-D-1】人間と機械学習のはざま:どこまでアルゴリズムに任せるか
【19-D-1】人間と機械学習のはざま:どこまでアルゴリズムに任せるか
 
20161112 第17回 全脳アーキテクチャ若手の会 勉強会 カジュアルトーク 「AI技術をサービスで活用するには?」 アディッシュ池谷
20161112 第17回 全脳アーキテクチャ若手の会 勉強会 カジュアルトーク 「AI技術をサービスで活用するには?」 アディッシュ池谷20161112 第17回 全脳アーキテクチャ若手の会 勉強会 カジュアルトーク 「AI技術をサービスで活用するには?」 アディッシュ池谷
20161112 第17回 全脳アーキテクチャ若手の会 勉強会 カジュアルトーク 「AI技術をサービスで活用するには?」 アディッシュ池谷
 
JAWS re:Mote 2015 Nagoya
JAWS re:Mote 2015 NagoyaJAWS re:Mote 2015 Nagoya
JAWS re:Mote 2015 Nagoya
 
ログ分析で支えるゲームパラメータ設計 #denatechcon
ログ分析で支えるゲームパラメータ設計 #denatechconログ分析で支えるゲームパラメータ設計 #denatechcon
ログ分析で支えるゲームパラメータ設計 #denatechcon
 
LHC for Students
LHC for StudentsLHC for Students
LHC for Students
 
AiとIoTによる産業最適化と社会問題解決
AiとIoTによる産業最適化と社会問題解決AiとIoTによる産業最適化と社会問題解決
AiとIoTによる産業最適化と社会問題解決
 

Similar a 20150421 日経ビッグデータカンファレンス

「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史Leading Edge Co.,Ltd.
 
[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...
[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...
[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...Deep Learning Lab(ディープラーニング・ラボ)
 
[GTC 2018] GTCテクニカルセッション_0913 Ridge-i発表資料
[GTC 2018] GTCテクニカルセッション_0913 Ridge-i発表資料[GTC 2018] GTCテクニカルセッション_0913 Ridge-i発表資料
[GTC 2018] GTCテクニカルセッション_0913 Ridge-i発表資料Ridge-i
 
国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例
国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例
国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例秀 齊藤
 
オープンデータのAPI利用と開発
オープンデータのAPI利用と開発オープンデータのAPI利用と開発
オープンデータのAPI利用と開発Hiroyuki Ichikawa
 
Startup science 2018 4 ビジネスモデルの型とPlanAの作成
Startup science 2018 4 ビジネスモデルの型とPlanAの作成Startup science 2018 4 ビジネスモデルの型とPlanAの作成
Startup science 2018 4 ビジネスモデルの型とPlanAの作成Masa Tadokoro
 
[GTC 2018] Inception Award Ridge-i発表資料
[GTC 2018] Inception Award Ridge-i発表資料[GTC 2018] Inception Award Ridge-i発表資料
[GTC 2018] Inception Award Ridge-i発表資料Ridge-i
 
保育園でAIを使ってみた!
保育園でAIを使ってみた!保育園でAIを使ってみた!
保育園でAIを使ってみた!佳孝 中田
 
Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Kenji Noguchi
 
2015 07-23 Tokyo Realm Meetup
2015 07-23 Tokyo Realm Meetup2015 07-23 Tokyo Realm Meetup
2015 07-23 Tokyo Realm MeetupNiko Yuwono
 
Tableau data science_20190627_distribute
Tableau data science_20190627_distributeTableau data science_20190627_distribute
Tableau data science_20190627_distributeMasabumi Furuhata
 
拝啓、プロダクトオーナー様。
拝啓、プロダクトオーナー様。拝啓、プロダクトオーナー様。
拝啓、プロダクトオーナー様。GuildWorks
 
拝啓、プロダクトオーナー様。
拝啓、プロダクトオーナー様。拝啓、プロダクトオーナー様。
拝啓、プロダクトオーナー様。toshihiro ichitani
 
2016年度コーポレートフェローシップ活動報告(山本さん)
2016年度コーポレートフェローシップ活動報告(山本さん)2016年度コーポレートフェローシップ活動報告(山本さん)
2016年度コーポレートフェローシップ活動報告(山本さん)Code for Japan
 
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析aitc_jp
 
20190606_ml_and_buisiness
20190606_ml_and_buisiness20190606_ml_and_buisiness
20190606_ml_and_buisinessYoichi Tokita
 

Similar a 20150421 日経ビッグデータカンファレンス (20)

「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
 
Ridge-iの画像解析アルゴリズムの実用事例の紹介_DLLAB Case Study Day
Ridge-iの画像解析アルゴリズムの実用事例の紹介_DLLAB Case Study DayRidge-iの画像解析アルゴリズムの実用事例の紹介_DLLAB Case Study Day
Ridge-iの画像解析アルゴリズムの実用事例の紹介_DLLAB Case Study Day
 
[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...
[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...
[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...
 
[GTC 2018] GTCテクニカルセッション_0913 Ridge-i発表資料
[GTC 2018] GTCテクニカルセッション_0913 Ridge-i発表資料[GTC 2018] GTCテクニカルセッション_0913 Ridge-i発表資料
[GTC 2018] GTCテクニカルセッション_0913 Ridge-i発表資料
 
国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例
国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例
国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例
 
オープンデータのAPI利用と開発
オープンデータのAPI利用と開発オープンデータのAPI利用と開発
オープンデータのAPI利用と開発
 
Startup science 2018 4 ビジネスモデルの型とPlanAの作成
Startup science 2018 4 ビジネスモデルの型とPlanAの作成Startup science 2018 4 ビジネスモデルの型とPlanAの作成
Startup science 2018 4 ビジネスモデルの型とPlanAの作成
 
ゼロから学ぶAI
ゼロから学ぶAIゼロから学ぶAI
ゼロから学ぶAI
 
[GTC 2018] Inception Award Ridge-i発表資料
[GTC 2018] Inception Award Ridge-i発表資料[GTC 2018] Inception Award Ridge-i発表資料
[GTC 2018] Inception Award Ridge-i発表資料
 
保育園でAIを使ってみた!
保育園でAIを使ってみた!保育園でAIを使ってみた!
保育園でAIを使ってみた!
 
Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ
 
2015 07-23 Tokyo Realm Meetup
2015 07-23 Tokyo Realm Meetup2015 07-23 Tokyo Realm Meetup
2015 07-23 Tokyo Realm Meetup
 
Tableau data science_20190627_distribute
Tableau data science_20190627_distributeTableau data science_20190627_distribute
Tableau data science_20190627_distribute
 
拝啓、プロダクトオーナー様。
拝啓、プロダクトオーナー様。拝啓、プロダクトオーナー様。
拝啓、プロダクトオーナー様。
 
拝啓、プロダクトオーナー様。
拝啓、プロダクトオーナー様。拝啓、プロダクトオーナー様。
拝啓、プロダクトオーナー様。
 
Dlc ri
Dlc riDlc ri
Dlc ri
 
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
 
2016年度コーポレートフェローシップ活動報告(山本さん)
2016年度コーポレートフェローシップ活動報告(山本さん)2016年度コーポレートフェローシップ活動報告(山本さん)
2016年度コーポレートフェローシップ活動報告(山本さん)
 
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
2018年12月15日 AITC女子会 顔認識を活用したセミナー参加者の満足度分析
 
20190606_ml_and_buisiness
20190606_ml_and_buisiness20190606_ml_and_buisiness
20190606_ml_and_buisiness
 

Más de Akira Shibata

大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さんAkira Shibata
 
W&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfW&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfAkira Shibata
 
20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdfAkira Shibata
 
W&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfW&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfAkira Shibata
 
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfmakoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfAkira Shibata
 
LLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdfLLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdfAkira Shibata
 
Kaggle and data science
Kaggle and data scienceKaggle and data science
Kaggle and data scienceAkira Shibata
 
PyData NYC by Akira Shibata
PyData NYC by Akira ShibataPyData NYC by Akira Shibata
PyData NYC by Akira ShibataAkira Shibata
 
20141127 py datatokyomeetup2
20141127 py datatokyomeetup220141127 py datatokyomeetup2
20141127 py datatokyomeetup2Akira Shibata
 
Analysis Software Benchmark
Analysis Software BenchmarkAnalysis Software Benchmark
Analysis Software BenchmarkAkira Shibata
 
Top quark physics at the LHC
Top quark physics at the LHCTop quark physics at the LHC
Top quark physics at the LHCAkira Shibata
 

Más de Akira Shibata (13)

大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
 
W&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfW&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdf
 
20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf
 
W&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfW&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdf
 
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfmakoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
 
LLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdfLLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdf
 
W&B Seminar #4.pdf
W&B Seminar #4.pdfW&B Seminar #4.pdf
W&B Seminar #4.pdf
 
Kaggle and data science
Kaggle and data scienceKaggle and data science
Kaggle and data science
 
Data x
Data xData x
Data x
 
PyData NYC by Akira Shibata
PyData NYC by Akira ShibataPyData NYC by Akira Shibata
PyData NYC by Akira Shibata
 
20141127 py datatokyomeetup2
20141127 py datatokyomeetup220141127 py datatokyomeetup2
20141127 py datatokyomeetup2
 
Analysis Software Benchmark
Analysis Software BenchmarkAnalysis Software Benchmark
Analysis Software Benchmark
 
Top quark physics at the LHC
Top quark physics at the LHCTop quark physics at the LHC
Top quark physics at the LHC
 

20150421 日経ビッグデータカンファレンス

  • 1. Copyright 2014 Shiroyagi Corporation. All rights reserved. シバタアキラ, Ph.D. 世界最大級分析モデルコンペ 「Kaggle」の最新動向 白ヤギコーポレーション 堅田洋資 白ヤギコーポレーション 田中秀樹 PyData.Tokyo
  • 2. Copyright 2015 Shiroyagi Corporation. All rights reserved. 2 PyData.Tokyoかなり盛り上がってます シバタアキラ, Ph.D. @madyagi • 2013 -:CEO @白ヤギコーポレーション • カメリオ : 人工知能型キュレーションニュースアプリ • カメリオ API: コンテンツレコメンデーション API • 2010 - 2013: 戦略コンサルティング @BCG • 2007 - 2010: データサイエンティスト @NYU • ヒッグス粒子の発見のためのデータ解析 @LHC, CERN • 2004 - 2007: Ph.D. 高エネルギー物理学 @London大学
  • 3. Copyright 2014 Shiroyagi Corporation. All rights reserved. 3 ビッグデータ データ 機械学習 ディープラーニング KPI 人工知能 Hadoop AWS 統計モデリング IoT オープンデータ 予測モデル データサイエンティスト 自然言語処理 Apache Spark 統計学 ニューラルネットワーク ニューラルネットワーク ログ解析 Python グロースハック
  • 4. Copyright 2015 Shiroyagi Corporation. All rights reserved. 4 PyData.Tokyo:
 データサイエンティストのためのコミュニティー
  • 5. Copyright 2015 Shiroyagi Corporation. All rights reserved. 5 これまでの活動 30人の座席にに毎回百人近い応募 • ディープラーニング • 分散型機械学習 • データ解析インフラ などの旬なテーマを扱い、毎回その 分野で活躍するデータサイエンティ ストにご登壇いただいています。 実際に現場で活躍するデータサイエ ンティストによる「濃い」議論が毎 回繰り広げられます。
  • 6. Copyright 2015 Shiroyagi Corporation. All rights reserved. 6 イベントは渋谷のデンソーアイティーラボラトリにて開催 PyData.Tokyoチュートリアルの様子
  • 7. Copyright 2015 Shiroyagi Corporation. All rights reserved. 7 タイタニックの生存者予測
  • 8. Copyright 2015 Shiroyagi Corporation. All rights reserved. 8 イベント詳細は連載中
  • 9. Copyright 2015 Shiroyagi Corporation. All rights reserved. 9 Kaggleとは(kaggle.com) 企業とデータサイエンティストとをつなぐ新しい仕組み
  • 10. Copyright 2015 Shiroyagi Corporation. All rights reserved. 10 Kaggleのコンペの種類(一部) Featured: 企業がデータを公開し、参加者は予測モデルの精度 を競う。チームでの参加も可能で、上位参加者には賞金。 Research: 科学的なデータの分析コンペ。入賞者は、賞金に 加え学会へ招待されることも。 Masters: 総合ランキング上位のデータサイエンティストが招 待参加。ほぼ全員に報酬が支払われる。 Recruiting: 企業が採用目的で行うコンペ。参加者は匿名的に エントリーすることができる。
  • 11. Copyright 2015 Shiroyagi Corporation. All rights reserved. 11 現在のアクティブコンペ Featured Recruiting Research
  • 12. Copyright 2015 Shiroyagi Corporation. All rights reserved. 12 データサイエンティスト @白ヤギコーポレーション その他 15コンペに参加 • Kaggle歴: 2年 • University of San Franciscoの
 MS in Analyticsに留学 • 大学ではデータサイエンス専攻 堅田 洋資
  • 13. Copyright 2015 Shiroyagi Corporation. All rights reserved. 13 田中 秀樹 上位0.1%
  • 14. Copyright 2015 Shiroyagi Corporation. All rights reserved. 14 たった137店舗のデータで100,000店舗の売上を予測 賞金:$30,000 (約360万円) 参加者:1,714チーム(4/17時点) ファストフードレストランの売上予測
  • 15. Copyright 2015 Shiroyagi Corporation. All rights reserved. 15 ・・・ 丁寧な異常値除去で現在97位/1714位
  • 16. Copyright 2015 Shiroyagi Corporation. All rights reserved. 16 ヒッグス機械学習チャレンジ
  • 17. Copyright 2015 Shiroyagi Corporation. All rights reserved. 17 ヒッグス機械学習チャレンジ
  • 18. Copyright 2015 Shiroyagi Corporation. All rights reserved. 18 犬 vs 猫
  • 19. Copyright 2015 Shiroyagi Corporation. All rights reserved. 19 Training Test : 25,000 images : 12,500 images
  • 20. Copyright 2015 Shiroyagi Corporation. All rights reserved. 20 Deep Learningの研究者@NYU GPUのエンジニア@NVIDIA Deep Learningの研究者 Deep Learningで圧倒的な成果
  • 21. Copyright 2015 Shiroyagi Corporation. All rights reserved. 21 Walmartの商品の売上予測 過去の実績と天気から 店舗別・日別・アイテム別で販売個数を予測する 賞品:ウォルマートでのデータサイエンティスト職(※インタビュー後) 参加者:194チーム(4/17時点)
  • 22. Copyright 2015 Shiroyagi Corporation. All rights reserved. 22 Skills  required:     • Knowledge  of  applied  statistics,  including  regression  models.     • Knowledge  of  SQL  and  Python.     • Knowledge  of  data  analysis  with  Python  or  R.     • Knowledge  of  Java.     • Experience  in  Hadoop  or  other  MapReduce  paradigms  and   associated  languages  such  as  Hive  or  Pig. ウォルマート(US) Data scientistに求めるスキル Kaggleを採用活動に使うメリット ツールが使える人材は増えてきた 結果が出せる人材はどこにいるか?
  • 23. Copyright 2015 Shiroyagi Corporation. All rights reserved. 23 Job Board
  • 24. Copyright 2015 Shiroyagi Corporation. All rights reserved. 24 @ 一緒にプレイしてくれる データサイエンティストを募集中!