SlideShare una empresa de Scribd logo
1 de 63
Descargar para leer sin conexión
.
白ヤギコーポレーション
シバタアキラ, Ph.D.
ashibata.com
Tutorial & Hackathon #1
シバタアキラ, PhD. @punkphysicist
いま:CEO @白ヤギコーポレーション
カメリオ: あなたに必要な情報しか来ないアプリ
カメクト: コンテンツレコメンドエンジン
2010 - 2013: 経営コンサルティング @BCG
2004 - 2010: データサイエンティスト @NYU
統計的データ分析でヒッグス狩り @LHC, CERN
Pythonとは10年間の付き合い
オーガナイザー
@atelierhide
@iktakahiro @punkphysicist
池内考啓
Takahiro Ikeuchi
柴田暁
Akira Shibata
田中秀樹

Hideki Tanaka
山本光穂
Mitsuo Yamamoto
下村勇介
Yusuke Shimomura
サポート
@kaita
じんるいの
えいちの
けっしょう
すごいぱわーの
ろけっと
すごいっアルゴリズム
すごいっサービス
すごいっ分析
開発でも研究でも幅広く使われているPythonは

データ解析では一人勝ち状態
Python+Dataを通じて

世界のPyDataエクスパートと繋がれる

コミュニティーを作る
• 当面は「顔が見える」サイズを超えない:

参加人数は 30人くらいを目安に
• 質問とディスカッションを重視:

わからなけれ即質問、発表後も気が済むまでディスカッションを
• 参加者同士のつながりを大切に:

懇親会は毎回行います!
• 今後初級者が「手を動かして」学べる開発イベントも検討
PyData.Tokyo運営方針
このチュートリアルで達成したいこと
実データを使ったコーディングを通じて実践力のあるデー
タサイエンティストを養成する
データ解析の基本を修得する
データ解析において今使われている最新ツールの習得
更にワンランク上のデータサイエンティストへの道
【第一部】データハンドリング
	1	データのインポート

	2	データの前処理・整形

	3	集計・統計解析

	4	データの可視化

【第二部】機械学習による予測
	1	機械学習を分類モデルの生成

	2	分類結果の検証

【第三部】ディスカッション
もっとよく知りたい人は
基本的なところからカバー

Pandasの作者
機械学習に特に詳しい
さらに・・・
Pythonを仕事で使う上で欠かせない一冊

Connpass作ってる会社
月末に出る予定
ハッカソンの人にお願い
• Kaggleにサブミットして高得点を目指してください
• コーヒセッションで初心者との疑問やディスカッショ
ンへの参加
• 最後のディスカッションセッションでの発表で、

成果発表をしてください
乗客の年齢、性別その他の情報を機械学習アルゴリズムに学習さ
せることで、初心者でも80%に近い精度で生存者を当てることが
できるようになります。
中上級者は90%を目指してください(激ムズ)!
注意:Kaggleの提出は10回なので要注意!!
本日使う例題
タイタニックの乗客データを使った生存者推定モデルの生成
まずは自己紹介から30秒くらい
お名前
プロフィール:いまのお仕事、肩書、など
現在のPython及びDataとの関わり方
今日のチュートリアルに期待すること
【第一部】
乗客の年齢、性別その他の情報を機械学習アルゴリズムに学習さ
せることで、初心者でも80%に近い精度で生存者を当てることが
できるようになります。
中上級者は90%を目指してください(激ムズ)!
注意:Kaggleの提出は10回なので要注意!!
本日使う例題
タイタニックの乗客データを使った生存者推定モデルの生成
1. データハンドリング(I/O, 前処理・整形, 正規化)
2. 初期分析と仮説構築(集計, 可視化, 仮説構築)
3. 機械学習(多変量解析, 教師あり学習, 教師なし学習)
4. 結果の評価(Precision/Recall, 交差検証)
データサイエンティストのいろは
【第一部】
【第二部】
• 大量のデータを解析するための並列処理
• アルゴリズムを更に良くする実装方法
• 得られた結果の統計的信頼性の評価
• 結果のチューニングのためのパラメーター調整
• シミュレーションによるデータ生成
重要だけど今回は対象外なトピックス
1. データハンドリング(I/O, 前処理・整形, 正規化)
2. 初期分析と仮説構築(集計, 可視化, 仮説構築)
3. 機械学習(多変量解析, 教師あり学習, 教師なし学習)
4. 結果の評価(Precision/Recall, 交差検証)
データサイエンティストのいろは
【第一部】
【第二部】
1. データハンドリング データの種類
テーブル型 テキスト型 バイナリ型
構造がしっかりしていて分
析しやすいが、シンプルな
構造に限られる
より複雑な構造をサポート

テキストなので汎用性高い

が読み込みが少し煩雑
いかなる構造もサポートす
るが、汎用性が低い。

囲い込みビジネスができる
今回は最も一般的なテーブル型データを扱う
1. データハンドリング データの読み込み方法
インメモリ ストリーム 分散処理
高速な処理ができるが、

メモリのサイズによって

データ量が制限される
継続的人流れてくる

データをリアルタイムに

集計していく
超大量のデータを分散し、

データのあるところで

処理を行う
Pythonを使った分析は基本的にインメモリ
CSV、SQL等様々なフォーマットをメモリに読み込む
1. メタデータの確認:データタイプや定義
2. 正規化:データの値はコントロールされてるか
3. ダミー変数:データの値を扱いやすくする
4. 欠損値への対処:データに歯抜けがあった時
5. 外れ値・不正値処理:計測に問題があったかもしれない
6. 特徴量抽出:より効果的な特徴量を作り出す
7. 不均衡データへの対応:正例が極端(10%以下)に少ない
無意味にデータを増やしても精度は上がらない
1. データハンドリング データの前処理
1. データハンドリング データの前処理:メタデータの確認
目的変数

「当てたい」結果
特徴量(説明変数)
名義尺度 数値データ
カテゴリデータ
1. データハンドリング データの前処理:ダミー変数
出典:http://www.slideshare.net/canard0328/ss-44288984
ダミー変数を使うことで、アルゴリズムが扱える様になる
バイアスが生じるが、削除や代入はよく使われる
1. データハンドリング データの前処理:欠損値への対処
出典:http://www.slideshare.net/dichika/maeshori-missing
1. データハンドリング データの前処理:外れ値
測定時のエラーもしくは個別事由による外れ値は

除いてモデル化したほうが良いことも
1. データハンドリング データの前処理:特徴量抽出
出典:http://www.slideshare.net/canard0328/ss-44288984
既存の特徴量から新たに特徴量を作る
+ =
1. データハンドリング(I/O, 前処理・整形, 正規化)
2. 初期分析と仮説構築(集計, 可視化, 仮説構築)
3. 機械学習(多変量解析, 教師あり学習, 教師なし学習)
4. 結果の評価(Precision/Recall, 交差検証)
データサイエンティストのいろは
【第一部】
【第二部】
2. 初期分析と仮説構築 集計
38%の人が生存 平均年齢30歳
最高年齢80歳
運賃は人によって

大きく違う
覚えておいてほしいこと
「データを見る」ことなく結果はでない:

「もっといっぱいのデータ」があっても

「もっといいアルゴリズム」があっても解決できない
アルゴリズムは魔法ではない:

アルゴリズムはいわれたことをやるだけ、

正しい問題設定なしには役に立たない
2. 初期分析と仮説構築 可視化
簡単な可視化を行うだけでも多くの仮設を立てられる
2. 初期分析と仮説構築 可視化
Pythonでもいろいろなツールがある
2. 初期分析と仮説構築 可視化
Python頑張らなくてもいい
2. 初期分析と仮説構築 仮説の構築
女の生存率が高い、若いほど生存率が高い
2. 初期分析と仮説構築 仮説の構築
上級のクラスのほうが生存率が高い
2. 初期分析と仮説構築 仮説の構築
傾向としては、なんか分けられるような気もする
【第二部】
1. データハンドリング(I/O, 前処理・整形, 正規化)
2. 初期分析と仮説構築(集計, 可視化, 仮説構築)
3. 機械学習(多変量解析, 教師あり学習)
4. 結果の評価(Precision/Recall, 交差検証)
データサイエンティストのいろは
【第一部】
【第二部】
3. 機械学習 多変量解析
出典:
三次元以上になると人力では仮説が立てにくくなる
3. 機械学習 多変量解析
• 人力:判別力のそうな特徴量だけを少数選ぶ
• 多変量解析:複数の特徴量を組み合わせる
• 機械学習:複数特徴量から最適パターンを見つける
どんどん複雑になっていく
既存の特徴量から新たに特徴量を作る
+ =
3. 機械学習 多変量解析
3. 機械学習 多変量解析
出典:http://www.nlpca.org/pca_principal_component_analysis.html
クラス間の分散を最大化する特徴量を探す

他にもk-meansなどのクラスタリング法も
3. 機械学習 教師あり学習
特徴量(説明変数)
目的変数

「当てたい」結果
3. 機械学習 教師あり学習
回帰型 木型 ニューラルネット型
線形回帰

Support Vector Machine

等
Decision Tree

Random Forest

等
Neural Network

深層学習

等
他にも遺伝的アルゴリズムなどの手法も
3. 機械学習 教師あり学習
Support Vector Machine:
Linear Regression:
シンプルで、早い分類手法

結果が確率値として解釈できる

割といい結果が出るが、ベストではない
最も分割距離が大きくなる

平面を定義できる様、空間を

重み付けする
3. 機械学習 教師あり学習
Random Forest:
Decision Tree:
特徴量に対する条件の組み合わせ

で、正答率を最高にする

単純で理解しやすい
ランダムに特徴量とデータをサンプリング

し、生まれた決定木を組み合わせ、最も

正答率の高い組み合わせを見つける

(多数の特徴量に対応し、欠損値の取り扱いも柔軟)
http://peekaboo-vision.blogspot.jp/2013/01/machine-learning-cheat-sheet-for-scikit.html
機械学習の応用
1. 分類:センチメント分析、判別
2. 推測:レコメンデーション、ランキング
3. 最適化:価格決定、損失削減
4. 未来予測:シミュレーション、事前予防
5. 生成:対話、画像生成
1. データハンドリング(I/O, 前処理・整形, 正規化)
2. 初期分析と仮説構築(集計, 可視化, 仮説構築)
3. 機械学習(多変量解析, 教師あり学習, 教師なし学習)
4. 結果の評価(モデル評価, 交差検証)
データサイエンティストのいろは
【第一部】
【第二部】
• Type I error: 

無罪の人を死刑に
• Type II error: 

本当は病気なのに誤診断
4. 結果の評価 モデル評価
モデルの正確さを理解する必要がある
4. 結果の評価 モデル評価
Accuracy =
4. 結果の評価 モデル評価
出典:http://www.slideshare.net/canard0328/ss-44288984
陽性と判定したものがどれだけ真なのか(適合率):
真のうちどれだけを陽性と判定したのか(再現率):
4. 結果の評価 モデル評価
両方を合わせた結果指標(F値):
1万人のデータのうち100人が陽性の時、常に
陰性と判定するモデルがあったとして…
適合率:
再現率:
F値:
0/100=0
0/100=0
0
4. 結果の評価 仮説検定
性能がいいモデル
4. 結果の評価 交差検証
K-分割交差検証
K-分割交差検証では、標本群を
K個に分割する。そして、その
うちの1つをテスト事例とし、
残る K − 1 個を訓練事例とす
るのが一般的である。交差検証
は、K 個に分割された標本群そ
れぞれをテスト事例として k
回検証を行う。そうやって得ら
れた k 回の結果を平均して1つ
の推定を得る。
学習モデルのもつ判別力がまぐれではないと確認できる

Más contenido relacionado

La actualidad más candente

アドネットワークのデータ解析チームを支える技術
アドネットワークのデータ解析チームを支える技術アドネットワークのデータ解析チームを支える技術
アドネットワークのデータ解析チームを支える技術hagino 3000
 
Gunosy における AWS 上での自然言語処理・機械学習の活用事例
Gunosy における AWS 上での自然言語処理・機械学習の活用事例Gunosy における AWS 上での自然言語処理・機械学習の活用事例
Gunosy における AWS 上での自然言語処理・機械学習の活用事例圭輔 大曽根
 
研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」ymmt3-lab
 
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針Koichi Hamada
 
文献データベースを使ったトレンドワード提示実験
文献データベースを使ったトレンドワード提示実験文献データベースを使ったトレンドワード提示実験
文献データベースを使ったトレンドワード提示実験genroku
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標圭輔 大曽根
 
秋葉原IT戦略研究所のご紹介(2016/05/04)
秋葉原IT戦略研究所のご紹介(2016/05/04)秋葉原IT戦略研究所のご紹介(2016/05/04)
秋葉原IT戦略研究所のご紹介(2016/05/04)Junichi Noda
 
人工知能Xファッション最前線
人工知能Xファッション最前線人工知能Xファッション最前線
人工知能Xファッション最前線Kazuki Baba
 
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision TreeNIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision TreeTakami Sato
 
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステムJunichi Noda
 
Pythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみようPythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみようTatuya Kobayashi
 
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...
Gunosy DM #120 論文紹介  Attention and Engagement-Awareness in the Wild: A Large-...Gunosy DM #120 論文紹介  Attention and Engagement-Awareness in the Wild: A Large-...
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...Koji Yoshida
 
Tokyo r91 lt3_20210417
Tokyo r91 lt3_20210417Tokyo r91 lt3_20210417
Tokyo r91 lt3_20210417@ 238__fs
 
Rustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったかRustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったかShunsukeNakamura17
 
Kaggle&競プロ紹介 in 中田研究室
Kaggle&競プロ紹介 in 中田研究室Kaggle&競プロ紹介 in 中田研究室
Kaggle&競プロ紹介 in 中田研究室Takami Sato
 

La actualidad más candente (20)

Why python
Why pythonWhy python
Why python
 
アドネットワークのデータ解析チームを支える技術
アドネットワークのデータ解析チームを支える技術アドネットワークのデータ解析チームを支える技術
アドネットワークのデータ解析チームを支える技術
 
Gunosy における AWS 上での自然言語処理・機械学習の活用事例
Gunosy における AWS 上での自然言語処理・機械学習の活用事例Gunosy における AWS 上での自然言語処理・機械学習の活用事例
Gunosy における AWS 上での自然言語処理・機械学習の活用事例
 
Sano hmm 20150512
Sano hmm 20150512Sano hmm 20150512
Sano hmm 20150512
 
研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」
 
pytech
pytechpytech
pytech
 
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
 
Tableau r graph_theory
Tableau r graph_theoryTableau r graph_theory
Tableau r graph_theory
 
文献データベースを使ったトレンドワード提示実験
文献データベースを使ったトレンドワード提示実験文献データベースを使ったトレンドワード提示実験
文献データベースを使ったトレンドワード提示実験
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 
秋葉原IT戦略研究所のご紹介(2016/05/04)
秋葉原IT戦略研究所のご紹介(2016/05/04)秋葉原IT戦略研究所のご紹介(2016/05/04)
秋葉原IT戦略研究所のご紹介(2016/05/04)
 
人工知能Xファッション最前線
人工知能Xファッション最前線人工知能Xファッション最前線
人工知能Xファッション最前線
 
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision TreeNIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree
 
S03 t4 wrapup
S03 t4 wrapupS03 t4 wrapup
S03 t4 wrapup
 
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
 
Pythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみようPythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみよう
 
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...
Gunosy DM #120 論文紹介  Attention and Engagement-Awareness in the Wild: A Large-...Gunosy DM #120 論文紹介  Attention and Engagement-Awareness in the Wild: A Large-...
Gunosy DM #120 論文紹介 Attention and Engagement-Awareness in the Wild: A Large-...
 
Tokyo r91 lt3_20210417
Tokyo r91 lt3_20210417Tokyo r91 lt3_20210417
Tokyo r91 lt3_20210417
 
Rustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったかRustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったか
 
Kaggle&競プロ紹介 in 中田研究室
Kaggle&競プロ紹介 in 中田研究室Kaggle&競プロ紹介 in 中田研究室
Kaggle&競プロ紹介 in 中田研究室
 

Destacado

Meaning of law specialist join to hackathon
Meaning of law specialist join to hackathonMeaning of law specialist join to hackathon
Meaning of law specialist join to hackathonHidemi Arai
 
Healthcare Hackathon
Healthcare HackathonHealthcare Hackathon
Healthcare Hackathonmedizine
 
便潜血検査の種類と意義
便潜血検査の種類と意義便潜血検査の種類と意義
便潜血検査の種類と意義Kenji Kawanai
 
H³ - Healthcare Hackathon Hub - 第3回:グロースハック_20170716
H³ - Healthcare Hackathon Hub - 第3回:グロースハック_20170716H³ - Healthcare Hackathon Hub - 第3回:グロースハック_20170716
H³ - Healthcare Hackathon Hub - 第3回:グロースハック_20170716Healthcare Hackathon Hub (H₃)
 
【SMART LIFE HACKATHON #2】チーム55e「ココロブレイカー」
【SMART LIFE HACKATHON #2】チーム55e「ココロブレイカー」【SMART LIFE HACKATHON #2】チーム55e「ココロブレイカー」
【SMART LIFE HACKATHON #2】チーム55e「ココロブレイカー」Seigo Tanaka
 
Hackathon boot camp 1st
Hackathon boot camp 1stHackathon boot camp 1st
Hackathon boot camp 1st鉄兵 鈴木
 
[ABC Hackathon]アイデア供養
[ABC Hackathon]アイデア供養[ABC Hackathon]アイデア供養
[ABC Hackathon]アイデア供養鉄兵 鈴木
 
Healthcare Hackathon Tokyo
Healthcare Hackathon TokyoHealthcare Hackathon Tokyo
Healthcare Hackathon Tokyomedizine
 
IBM Bluemix × Watson でMashup Hackathon (API説明)
IBM Bluemix × Watson でMashup Hackathon (API説明)IBM Bluemix × Watson でMashup Hackathon (API説明)
IBM Bluemix × Watson でMashup Hackathon (API説明)Masaya Fujita
 
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門hoxo_m
 

Destacado (10)

Meaning of law specialist join to hackathon
Meaning of law specialist join to hackathonMeaning of law specialist join to hackathon
Meaning of law specialist join to hackathon
 
Healthcare Hackathon
Healthcare HackathonHealthcare Hackathon
Healthcare Hackathon
 
便潜血検査の種類と意義
便潜血検査の種類と意義便潜血検査の種類と意義
便潜血検査の種類と意義
 
H³ - Healthcare Hackathon Hub - 第3回:グロースハック_20170716
H³ - Healthcare Hackathon Hub - 第3回:グロースハック_20170716H³ - Healthcare Hackathon Hub - 第3回:グロースハック_20170716
H³ - Healthcare Hackathon Hub - 第3回:グロースハック_20170716
 
【SMART LIFE HACKATHON #2】チーム55e「ココロブレイカー」
【SMART LIFE HACKATHON #2】チーム55e「ココロブレイカー」【SMART LIFE HACKATHON #2】チーム55e「ココロブレイカー」
【SMART LIFE HACKATHON #2】チーム55e「ココロブレイカー」
 
Hackathon boot camp 1st
Hackathon boot camp 1stHackathon boot camp 1st
Hackathon boot camp 1st
 
[ABC Hackathon]アイデア供養
[ABC Hackathon]アイデア供養[ABC Hackathon]アイデア供養
[ABC Hackathon]アイデア供養
 
Healthcare Hackathon Tokyo
Healthcare Hackathon TokyoHealthcare Hackathon Tokyo
Healthcare Hackathon Tokyo
 
IBM Bluemix × Watson でMashup Hackathon (API説明)
IBM Bluemix × Watson でMashup Hackathon (API説明)IBM Bluemix × Watson でMashup Hackathon (API説明)
IBM Bluemix × Watson でMashup Hackathon (API説明)
 
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
 

Similar a PyData Tokyo Tutorial & Hackathon #1

Py datameetup1
Py datameetup1Py datameetup1
Py datameetup1shiroyagi
 
Akira shibata at developer summit 2016
Akira shibata at developer summit 2016Akira shibata at developer summit 2016
Akira shibata at developer summit 2016Akira Shibata
 
最近思った機械学習(PyTorch)のベストプラクティス
最近思った機械学習(PyTorch)のベストプラクティス最近思った機械学習(PyTorch)のベストプラクティス
最近思った機械学習(PyTorch)のベストプラクティスMasato Fujitake
 
みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様Takeshi Akutsu
 
みんなChainerで 何やってるの? 〜コミュニティのユースケース探索〜
みんなChainerで 何やってるの? 〜コミュニティのユースケース探索〜みんなChainerで 何やってるの? 〜コミュニティのユースケース探索〜
みんなChainerで 何やってるの? 〜コミュニティのユースケース探索〜Yuta Koreeda
 
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣aslead
 
Pythonを使った機械学習の学習
Pythonを使った機械学習の学習Pythonを使った機械学習の学習
Pythonを使った機械学習の学習Kimikazu Kato
 
Python入門者の集い #6 Lightning Talk
Python入門者の集い #6 Lightning Talk Python入門者の集い #6 Lightning Talk
Python入門者の集い #6 Lightning Talk Katayanagi Nobuko
 
20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdf20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdfShintaro Fukushima
 
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史Leading Edge Co.,Ltd.
 
20190606_ml_and_buisiness
20190606_ml_and_buisiness20190606_ml_and_buisiness
20190606_ml_and_buisinessYoichi Tokita
 
S20 t1 stapyのこれまでとこれから
S20 t1 stapyのこれまでとこれからS20 t1 stapyのこれまでとこれから
S20 t1 stapyのこれまでとこれからTakeshi Akutsu
 
Python エンジニアの作り方 2011.08 #pyconjp
Python エンジニアの作り方 2011.08 #pyconjpPython エンジニアの作り方 2011.08 #pyconjp
Python エンジニアの作り方 2011.08 #pyconjpTakeshi Komiya
 
オープンデータで実現する作文測定分析のシステム構成
オープンデータで実現する作文測定分析のシステム構成オープンデータで実現する作文測定分析のシステム構成
オープンデータで実現する作文測定分析のシステム構成yamahige
 
IoTとビッグデータについて学ぼう
IoTとビッグデータについて学ぼうIoTとビッグデータについて学ぼう
IoTとビッグデータについて学ぼう法林浩之
 
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方Deep Learning Lab(ディープラーニング・ラボ)
 

Similar a PyData Tokyo Tutorial & Hackathon #1 (20)

Py datameetup1
Py datameetup1Py datameetup1
Py datameetup1
 
S08 t0 orientation
S08 t0 orientationS08 t0 orientation
S08 t0 orientation
 
Akira shibata at developer summit 2016
Akira shibata at developer summit 2016Akira shibata at developer summit 2016
Akira shibata at developer summit 2016
 
最近思った機械学習(PyTorch)のベストプラクティス
最近思った機械学習(PyTorch)のベストプラクティス最近思った機械学習(PyTorch)のベストプラクティス
最近思った機械学習(PyTorch)のベストプラクティス
 
みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様
 
S09 t4 wrapup
S09 t4 wrapupS09 t4 wrapup
S09 t4 wrapup
 
みんなChainerで 何やってるの? 〜コミュニティのユースケース探索〜
みんなChainerで 何やってるの? 〜コミュニティのユースケース探索〜みんなChainerで 何やってるの? 〜コミュニティのユースケース探索〜
みんなChainerで 何やってるの? 〜コミュニティのユースケース探索〜
 
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
 
Pythonを使った機械学習の学習
Pythonを使った機械学習の学習Pythonを使った機械学習の学習
Pythonを使った機械学習の学習
 
Python入門者の集い #6 Lightning Talk
Python入門者の集い #6 Lightning Talk Python入門者の集い #6 Lightning Talk
Python入門者の集い #6 Lightning Talk
 
20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdf20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdf
 
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
 
Introduction
IntroductionIntroduction
Introduction
 
20190606_ml_and_buisiness
20190606_ml_and_buisiness20190606_ml_and_buisiness
20190606_ml_and_buisiness
 
ChatOps@研究室
ChatOps@研究室ChatOps@研究室
ChatOps@研究室
 
S20 t1 stapyのこれまでとこれから
S20 t1 stapyのこれまでとこれからS20 t1 stapyのこれまでとこれから
S20 t1 stapyのこれまでとこれから
 
Python エンジニアの作り方 2011.08 #pyconjp
Python エンジニアの作り方 2011.08 #pyconjpPython エンジニアの作り方 2011.08 #pyconjp
Python エンジニアの作り方 2011.08 #pyconjp
 
オープンデータで実現する作文測定分析のシステム構成
オープンデータで実現する作文測定分析のシステム構成オープンデータで実現する作文測定分析のシステム構成
オープンデータで実現する作文測定分析のシステム構成
 
IoTとビッグデータについて学ぼう
IoTとビッグデータについて学ぼうIoTとビッグデータについて学ぼう
IoTとビッグデータについて学ぼう
 
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
 

Más de Akira Shibata

大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さんAkira Shibata
 
W&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfW&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfAkira Shibata
 
20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdfAkira Shibata
 
W&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfW&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfAkira Shibata
 
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfmakoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfAkira Shibata
 
LLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdfLLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdfAkira Shibata
 
Kaggle and data science
Kaggle and data scienceKaggle and data science
Kaggle and data scienceAkira Shibata
 
人工知能をビジネスに活かす
人工知能をビジネスに活かす人工知能をビジネスに活かす
人工知能をビジネスに活かすAkira Shibata
 
PyData NYC by Akira Shibata
PyData NYC by Akira ShibataPyData NYC by Akira Shibata
PyData NYC by Akira ShibataAkira Shibata
 
20141127 py datatokyomeetup2
20141127 py datatokyomeetup220141127 py datatokyomeetup2
20141127 py datatokyomeetup2Akira Shibata
 
The LHC Explained by CNN
The LHC Explained by CNNThe LHC Explained by CNN
The LHC Explained by CNNAkira Shibata
 
Analysis Software Development
Analysis Software DevelopmentAnalysis Software Development
Analysis Software DevelopmentAkira Shibata
 
Top Cross Section Measurement
Top Cross Section MeasurementTop Cross Section Measurement
Top Cross Section MeasurementAkira Shibata
 
Analysis Software Benchmark
Analysis Software BenchmarkAnalysis Software Benchmark
Analysis Software BenchmarkAkira Shibata
 
Top quark physics at the LHC
Top quark physics at the LHCTop quark physics at the LHC
Top quark physics at the LHCAkira Shibata
 

Más de Akira Shibata (18)

大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
 
W&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdfW&B monthly meetup#7 Intro.pdf
W&B monthly meetup#7 Intro.pdf
 
20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf20230705 - Optuna Integration (to share).pdf
20230705 - Optuna Integration (to share).pdf
 
W&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdfW&B Seminar #5(to share).pdf
W&B Seminar #5(to share).pdf
 
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdfmakoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
 
LLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdfLLM Webinar - シバタアキラ to share.pdf
LLM Webinar - シバタアキラ to share.pdf
 
W&B Seminar #4.pdf
W&B Seminar #4.pdfW&B Seminar #4.pdf
W&B Seminar #4.pdf
 
Kaggle and data science
Kaggle and data scienceKaggle and data science
Kaggle and data science
 
Data x
Data xData x
Data x
 
人工知能をビジネスに活かす
人工知能をビジネスに活かす人工知能をビジネスに活かす
人工知能をビジネスに活かす
 
PyData NYC by Akira Shibata
PyData NYC by Akira ShibataPyData NYC by Akira Shibata
PyData NYC by Akira Shibata
 
20141127 py datatokyomeetup2
20141127 py datatokyomeetup220141127 py datatokyomeetup2
20141127 py datatokyomeetup2
 
The LHC Explained by CNN
The LHC Explained by CNNThe LHC Explained by CNN
The LHC Explained by CNN
 
LHC for Students
LHC for StudentsLHC for Students
LHC for Students
 
Analysis Software Development
Analysis Software DevelopmentAnalysis Software Development
Analysis Software Development
 
Top Cross Section Measurement
Top Cross Section MeasurementTop Cross Section Measurement
Top Cross Section Measurement
 
Analysis Software Benchmark
Analysis Software BenchmarkAnalysis Software Benchmark
Analysis Software Benchmark
 
Top quark physics at the LHC
Top quark physics at the LHCTop quark physics at the LHC
Top quark physics at the LHC
 

PyData Tokyo Tutorial & Hackathon #1