Inicio
Explorar
Enviar búsqueda
Cargar
Iniciar sesión
Registrarse
Publicidad
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
Denunciar
tokyorgirls
Seguir
22 de Jul de 2014
•
0 recomendaciones
4 recomendaciones
×
Sé el primero en que te guste
ver más
•
1,303 vistas
vistas
×
Total de vistas
0
En Slideshare
0
De embebidos
0
Número de embebidos
0
Check these out next
Pythonでターミナルに画像表示
Masato Fujitake
OSS Study#19_LT
NaoY-2501
WindowsでPython
drillan
S03 t1 python_learningdiary#3
Takeshi Akutsu
S20 t1 stapyのこれまでとこれから
Takeshi Akutsu
S10 t1 spc_by_nowfromnow
Takeshi Akutsu
pythonでemlファイルを扱う話
Satoshi Yamada
コボラーがPython始めてみた話
Yuuki Nakajima
1
de
39
Top clipped slide
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
22 de Jul de 2014
•
0 recomendaciones
4 recomendaciones
×
Sé el primero en que te guste
ver más
•
1,303 vistas
vistas
×
Total de vistas
0
En Slideshare
0
De embebidos
0
Número de embebidos
0
Descargar ahora
Descargar para leer sin conexión
Denunciar
Datos y análisis
2014/07/12 Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」by @a_macbee
tokyorgirls
Seguir
Publicidad
Publicidad
Publicidad
Recomendados
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
8.4K vistas
•
64 diapositivas
本気でPythonで宛名書きした話
Satoshi Yamada
3.2K vistas
•
30 diapositivas
言語処理するのに Python でいいの? #PyDataTokyo
Shuyo Nakatani
21.2K vistas
•
38 diapositivas
S01 t1 tsuji_pylearn_ut_01
Takeshi Akutsu
2.1K vistas
•
11 diapositivas
Rの導入とRStudio事始め(改訂版)
Takashi Yamane
28.8K vistas
•
25 diapositivas
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Hisao Soyama
30.4K vistas
•
52 diapositivas
Más contenido relacionado
Presentaciones para ti
(20)
Pythonでターミナルに画像表示
Masato Fujitake
•
3K vistas
OSS Study#19_LT
NaoY-2501
•
1.2K vistas
WindowsでPython
drillan
•
10.8K vistas
S03 t1 python_learningdiary#3
Takeshi Akutsu
•
1.6K vistas
S20 t1 stapyのこれまでとこれから
Takeshi Akutsu
•
1.1K vistas
S10 t1 spc_by_nowfromnow
Takeshi Akutsu
•
732 vistas
pythonでemlファイルを扱う話
Satoshi Yamada
•
14K vistas
コボラーがPython始めてみた話
Yuuki Nakajima
•
2.3K vistas
DBエンジニアに必要だったPythonのスキル
Satoshi Yamada
•
2.2K vistas
Requestsで始める5分前帰社
Satoshi Yamada
•
5.4K vistas
RFinanceJはじめました
Nagi Teramo
•
5.2K vistas
S09 t4 wrapup
Takeshi Akutsu
•
747 vistas
オレオレ言語実装に役立つプル型ASTウォーカーAPI
隆行 神戸
•
2.2K vistas
ゲームマップのためのグラフAPIの設計
隆行 神戸
•
2.2K vistas
Python学習奮闘記#07 webapp
Takeshi Akutsu
•
2K vistas
S09 t0 orientation
Takeshi Akutsu
•
977 vistas
S08 t0 orientation
Takeshi Akutsu
•
1.1K vistas
RubyエンジニアがPythonをdisるためにPythonを勉強してみた
Yusuke Kon
•
27.7K vistas
S18 t0 introduction
Takeshi Akutsu
•
1.2K vistas
Orientation
Takeshi Akutsu
•
419 vistas
Similar a Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
(20)
Debug Hacks - 第4回つくらぐ勉強会
University of Tsukuba Linux User Group
•
792 vistas
211120 他人の書いたPythonスクリプトをステップ実行で理解する
Takuya Nishimoto
•
1.2K vistas
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
BrainPad Inc.
•
3.5K vistas
PyConJP2018_LT_mahjong_180918
Rio Kurihara
•
261 vistas
プログラミング初心者の壁の越え方
Yuichi Kato
•
6.5K vistas
Why python
Mikio Kubo
•
652 vistas
MTプラグイン入門以前
Hiroshi Yamato
•
2.5K vistas
Clojureの世界と実際のWeb開発
Tsutomu Yano
•
39.8K vistas
Rでを作る
Nagi Teramo
•
3.6K vistas
goパッケージで型情報を用いたソースコード検索を実現する
Takuya Ueda
•
3K vistas
Python for Beginners ( #PyLadiesKyoto Meetup )
Ai Makabi
•
790 vistas
グラフデータベース「Neo4j」の 導入の導入
Hisao Soyama
•
20.9K vistas
TRPGオンラインセッション環境とルール&シナリオ記述言語
隆行 神戸
•
2.7K vistas
TOPPERS as an IoT OS(kernel)
Kiyoshi Ogawa
•
906 vistas
【Ltech#11】ディープラーニングで間取り図を3Dにする
LIFULL Co., Ltd.
•
3.5K vistas
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
Toshinori Sato
•
5.4K vistas
PyPy 紹介
shoma h
•
8.2K vistas
Rubyの会社でPythonistaが3ヶ月生き延びた話
Tokoroten Nakayama
•
9.2K vistas
Rubyの会社でPythonistaが三ヶ月生き延びた話
Drecom Co., Ltd.
•
3.7K vistas
Why python
Mikio Kubo
•
925 vistas
Publicidad
Último
(20)
《诺丁汉大学毕业证|学位证书校内仿真版本》
w124dsa
•
2 vistas
#学位证靠谱办Spalding文凭证书全套
76p522i4nqmocom
•
2 vistas
揭秘英国留学:如何获得约克圣约翰大学毕业证?
gukeho1
•
2 vistas
★可查可存档〖制作怀俄明大学文凭证书毕业证〗
fgfg45
•
2 vistas
5cladba wiki
Viya18
•
0 vistas
《汉博学院毕业证|学位证书校内仿真版本》
hj123saf
•
2 vistas
#全套原版1:1精仿萨瓦学位证成绩单
b6f0190421d1rma
•
2 vistas
★可查可存档〖制作密苏里大学堪萨斯分校文凭证书毕业证〗
fgfg45
•
2 vistas
#学位证靠谱办基尔大学文凭证书全套
qghfsvkwiqiubridge
•
2 vistas
《格里菲斯大学毕业证|学位证书校内仿真版本》
hj123saf
•
2 vistas
#专业办证《Griffith毕业证学位证原版精仿》
ee61223771acdrman
•
2 vistas
#全套原版1:1精仿约克大学学位证成绩单
pivepar3oflipcom
•
2 vistas
★可查可存档〖制作普利茅斯大学文凭证书毕业证〗
vgfg1
•
2 vistas
#全套原版1:1精仿U of G学位证成绩单
pivepar3oflipcom
•
2 vistas
Drive-by Sensingによる都市のモニタリング
Takuma Oda
•
0 vistas
★可查可存档〖制作汤普森河大学文凭证书毕业证〗
mmmm282537
•
2 vistas
#学位证靠谱办Camosun文凭证书全套
qghfsvkwiqiubridge
•
2 vistas
《范莎学院毕业证|学位证书校内仿真版本》
hj123saf
•
2 vistas
#专业办证《梅西大学毕业证学位证原版精仿》
ee61223771acdrman
•
2 vistas
★可查可存档〖制作堪萨斯大学文凭证书毕业证〗
fgfg45
•
2 vistas
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
で始める データ解析の超基礎 Tokyo.R 女子部
#4 @a_macbee
@a_macbee is 誰
@a_macbee ! 渋谷で働く新米データサイ エンティスト ・広告ログ解析の仕事 ・普段仕事で利用してる 言語はPython ・Tokyo.R 女子部 #3 初参加 ! ・
初心者
の便利機能 の紹介 等はしません (出来ません(汗) の標準機能 +ggplot2 のみを 利用します ※詰まったらどなたか助けて下さい
本日目指すこと Rを使って データの雰囲気を つかむ術を学ぶ
本日の資料 https://github.com/amacbee/tokyorgirls Download → 解凍 20140712/
以下に あります
ヒストグラム について学びます
データの全体像 がつかめる! ←日本の人口分布 ↓テストの点数分布
何はともあれやってみる ! ! # ggplot2の読み込み library(ggplot2) ! ! ! ! ! ! ヒストグラムを 描画するために 必要です!
何はともあれやってみる ! # データの読み込み data.path =
/path/to/file/ramen_prices.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # データの中身の確認 head(data.frame) ! # ラーメンの値段の平均 mean(data.frame$Price)
何はともあれやってみる ! # データの読み込み data.path =
/path/to/file/ramen_prices.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # データの中身の確認 head(data.frame) ! # ラーメンの値段の平均 mean(data.frame$Price) データを読み込んで data.frameに入れる
何はともあれやってみる ! # データの読み込み data.path =
/path/to/file/ramen_prices.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # データの中身の確認 head(data.frame) ! # ラーメンの値段の平均 mean(data.frame$Price) head()で囲むと データの上から 6行くらいを表示
何はともあれやってみる ! # データの読み込み data.path =
/path/to/file/ramen_prices.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # データの中身の確認 head(data.frame) ! # ラーメンの値段の平均 mean(data.frame$Price) mean()で囲むと データの 平均値を表示
何はともあれやってみる ! # ラーメンの値段のヒストグラム ggplot(data.frame, aes(x=data.frame$Price))
+ geom_histogram(binwidth=100) ! ! ! ! ! !
こんなのが 出るはず
750 650 850 950 550 ラーメンの 平均的な値段は 750円くらい
何はともあれやってみる ! # ラーメンの値段のヒストグラム ggplot(data.frame, aes(x=data.frame$Price))
+ geom_histogram(binwidth=100) ! ! ! ! ! ! 範囲の指定 この場合,100円の範囲で 値をまとめてくれる x軸の指定
ヒストグラムの 良いところ
2つのヒストグラムの比較 ! # データの読み込み data.path =
/path/to/file/test_scores_1.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # 1組のテストの平均点 mean(data.frame$Score) ! # 1組のテストの点数のヒストグラム ggplot(data.frame, aes(x=data.frame$Score)) + geom_histogram(binwidth=5)
2つのヒストグラムの比較 ! # データの読み込み data.path =
/path/to/file/test_scores_2.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # 2組のテストの平均点 mean(data.frame$Score) ! # 2組のテストの点数のヒストグラム ggplot(data.frame, aes(x=data.frame$Score)) + geom_histogram(binwidth=5)
平均点は? どちらも同じくらい A組: 約51点 B組: 約50点
ヒストグラムは?
A 組
B 組
平均点は同じでも ヒストグラムはかなり違う ↓ データの性質が全然違う
大事なこと ヒストグラムを書くことで データの全体像がつかめる
binwidth に注意
元のデータは こちらからお借りしています ! https://github.com/johnmyleswhite/ ML_for_Hackers
! # データの読み込み data.path =
/path/to/file/body_data.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # 平均身長 mean(data.frame$Height) ! # 身長のヒストグラム(binwidth=5, 0.001, 1) ggplot(data.frame, aes(x=data.frame$Height)) + geom_histogram(binwidth=5) ggplot(data.frame, aes(x=data.frame$Height)) + geom_histogram(binwidth=0.001) ggplot(data.frame, aes(x=data.frame$Height)) + geom_histogram(binwidth=1)
binの幅が 広すぎる =過剰な平滑化 binwidth=5
binの幅が 小さすぎる =平滑化の不足 binwidth=0.001
binwidth=1
滑らか binwidth=1
大事なこと binwidthの値を変えて ヒストグラムを確認すること
おまけ1(Rの高度な機能) もとの形状に 近い形で 描画できる
おまけ2(Rの高度な機能) 男女で 分けてみたり
! 参考図書.1 マンガでわかる 統計学 / 高橋
信 ! http://goo.gl/mzuQ ! ※オススメ!
! 参考図書.2 入門 機械学習 / D.,
Conway ! http://goo.gl/0zNev ! ※かなり難しい!
Thank you!
Publicidad