Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.
エクセルでRライクな図⽰

散布図・箱ひげ図・ヒストグラム
概要
• Rがいいとかエクセルがいいとか
• 両⽅でやってみよう
– 散布図
– 箱ひげ図
– ヒストグラム

• まとめ
草薙邦広

Nagoya R #11 LT, 2013/12/7
kusanagi@nagoya-u.jp
Rがいいとかエクセルがいいとか
• Rでしかできないことって?
• エクセルでしかできないことって?
• 仕様の違い
• デフォルトの違い

– デフォルトに拘泥して⽐較するのは…?
1
0.9
0.8
0.7
0.6
0.5

系列1

0.4
0.3
0.2
0.1
0
0

0.2

0.4

0.6

0.8

1

1.2

18
16
14
12
10
8
6
4
2
0

系列1
両⽅でやってみよう
• 散布図

– plot関数を使おう!
– plot(rnorm(30), rnorm(30))

• ベクトルか,または⼆つ指定する
• 主なオプション
– xlim=c( , ), ylim=c( , )
– col=...
両⽅でやってみよう
• 散布図

– plot関数を使おう!

– plot(rnorm(30), rnorm(30), xlab=“X”, ylab=“Y”, col=“red”,
xlim=c(-2,2), ylim=c(-2.2))
– ...
両⽅でやってみよう
• 散布図

– エクセルでやろうず!
– ・・・。
1.00

Y

0.75

0.50

0.25

0.00
0.00

0.25

0.50
X

0.75

1.00
2
1
-2

-1

0

1

2
0.75

X
Y

Y

0
-1
-2

1.00

0.50

0.25

0.00
0.00

0.25

0.50
X

0.75

1.00
2
1
-2

-1

0

1

2
0.75

X
Y

Y

0
-1
-2

1.00

0.50

0.25

0.00
0.00

0.25

0.50
X

0.75

1.00
両⽅でやってみよう
• 散布図

– エクセルだって⾒分けがつかないようなのは
作れる
– ちょっと設定が多くてめんどい
– ただGUIで細かく決められる
両⽅でやってみよう
• ただエクセルは…
– pairs(dat)
両⽅でやってみよう
• 箱ひげ図

– boxplot()
– 主なオプション

• horizontal = T

– boxplot(dat, ylab=“Score”, col=“lightgray”)
両⽅でやってみよう
• 箱ひげ図

– エクセルでやろうず!
– 実は⼯夫次第で作れる!
140

120

100

Score

80

60

40

20

0
data 1

data 2
D
C
B
A

140

120

0.2

0.4

0.6

0.8

1.0
100

Score

80
Score

0.0

60

40

20

0
data 1

data 2
D
C
B
A

140

120

0.2

0.4

0.6

0.8

1.0
100

Score

80
Score

0.0

60

40

20

0
data 1

data 2
両⽅でやってみよう
• 散布図

– エクセルだって箱ひげ図⾃体は作れる
…ただ⼿間を考えると…
両⽅でやってみよう
• ただエクセルはこのようなデータのばら
つきの可視化はできない
両⽅でやってみよう
• ヒストグラム

– Rでやってみようず!
• hist(dat)
• 主なオプション
–
–
–
–

xlab =“”
main =“”
col =“”
breaks=10
» デフォルトはスタージェスの公式によるもの...
両⽅でやってみよう
• ヒストグラム

– Rでやってみようず!

• hist(rnorm(100), xlab=“Score”, main=“”, col=“red”)
両⽅でやってみよう
• ヒストグラム

– これは⾯倒だ!!

• スタージェスの公式から最適な階級数を求める
• 「分析ツール」→ヒストグラムで度数分布を計算
する
• 棒グラフにする
• ⾊々と調整
25

Frequency

20

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
25

Frequency

20

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
25

Frequency

20

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
15

-2

-1

0

1

2

3

25

Score

20

Frequency

Frequency

10
5
0
-3

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
15

-2

-1

0

1

2

3

25

Score

20

Frequency

Frequency

10
5
0
-3

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
両⽅でやってみよう
• ヒストグラム

– やはり⾒分けがつかないようなものはできる
– ただ本当に⼿間が…
まとめ
• エクセルだって頑張ればよいとされるような作図がで
きる
– 実際に折れ線グラフならエクセルの⽅が楽…?
– ただ確かにRでなければできないことはある

• 無批判にRのしかもただのデフォルトをよいとするの
ではなくて,どのような点が...
草薙 Nagoyar11 エクセルでrライクな図示
草薙 Nagoyar11 エクセルでrライクな図示
草薙 Nagoyar11 エクセルでrライクな図示
草薙 Nagoyar11 エクセルでrライクな図示
草薙 Nagoyar11 エクセルでrライクな図示
Próxima SlideShare
Cargando en…5
×

草薙 Nagoyar11 エクセルでrライクな図示

1.847 visualizaciones

Publicado el

草薙邦広「エクセルでRライクな図示」NagoyaR #11 2013/12/7

Publicado en: Tecnología
  • Sé el primero en comentar

草薙 Nagoyar11 エクセルでrライクな図示

  1. 1. エクセルでRライクな図⽰ 散布図・箱ひげ図・ヒストグラム
  2. 2. 概要 • Rがいいとかエクセルがいいとか • 両⽅でやってみよう – 散布図 – 箱ひげ図 – ヒストグラム • まとめ
  3. 3. 草薙邦広 Nagoya R #11 LT, 2013/12/7 kusanagi@nagoya-u.jp
  4. 4. Rがいいとかエクセルがいいとか • Rでしかできないことって? • エクセルでしかできないことって? • 仕様の違い • デフォルトの違い – デフォルトに拘泥して⽐較するのは…?
  5. 5. 1 0.9 0.8 0.7 0.6 0.5 系列1 0.4 0.3 0.2 0.1 0 0 0.2 0.4 0.6 0.8 1 1.2 18 16 14 12 10 8 6 4 2 0 系列1
  6. 6. 両⽅でやってみよう • 散布図 – plot関数を使おう! – plot(rnorm(30), rnorm(30)) • ベクトルか,または⼆つ指定する • 主なオプション – xlim=c( , ), ylim=c( , ) – col=“red” – xlab = “”, ylab=“”, main = “”
  7. 7. 両⽅でやってみよう • 散布図 – plot関数を使おう! – plot(rnorm(30), rnorm(30), xlab=“X”, ylab=“Y”, col=“red”, xlim=c(-2,2), ylim=c(-2.2)) – abline(0,1)
  8. 8. 両⽅でやってみよう • 散布図 – エクセルでやろうず! – ・・・。
  9. 9. 1.00 Y 0.75 0.50 0.25 0.00 0.00 0.25 0.50 X 0.75 1.00
  10. 10. 2 1 -2 -1 0 1 2 0.75 X Y Y 0 -1 -2 1.00 0.50 0.25 0.00 0.00 0.25 0.50 X 0.75 1.00
  11. 11. 2 1 -2 -1 0 1 2 0.75 X Y Y 0 -1 -2 1.00 0.50 0.25 0.00 0.00 0.25 0.50 X 0.75 1.00
  12. 12. 両⽅でやってみよう • 散布図 – エクセルだって⾒分けがつかないようなのは 作れる – ちょっと設定が多くてめんどい – ただGUIで細かく決められる
  13. 13. 両⽅でやってみよう • ただエクセルは… – pairs(dat)
  14. 14. 両⽅でやってみよう • 箱ひげ図 – boxplot() – 主なオプション • horizontal = T – boxplot(dat, ylab=“Score”, col=“lightgray”)
  15. 15. 両⽅でやってみよう • 箱ひげ図 – エクセルでやろうず! – 実は⼯夫次第で作れる!
  16. 16. 140 120 100 Score 80 60 40 20 0 data 1 data 2
  17. 17. D C B A 140 120 0.2 0.4 0.6 0.8 1.0 100 Score 80 Score 0.0 60 40 20 0 data 1 data 2
  18. 18. D C B A 140 120 0.2 0.4 0.6 0.8 1.0 100 Score 80 Score 0.0 60 40 20 0 data 1 data 2
  19. 19. 両⽅でやってみよう • 散布図 – エクセルだって箱ひげ図⾃体は作れる …ただ⼿間を考えると…
  20. 20. 両⽅でやってみよう • ただエクセルはこのようなデータのばら つきの可視化はできない
  21. 21. 両⽅でやってみよう • ヒストグラム – Rでやってみようず! • hist(dat) • 主なオプション – – – – xlab =“” main =“” col =“” breaks=10 » デフォルトはスタージェスの公式によるもの » あまりいじらなくてもよい
  22. 22. 両⽅でやってみよう • ヒストグラム – Rでやってみようず! • hist(rnorm(100), xlab=“Score”, main=“”, col=“red”)
  23. 23. 両⽅でやってみよう • ヒストグラム – これは⾯倒だ!! • スタージェスの公式から最適な階級数を求める • 「分析ツール」→ヒストグラムで度数分布を計算 する • 棒グラフにする • ⾊々と調整
  24. 24. 25 Frequency 20 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  25. 25. 25 Frequency 20 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  26. 26. 25 Frequency 20 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  27. 27. 15 -2 -1 0 1 2 3 25 Score 20 Frequency Frequency 10 5 0 -3 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  28. 28. 15 -2 -1 0 1 2 3 25 Score 20 Frequency Frequency 10 5 0 -3 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  29. 29. 両⽅でやってみよう • ヒストグラム – やはり⾒分けがつかないようなものはできる – ただ本当に⼿間が…
  30. 30. まとめ • エクセルだって頑張ればよいとされるような作図がで きる – 実際に折れ線グラフならエクセルの⽅が楽…? – ただ確かにRでなければできないことはある • 無批判にRのしかもただのデフォルトをよいとするの ではなくて,どのような点がよい可視化か⾒極める • ⽬的とするのは優れたデータの可視化であって,Rを 使うことではない • ただ,殆どの場合Rの⽅が楽である • ⼤抵の場合「エクセルのお化粧は⼤変」

×