Más contenido relacionado
Rで学ぶミニミニビッグデータ分析入門-第1回
- 16. ミニミニデータ分析入門@Sassor
表を比較する
0 1 2 3 4 5 6 7
北千住 0 0 0 0 0 0 0 0
池袋 0 0 0 0 0 0 17 31
8 9 10 11 12 13 14 15 16
北千住 392 333 985 573 745 244 256 246 6
池袋 0 109 979 237 389 867 295 377 75
17 18 19 20 21 22 23
北千住 81 3 311 107 14 41 0
池袋 588 371 246 604 39 33 0
2011年10月6日:0時∼23時のIHコンロの電力データ
深夜から朝
朝から夕方
夜から深夜
16
- 21. ミニミニデータ分析入門@Sassor
平均値を求める(R)
• 最初にベクトルを作成する c(x,y,z)
– ikebukuro <- c(0,0,0,0,0,17,31,0,109,979, 237, 389,
867, 295, 377, 75, 588, 371, 246,604, 39, 33, 0)
– kitasenju <- …
• 平均値を求める
– > mean(kitasenju)
– [1] 180.7083
– > mean(ikebukuro)
– [1] 219.0417
21
- 24. ミニミニデータ分析入門@Sassor
一気にもとめる
– > summary(kitasenju)
– Min. 1st Qu. Median Mean 3rd Qu. Max.
– 0.0 0.0 27.5 180.7 269.8 985.0
– > summary(ikebukuro)
– Min. 1st Qu. Median Mean 3rd Qu. Max.
– 0.0 0.0 57.0 219.0 372.5 979.0
– 1stQu. :第1四分位数(下から数えて4分の1)
– 3rdQu.:第3四分位数(下から数えて4分の3)
24
- 29. ミニミニデータ分析入門@Sassor
標準偏差
• 標準偏差:standard deviation
– 分散の平方根をとったもの
– 標準偏差にも標本標準偏差と不偏標準偏差がある
• > sqrt(sum((kitasenju-mean(kitasenju))^2)/
length(kitasenju))
• [1] 261.1386
• これでもOK
– > sqrt(mean((kitasenju-mean(kitasenju))^2))
– [1] 261.1386
• > sqrt(sum((ikebukuro-mean(ikebukuro))^2)/
length(ikebukuro))
• [1] 283.2369
29
- 32. ミニミニデータ分析入門@Sassor
基準化を行う
• > kitasenju.Zscore <- (kitasenju-mean(kitasenju))/sqrt(mean((kitasenju-
mean(kitasenju))^2))
• > kitasenju.Zscore
• [1] -0.6920016 -0.6920016 -0.6920016 -0.6920016 -0.6920016 -0.6920016
-0.6920016 -0.6920016 0.8091169
• [10] 0.5831833 3.0799416 1.5022354 2.1608895 0.2423681 0.2883207
0.2500269 -0.6690253 -0.3818215
• [19] -0.6805134 0.4989368 -0.2822575 -0.6383902 -0.5349968 -0.6920016
• > mean(kitasenju.Zscore)
• [1] -5.088974e-17
• > mean((kitasenju.Zscore-mean(kitasenju.Zscore))^2)
• [1] 1
32