More than Just Lines on a Map: Best Practices for U.S Bike Routes
Pearson
1. Korrelationskoeffizient
von
Bravais und Pearson
20.06.2005 Kity Rojas Ropain Fachhochschule 1
Bonn-Rhein-Sieg, Fach Statistik
2. Karl Pearson
• 1857-1936 England
• Studierte Mathematik, Physik, Metaphysik,
Mittelhochdeutsch und Folklore in
Cambridge, Heidelberg und Berlin.
• Veröffentlichung von vielen Bücher u. a.
„Grammar of Science“
• Der Korrelationskoeffizient hat Pearson in
seinen Studien sozialwissenschaftlichen
Phänomene angewendet.
20.06.2005 Kity Rojas Ropain Fachhochschule 2
Bonn-Rhein-Sieg, Fach Statistik
3. Skalierung
X Nominal Ordinal Metrisch
Y
Nominal K* K* K*
Ordinal K* Rsp Rsp
Metrisch K* Rsp r
20.06.2005 Kity Rojas Ropain Fachhochschule 3
Bonn-Rhein-Sieg, Fach Statistik
4. Korrelationskoeffizient nach
Bravis- Pearson
Gegeben sind zwei Merkmale X und Y, die
metrisch skaliert und nicht unabhängig sind.
Es wird das arithmetische Mittel, die Varianz , die
Standardabweichung für beide Merkmale benötigt.
Zusätzlich wird ein weiteres Streuungsmaß
eingeführt: Die Kovarianz, welche eine Beziehung
zu X und Y herstellt. Sie ist ein Maß für die
gemeinsame Streuengsmerkmale.
20.06.2005 Kity Rojas Ropain Fachhochschule 4
Bonn-Rhein-Sieg, Fach Statistik
5. Der Korrelationskoeffizient von Pearson drückt den Grad der
Linearität des Zusammenhangs zwischen 2 metrischen
Merkmalen X und Y aus.
• r=1: Alle Beobachtungen liegen auf einer
steigenden Geraden.
• r=-1: Alle Beobachtungen liegen auf einer
fallenden Geraden.
• r>0: Die Merkmale sind positiv korreliert.
Regressionsgerade ist steigend
• r<0: Die Merkmale sind negativ korreliert.
Regressionsgerade ist fallend.
• r=0: Die Merkmale sind unkorreliert. Es besteht
kein linearer Zusammenhang.
20.06.2005 Kity Rojas Ropain Fachhochschule 5
Bonn-Rhein-Sieg, Fach Statistik
6. Formeln
Stichprobe Grundgesamtheit
( xi − x )( yi − y ) ( xi − µx)( yi − µy )
Sxy = ∑ σxy =
n −1 N
Sxy σxy
rxy = ρxy =
SxSy σxσy
20.06.2005 Kity Rojas Ropain Fachhochschule 6
Bonn-Rhein-Sieg, Fach Statistik
7. Aufgabe
Beobachtungs Produktions
Gesamtkosten
• In einem Unternehmen zeitraum menge
wurden für n=12 1 45 205
Beobachtungszeiträume 2 30 128
3 35 165
folgende Gesamtkosten 4 40 175
in Abhängigkeit von der 5 20 104
6 55 240
Produktionsmenge 7 65 275
festgestellt: 8 58 250
9 30 142
10 60 265
11 25 112
12 49 214
20.06.2005 Kity Rojas Ropain Fachhochschule 7
Bonn-Rhein-Sieg, Fach Statistik
8. Aufgabe
i Xi Y
i Xi − X ( Xi − X ) ( X − X )( Yi − Y )
i
2
Yi − Y
2
(Y − Y )
i
1 45 205 15,42 237,67 2,33 5,44 35,97
2 30 128 -61,58 3792,51 -12,67 160,44 780,06
3 35 165 -24,58 604,34 -7,67 58,78 188,47
4 40 175 -14,58 212,67 -2,67 7,11 38,89
5 20 104 -85,58 7324,51 -22,67 513,78 1939,89
6 55 240 50,42 2541,84 12,33 152,11 621,81
7 65 275 85,42 7296,01 22,33 498,78 1907,64
8 58 250 60,42 3650,17 15,33 235,11 926,39
9 30 142 -47,58 2264,17 -12,67 160,44 602,72
10 60 265 75,42 5687,67 17,33 300,44 1307,22
11 25 112 -77,58 6019,17 -17,67 312,11 1370,64
12 49 214 24,42 596,17 6,33 40,11 154,64
∑ 512,00 2275,00 40226,92 2444,67 9874,33
1 / n∑ 42,67 189,58 3352,24 203,72 822,86
57,90 14,27
Sxy
Sy ( Kovarianz)
Sx ( St andar dabw eichung )
( St andar dabw eichung )
20.06.2005 Kity Rojas Ropain Fachhochschule 8
Bonn-Rhein-Sieg, Fach Statistik
10. Aufgabe
r = 0,9957
• Es steht ein sehr starker positiver linear
Zusammenhang zwischen die Produktionsmenge
und die Gesamtkosten.
20.06.2005 Kity Rojas Ropain Fachhochschule 10
Bonn-Rhein-Sieg, Fach Statistik
11. Streuungsdiagramm
300
250
Gesamtkosten (in Tsd. €)
200
150
100
50
0
0 10 20 30 40 50 60 70
Produktionsmenge (in Tsd. Stück)
20.06.2005 Kity Rojas Ropain Fachhochschule 11
Bonn-Rhein-Sieg, Fach Statistik
12. Extra Aufgabe
i Xi Y
i (Yi − Y ) Xi − X ( Xi − X ) ( Xi − X )( Yi − Y )
2
Yi − Y
2
7 48 108 -7,63 58,14 -4,38 19,14 33,36
1 50 108 -7,63 58,14 -2,38 5,64 18,11
3 50 117 1,38 1,89 -2,38 5,64 -3,27
5 52 115 -0,63 0,39 -0,38 0,14 0,23
8 53 118 2,38 5,64 0,63 0,39 1,48
4 54 115 -0,63 0,39 1,63 2,64 -1,02
6 54 122 6,38 40,64 1,63 2,64 10,36
2 58 122 6,38 40,64 5,63 31,64 35,86
∑ 419 925 205,875 67,875 95,125
1 / n∑ 52,375 115,625 25,734375 8,484375 11,890625
5,072905972 2,912795049
20.06.2005 Kity Rojas Ropain Fachhochschule 12
Bonn-Rhein-Sieg, Fach Statistik