SlideShare una empresa de Scribd logo
1 de 45
T-Tests und
Varianzanalysen
PC-Praktikum
Allgemein
 Bei all diesen Tests geht es um
Zusammenhänge zwischen 2 oder mehr
Variablen.
 Dabei ist die abhängige Variable(AV)
mindestens Intervallskalenniveau und die
unabhängige/n Variable/n(UV) kategorial.
 Es werden die arithmetischen Mittel
erfasst und auf signifikante Unterschiede
geprüft.
T-Tests
 Untersuchen, ob sich die Mittelwerte zweier SP
signifikant unterscheiden (außer T-Test für eine SP:
Vergleich eines Mittelwertes einer SP mit beliebigen
Mittelwert )
Voraussetzungen:
 Normalverteilung
 min. intervallskalierte AV
 dichotome UV
 Nicht zu große Stichprobenumfänge (neigt dann zu
signifikanten Ergebnissen) und Zufallsauswahl
 für T-Test für unabhängige Stichproben(SP):
unabhängige (Teil-)Stichproben
 für T-Test für gepaarte SP: abhängige (Teil-)SP
Quelle: Kähler 2006: 414.
T-Test bei einer SP
 Datensatz: Master_FP_2006.sav
 Es geht um das Alter der Befragten: Variable:
alter
 Forschungsinteresse: Wir wollen herausfinden,
ob sich der Altersdurchschnitt dieser Studie
signifikant vom Altersdurchschnitt des
Hochschulgesamtdatensatz unterscheidet.
Hier wollen wir dazu den Ein-Stichproben-T-Test
verwenden.
 andere Anwendungsmöglichkeiten: z.B. Vergleich des Durchschnittseinkommen der
eigenen Studie mit „offiziellem“ Durchschnittseinkommen der Gesamtbevölkerung
T-Test bei einer SP
Quelle: Janssen 2003: 306.
 AnalysierenMittelwerte vergleichenT-Test bei einer SP
 Hypothesen (für zweiseitig):
H0: μ empir=33,8935
H1: μ empir ≠33,8935
T-Test bei einer SP -Fenster
 Testvariable(n)… Variable(n) bei der der Test durchgeführt werden
soll
hier: alter
 Testwert… Wert, mit dem der empirische Mittelwert verglichen
werden soll
hier: 33,8935 (aus Hochschulgesamtdatensatz)
 Optionen:
Konfidenzintervall
Fehlende Werte: Fallausschluss Test für Test... nur Ausschluss der
Fälle, bei denen in der gerade analysierten abhängigen oder
unabhängigen Variable ein fehlender Wert auftritt
Listenweiser Fallausschluss… Ausschluss aller Fälle,
in denen in irgendeiner dieser Variablen ein fehlender Wert auftritt
T-Test bei einer SP -Ausgaben
Statistik bei einer Stichprobe
4114 53,21 10,079 ,157
Alter der Befragten
N Mittelwert
Standardab
weichung
Standardfe
hler des
Mittelwertes
Test bei einer Sichprobe
122,930 4113 ,000 19,317 19,01 19,63
Alter der Befragten
T df Sig. (2-seitig)
Mittlere
Differenz Untere Obere
95% Konfidenzintervall
der Differenz
Testwert = 33.8935
Freiheits-
grade
|t|>tkrit=1,96 UND Sig.(2-seitig)* < 0,05
H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit von 5%)
T-Wert
Streuung um
den Mittelwert
Mittelwertsdifferenz:
Differenz zum
Testwert
in diesem Bereich
liegt mit 95%iger
Sicherheit der wahre
Wert
*für 1-seitige Hypothesen: Sig.(2-seitig) durch 2 teilen
T-Test bei unabhängigen SP
 Datensatz: Master_FP_2006.sav
 Es geht um die Frage 51:
Menü Mittelwerte…
 Analysieren  Mittelwerte vergleichen  Mittelwerte
 … zum Vergleich der Mittelwerte u. a. deskriptiver Statistik sowie
Kontrolle der Drittvariablen
Fenster:
 abhängige Variablen: f51beruf
 unabhängige Variablen: f65gesch
 Optionen: Zellenstatistik…was gewünscht
ANOVA-Tabelle… Varianzanalyse (ohne Einbeziehung
der Kontrollvariablen)
und Eta… zur Bestimmung des Anteils der erklärten
Varianz
Linearitätstest… prüft, ob Zusammenhang durch lineare
Regression erfasst werden kann (metrische, klassifizierte UV nötig)
 Weiter… zur Einführung von Kontrollvariablen
Menü Mittelwerte…
Verarbeitete Fälle
4022 96,3% 153 3,7% 4175 100,0%
Angesehenen Beruf
ausüben * Geschlecht
N Prozent N Prozent N Prozent
Eingeschlossen Ausgeschlossen Insgesamt
Fälle
Bericht
Angesehenen Beruf ausüben
2,89 1294 1,156 1,335
2,68 2728 1,148 1,318
2,75 4022 1,154 1,332
Geschlecht
Weiblich
Männlich
Insgesamt
Mittelwert N
Standardab
weichung Varianz
Forschungsinteresse: Sind die Mittelwertunterschiede signifikant oder
zufällig?
Prüfung mit 2-Stichproben-T-Test für unabhängige SP
T-Test bei unabhängigen SP
 AnalysierenMittelwerte vergleichenT-Test bei unabhängigen SP
 Hypothesen (für zweiseitig):
H0: μweibl= μmännl
H1: μ weibl ≠ μmännl
Fenster:
 Testvariable(n) hier: f51beruf
 Gruppenvariable…UV hier: f65gesch
 Gruppen def.: Gruppe 1 hier: 1
Gruppe 2 hier: 2
Trennwert… Teilungspunkt für
ordinale oder metrische UV
Bildung v. 2 Gruppen
 Optionen:
Konfidenzintervall
Fehlende Werte: Fallausschluss Test für Test
Listenweiser Fallausschluss
T-Test bei unabhängigen SP -
Ausgaben
Gruppenstatistiken
1294 2,89 1,156 ,032
2728 2,68 1,148 ,022
Geschlecht
Weiblich
Männlich
Angesehenen
Beruf ausüben
N Mittelwert
Standardab
weichung
Standardfe
hler des
Mittelwertes
T-Test bei unabhängigen SP -
Ausgaben
Test bei unabhängigen Stichproben
3,707 ,054 5,252 4020 ,000 ,204 ,039 ,128 ,280
5,239 2524,455 ,000 ,204 ,039 ,128 ,280
Varianzen sind gleich
Varianzen sind nicht
gleich
Angesehenen
Beruf
ausüben
F
Signifikanz
Levene-Test
der
Varianzgleich
heit
T
df
Sig.
(2-seitig)
Mittlere
Differenz
Standardfehler
der
Differenz
Untere
Obere
95%
Konfidenzint
ervall der
Differenz
T-Test für die Mittelwertgleichheit
F-
Wert
Standardab
-weichung
der
Differenz
T-Test bei unabhängigen SP -
Ausgaben
Levene-Test für Varianzgleichheit:
 H0: Varianzen der Variablen gleich
 H1: Varianzen sind nicht gleich
 Ergebnis: Signifikanz > 0,05
“Varianzen sind nicht gleich” ablesen
T-Test:
 |t|>tkrit=1,96 UND Sig.(2-seitig) < 0,05
H0 ist abzulehnen (mit
Irrtumswahrscheinlichkeit von 5%)
T-Test bei gepaarten SP
 Datensatz: abm.sav
 Einkommen von Teilnehmern einer
Arbeitsbeschaffungsmaßnahme
 Forschungsinteresse: Unterschiede des
Einkommen der Teilnehmer vor und nach der
Arbeitsbeschaffungsmaßnahme
Prüfung mit 2-Stichproben-T-Test für
abhängige SP
 AnalysierenMittelwerte vergleichenT-
Test bei gepaarten SP
T-Test bei gepaarten SP
 Hypothesen (für zweiseitig):
H0: μvar225= μvar310
H1: μvar225 ≠ μvar310
Fenster:
 Gepaarte Variablen… es sind mehrere Paare möglich
hier: var225(Bruttoeinkommen vor ABM) Strg-Taste
halten var310(erstes Bruttoeinkommen nach ABM)
 Optionen:
Konfidenzintervall
Fehlende Werte: Fallausschluss Test für Test
Listenweiser Fallausschluss
T-Test bei gepaarten SP
Statistik bei gepaarten Stichproben
2783,54 80 1284,753 143,640
2631,80 80 920,817 102,950
BRUTTOEINKOMMEN
VOR ABM
ERSTES BRUTTOEINK.
NACH ABM
Paaren
1
Mittelwert N
Standardab
weichung
Standardfe
hler des
Mittelwertes
Korrelationen bei gepaarten Stichproben
80 ,644 ,000
BRUTTOEINKOMMEN
VOR ABM & ERSTES
BRUTTOEINK.NACH ABM
Paaren
1
N Korrelation Signifikanz
Korrelation
recht hoch
T-Test bei gepaarten SP
Test bei gepaarten Stichproben
151,738 987,719 110,430 -68,069 371,544 1,374 79 ,173
BRUTTOEINKOMMEN
VOR ABM - ERSTES
BRUTTOEINK.NACH ABM
Paaren
1
Mittelwert
Standardabweichung
Standardfehler
des
Mittelwertes
Untere
Obere
95%
Konfidenzintervall
der Differenz
Gepaarte Differenzen
T
df
Sig.
(2-seitig)
|t|<tkrit=1,994 UND Sig.(2-seitig) > 0,05
 H0 kann nicht abgelehnt werden kein signifikanter Unterschied im Einkommen
Mittelwert der
Differenzen
zwischen den
Zeitpunkten
Standard-
abweichung der
Differenzen
zwischen den
Zeitpunkten
Varianzanalysen
 Untersucht, ob sich die Mittelwerte von mehr als 2 SP signifikant
unterscheiden
 Prüft nur, ob Unterschied zwischen min. einem der verglichenen
Paare signifikant ist  zur Prüfung zwischen welchen
Vergleichspaaren signifikante Differenzen: Post-Hoc-Tests
Voraussetzungen:
 UV: alle Skalenniveaus möglich, kategorisiert
 AV: min. Intervallskalierung
 Varianzhomogenität geprüft mit Levene-Test
 Normalverteilung
 Zufallsstichproben
 Für ANOVA: unabhängige SP
 Für Varianzanalyse mit Meßwiederholung: abhängige SP
Quelle: Kähler 2006: 441.
Einfaktorielle ANOVA
 Datensatz: Master_2006_FP
 Forschungsinteresse: Frage 51Gibt es Unterschiede
zwischen den Geburtskohorten?
Prüfung mit Einfaktorieller ANOVA
 AnalysierenMittelwerte vergleichenEinfaktorielle
ANOVA
 Hypothesen (für zweiseitig):
H0: μ1=μ2=…=μi
H1: μ1≠μ2≠…≠μi
Einfaktorielle ANOVA
Fenster:
 Abhängige Variablen hier: f51beruf
 Faktor… UV hier: f66gebja_koh
 Kontraste: Polynomial UND Grad … Erklärung der
Summe der Abweichungsquadrate zwischen
den Gruppen durch Polynomterme bis zur
5.Ordnung
Kontrast 1 von 1 : Koeffizienten… t-Test für a priori
festgelegte Kontrastgruppen Kodierung mit -1
und +1 für zu vergleichende Gruppen und 0 für
ausgeschlossene Gruppen
(Koeffizientensumme… Koeffizienten müssen 0
ergeben)
Einfaktorielle ANOVA - Post-Hoc
Post-Hoc:
 Varianz-Gleichheit angenommen:
LSD
Bonferroni
Sidak
Scheffé… Vergleich der Mittelwerte und
Berechnung der kritischen Differenz hier:
Scheffe-Test
etc.
 Keine Varianzgleichheit angenommen:
Tamhane-T2
etc.
 Signifikanzniveau …angeben als ,05 etc.
Einfaktorielle ANOVA - Optionen
Optionen:
 Statistik: Deskriptive Statistik
Feste und zufällige Effekte: Statistiken für Modell mit
festen Effekten(Standardabweichung,
Standardfehler, Konfidenzintervall) und zufälligen
Effekten(Standardfehler, Konfidenzintervall, Varianz
zwischen Komonenten)
Test auf Homogenität der Varianzen… Levene-test
Brown-Forsythe… Test auf Gleichheit der Mittelwerte der
Gruppen für ungleiche Varianzen
Welch… siehe Brown-Forsythe-Test
 Diagramm der Mittelwerte: Liniendiagramm aus Punkten der
Mittelwerte der Gruppen
 Fehlende Werte: Fallauschluss Test für Test
Listenweiser Testausschluss
Einfaktorielle ANOVA
ONEWAY deskriptive Statistiken
Angesehenen Beruf ausüben
27 2,15 1,262 ,243 1,65 2,65 1 5
342 2,19 1,066 ,058 2,08 2,31 1 5
974 2,50 1,115 ,036 2,43 2,57 1 5
1378 2,89 1,151 ,031 2,83 2,95 1 5
1134 2,93 1,125 ,033 2,87 3,00 1 5
168 2,98 1,113 ,086 2,81 3,15 1 5
4023 2,75 1,154 ,018 2,71 2,78 1 5
1,00
2,00
3,00
4,00
5,00
6,00
Gesamt
N Mittelwert
Standardab
weichung
Standardf
ehler Untergrenze Obergrenze
95%-Konfidenzintervall für
den Mittelwert
Minimum Maximum
Test der Homogenität der Varianzen
Angesehenen Beruf ausüben
1,700 5 4017 ,131
Levene-
Statistik df1 df2 Signifikanz
│F│< Fkrit=2,21 UND Signifikanz >0,05
Varianzhomogenität falls nicht: kann Varianzanalyse nicht durchgeführt werden
F-Wert
Einfaktorielle ANOVA
ONEWAY ANOVA
Angesehenen Beruf ausüben
250,027 5 50,005 39,364 ,000
5102,903 4017 1,270
5352,931 4022
Zwischen den Gruppen
Innerhalb der Gruppen
Gesamt
Quadrats
umme df
Mittel der
Quadrate F Signifikanz
Varianzen
Zerlegung der sum-
mierten Ab-
weichungsquadrate
in SAQzw , SAQin
und SAQge
│F│> Fkrit=2,21 UND Signifikanz <0,05
signifikante Unterschiede zwischen Geburtskohorten
Mehrfachvergleiche
Abhängige Variable: Angesehenen Beruf ausüben
Scheffé-Prozedur
-,045 ,225 1,000 -,79 ,71
-,355 ,220 ,761 -1,09 ,38
-,744* ,219 ,042 -1,47 -,01
-,785* ,219 ,026 -1,52 -,05
-,834* ,234 ,026 -1,61 -,06
,045 ,225 1,000 -,71 ,79
-,310* ,071 ,002 -,55 -,07
-,699* ,068 ,000 -,93 -,47
-,740* ,070 ,000 -,97 -,51
-,789* ,106 ,000 -1,14 -,44
,355 ,220 ,761 -,38 1,09
,310* ,071 ,002 ,07 ,55
-,389* ,047 ,000 -,55 -,23
-,430* ,049 ,000 -,59 -,27
-,479* ,094 ,000 -,79 -,17
,744* ,219 ,042 ,01 1,47
,699* ,068 ,000 ,47 ,93
,389* ,047 ,000 ,23 ,55
-,041 ,045 ,975 -,19 ,11
-,090 ,092 ,966 -,40 ,22
,785* ,219 ,026 ,05 1,52
,740* ,070 ,000 ,51 ,97
,430* ,049 ,000 ,27 ,59
,041 ,045 ,975 -,11 ,19
-,049 ,093 ,998 -,36 ,26
,834* ,234 ,026 ,06 1,61
,789* ,106 ,000 ,44 1,14
,479* ,094 ,000 ,17 ,79
,090 ,092 ,966 -,22 ,40
,049 ,093 ,998 -,26 ,36
(J) geburtskohorten
in Jahrzehnte
1930-1939
1940-1949
1950-1959
1960-1969
ab 1970
bis 1929
1940-1949
1950-1959
1960-1969
ab 1970
bis 1929
1930-1939
1950-1959
1960-1969
ab 1970
bis 1929
1930-1939
1940-1949
1960-1969
ab 1970
bis 1929
1930-1939
1940-1949
1950-1959
ab 1970
bis 1929
1930-1939
1940-1949
1950-1959
1960-1969
(I) geburtskohorten
in Jahrzehnte
bis 1929
1930-1939
1940-1949
1950-1959
1960-1969
ab 1970
Mittlere
Differenz(I-J)
Standar
dfehler Signifikanz Untergrenze Obergrenze
95%-Konfidenzintervall
Die Differenz der Mittelwerte ist auf dem Niveau .05 signifikant.
*.
Einfaktorielle ANOVA
3 homogene Gruppen, deren Mittelwerte sich nicht
signifikant unterscheiden:
Gruppe 1: 1-3 und Gruppe 2: 3-5 und Gruppe 3: 4-6
Angesehenen Beruf ausüben
Scheffé-Prozedur
a,b
27 2,15
342 2,19
974 2,50 2,50
1378 2,89 2,89
1134 2,93 2,93
168 2,98
,294 ,110 ,995
geburtskohorten
in Jahrzehnte
bis 1929
1930-1939
1940-1949
1950-1959
1960-1969
ab 1970
Signifikanz
N 1 2 3
Untergruppe für Alpha = .05.
Die Mittelwerte für die in homogenen Untergruppen befindlichen
Gruppen werden angezeigt.
Verwendet ein harmonisches Mittel für Stichprobengröße =
123,590.
a.
Die Gruppengrößen sind nicht identisch. Es wird das
harmonische Mittel der Gruppengrößen verwendet.
Fehlerniveaus des Typs I sind nicht garantiert.
b.
Signifikanz
innerhalb
den
Gruppen
Weitere Varianzanalysen
 AnalysierenAllgemeines lineares
ModellUnivariat… für eine AV
 AnalysierenAllgemeines lineares
ModellMultivariat… für mehrere AV
 AnalysierenAllgemeines lineares
ModellMeßwiederholung… Varianzanalyse für
abhängige SP
 AnalysierenAllgemeines lineares
ModellVarianzkomponenten… schätzt bei
Modellen mit gemischten Effekten den Beitrag jedes
Zufallseffekts zur Varianz der abhängigen Variablen.
2-faktorielle Varianzanalyse
 Kann auch Wirkung ihrer Kombination(Interaktion) untersuchen
 gleiche Zellhäufigkeiten… alle Zellen mit gleicher Anzahl der Fälle
besetzt wechselseitig voneinander unabhängig
 Gegenteil: ungleiche Zellhäufigkeiten: Effekte korrelieren
miteinander
 Datensatz: allbus90.sav
 Forschungsinteresse: Welchen Einfluss hat der Schulbildung und
das Geschlecht auf das Einkommen unter Kontrolle der Variablen
Alter?
Prüfung mit 2-faktorieller Varianzanalyse
 AnalysierenAllgemeines lineares ModellUnivariat
AnalysierenAllgemeines lineares
ModellUnivariat
Univariat:
 Abhängige Variable hier: eink
 Feste Faktoren… alle relevanten Merkmale des Faktors sind
durch Untersuchungsanordnung vorgegeben
hier: geschl, schul2
 Zufallsfaktoren… kommen durch bzgl. dieses Merkmals
zufällige Zuweisung von Fällen zu
Untersuchungsgruppen zustande
 Kovariaten… zusätzliche Einführung einer mit
metrischen Variable (wichtig: keine
Korrelation zu Faktoren) Kontrollvariable
hier: alt
 WLS-Gewichtung… für Gewichtung der Fälle
(vorher Gewichtungsvariable bilden)
AnalysierenAllgemeines lineares
ModellUnivariat
 Modell: Gesättigtes Modell… alle Faktoren und Kovariate sowie
Wechselwirkungen zwischen Faktoren gehen ins Modell ein
hier: gesättigtes Modell
Anpassen… Auswahl der Haupteffekte (Faktoren und Kovariate)
und Wechselwirkungen (auch mit Kovariaten), die in Modell
eingehen sollen
Term(e) konstruieren: u.a. Alle ?-Weg… Wechselwirkungen der
?.Ordnung
Quadratsumme… zur Berechnung der Summe der Abweichungen
 Typ I… Hierarchisch: Jeder Term wird nur für die in der
Liste vor ihm stehenden korrigiertReihenfolge hat Einfluss
auf Ergebnis
Typ II: Regressionsmodell: Berechnung der Haupteffekte um
alle anderen Terme (außer Interaktionen) korrigiert
Typ III: Berechnung der Quadratsumme eines Effekts um alle
anderen Effekte bereinigt, die nicht im Effekt enthalten sind
robust gegenüber ungleichen Zellhäufigkeiten
ungeeignet für leere Zellen
Typ IV: für leere Zellen
AnalysierenAllgemeines lineares
ModellUnivariat
 Kontraste… Vergleich von Gruppen (nur 1 Faktor) über a priori
definierte Kontraste (ähnlich wie bei ANOVA):
Einfach… Vergleich der Mittelwerte aller Faktorstufen (außer
Referenzkategorie) mit Mittelwert der
Referenzkategorie
Wiederholt… Vergleich des Mittelwerts jeder Faktorstufe
(außer der letzten) mit dem Mittelwert der
folgenden Faktorstufe
Polynomial… Vergleich des linearen etc. Effekts  für
Schätzung von polynomialen Trends
etc.
Referenzkategorie… erste oder letzte Faktorstufe
AnalysierenAllgemeines lineares
ModellUnivariat
 Diagramme: Profilplots… stellen den
Zusammenhang zwischen max.
2 Faktoren und der AV dar:
Horizontale Achse… 1.Faktor
hier: schul
Separate Linien… 2.Faktor
hier: geschl
Separate Diagramme… 3.Faktor
 Post-Hoc… wie bei ANOVA
 (Speichern… Hier kann man festlegen, dass bestimmte
Werte als neue Variablen gespeichert werden können)
AnalysierenAllgemeines lineares
ModellUnivariat
Optionen:
 Geschätzte Randmittel:
Mittelwerte anzeigen für… Auswahl der Faktoren und –
kombinationen für Ausgabe der Mittelwerte
hier: (Insgesamt)
Haupteffekte vergleichen UND Anpassung des
Konfidenzintervalls… Auswahl von Post-Hoc-Tests
 Anzeigen:
Deskriptive Statistik… für jede Faktorstufenkomination
Schätzer der Effektgröße… partielle Eta-Werte für erklärte
Varianz für jeden Faktor, Interaktion und Kovariate
hier: beide ankreuzen
Beobachtete Schärfe… Wahrscheinlichkeit einen tatsächlich
vorhandenen Effekt auch zu entdecken
etc.
 Signifikanzniveau
2-faktorielle Varianzanalyse
Zwischensubjektfaktoren
Hauptsch
ule
74
Mittelschul
e
33
Fachh/Abi 35
MAENNLI
CH
80
WEIBLICH 62
2
3
4
Schulbildung
umkodiert
1
2
GESCHLECHT,
BEFRAGTE<R>
Wertelabel N
Gesamtmittelwert
Abhängige Variable: BEFR.: MONATLICHES
NETTOEINKOMMEN
2142,756a
94,009 1956,836 2328,676
Mittelwert
Standardf
ehler Untergrenze Obergrenze
95% Konfidenzintervall
Die Kovariaten im Modell werden anhand der
folgenden Werte berechnet: ALTER,
BEFRAGTE<R> = 49,63.
a.
2-faktorielle Varianzanalyse
Deskriptive Statistiken
Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN
2214,63 1130,896 40
1328,15 710,437 34
1807,32 1053,217 74
2895,24 1142,137 21
1897,92 633,394 12
2532,58 1091,131 33
2675,00 1321,606 19
1806,13 870,318 16
2277,80 1204,875 35
2502,63 1204,036 80
1561,77 774,572 62
2091,83 1136,262 142
GESCHLECHT,
BEFRAGTE<R>
MAENNLICH
WEIBLICH
Gesamt
MAENNLICH
WEIBLICH
Gesamt
MAENNLICH
WEIBLICH
Gesamt
MAENNLICH
WEIBLICH
Gesamt
Schulbildung umkodiert
Hauptschule
Mittelschule
Fachh/Abi
Gesamt
Mittelwert
Standardab
weichung N
2-faktorielle Varianzanalyse
Tests der Zwischensubjekteffekte
Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN
42424611,068a 6 7070768,5 6,837 ,000 ,233
63559012,059 1 63559012 61,456 ,000 ,313
218591,240 1 218591,24 ,211 ,646 ,002
9909843,044 2 4954921,5 4,791 ,010 ,066
25432596,662 1 25432597 24,591 ,000 ,154
91478,764 2 45739,382 ,044 ,957 ,001
139619196,9 135 1034216,3
803401284,0 142
182043807,9 141
Quelle
Korrigiertes Modell
Konstanter Term
alt
schul2
geschl
schul2 * geschl
Fehler
Gesamt
Korrigierte
Gesamtvariation
Quadratsum
me vom Typ III df
Mittel der
Quadrate F Signifikanz
Partielles
Eta-Quadrat
R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199)
a.
Signifikanz>0,05Keine signifikante Interaktion Prüfung der Signifikanz der
Haupteffekte: Geschlecht und Schulbildung haben signifikante Wirkung, weil
Signifikanz<0,05; Kovariate Alter hat keine signifikante Wirkung, weil Sig. >0,05
(korrigiertes) R2=0,199 Modell erklärt ca. 20% der Gesamtvarianz: davon erklärt die
Schulbildung ca. 7% und das Geschlecht ca. 15% der VarianzGeschlecht hat stärkere
Wirkung als Schulbildung
2-faktorielle Varianzanalyse
Tests der Zwischensubjekteffekte
Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN
42424611,068a 6 7070768,5 6,837 ,000 ,233
63559012,059 1 63559012 61,456 ,000 ,313
218591,240 1 218591,24 ,211 ,646 ,002
9909843,044 2 4954921,5 4,791 ,010 ,066
25432596,662 1 25432597 24,591 ,000 ,154
91478,764 2 45739,382 ,044 ,957 ,001
139619196,9 135 1034216,3
803401284,0 142
182043807,9 141
Quelle
Korrigiertes Modell
Konstanter Term
alt
schul2
geschl
schul2 * geschl
Fehler
Gesamt
Korrigierte
Gesamtvariation
Quadratsum
me vom Typ III df
Mittel der
Quadrate F Signifikanz
Partielles
Eta-Quadrat
R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199)
a.
2-faktorielle Varianzanalyse-
Diagrammauswertung
Separate Linien:
 Wenn Zeilenvariable keinen Einfluss besitzt, verläuft sie parallel zur
x-Achse
 Besitzt sie Einfluss, steigt oder fällt sie
hier: Einfluss des Geschlechts auf Einkommen
 Wenn sie Einfluss hat, kann sie in verschiedenen Abschnitten
unterschiedlich verlaufen, aber nicht parallel
Horizontale Achse:
 Wenn Spaltenvariable keinen Einfluss besitzt, fallen die einzelnen
Linien zusammen
 Wenn sie Einfluss hat: Abstand zwischen den Linien
hier: Einfluss des Geschlechts auf Einkommen vorhanden
 Wenn Interaktion vorliegt, verlaufen Linien zumindest in Bereichen
nicht parallel
hier: Linien verlaufen im Bereich Fachhochschule/Abi nicht mehr
parallelleichte Interaktion
 Wenn keine Interaktion vorliegt, verlaufen die Linien parallel
Konstanz des Abstands
Aufgaben
Für diese Aufgaben wird der Datensatz Master_FP_2006 benötigt.
Es geht um die Variablen studfach(1.abgeschlossenes Studienfach) und
f51aufst(Berufserfolg bedeutet gute Aufstiegschancen zu haben). Es
interessiert hier, ob das Studienfach beeinflusst, wie sehr der Aussage
(nicht) zugestimmt wird, dass „Beruflicher Erfolg ist … gute
Aufstiegschancen zu haben.“
a) Vergleicht zuerst die Mittelwerte der Gruppen der Variable studfach
untereinander und mit dem Gesamtmittelwert der Variable studfach!
b) Nun soll herausgefunden werden, ob sich die Mittelwerte von f51einko
signifikant unterscheiden, je nachdem welches Studienfach studiert
wurde. Welchen Test könnt ihr dazu verwenden?
c) Führt den Test durch! Was ist das Ergebnis?
d) Welchen Test müsste man verwenden, wenn man herausfinden will, ob
es signifikante Mittelwertsdifferenzen bezüglich f70gesch(Haben Sie
Geschwister?) bzgl. f51aufst gibt?
e) Führt den Test durch! Was ist das Ergebnis?
Literaturempfehlungen
CD-Rom:
 Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005):
Einführung in die sozialwissenschaftliche Datenanalyse, Ein
multimediales Selbstlernprogramm. Wiesbaden: VS Verlag
für Sozialwissenschaften/GWV Fachverlage GmbH.
Lehrbuch:
 Janssen, Jürgen/Laatz, Wilfried(2005): Statistische
Datenanalyse mit SPSS für Windows. Berlin, Heidelberg:
Springer-Verlag.
SPSS:
 Ergebnis-Assistent bei Tabellen (in Englisch)
 Hilfe-Taste auf den Fenstern (erklärt Vorgang und seine
Bedeutung)
Quellen
 Backhaus, Klaus/Erichson, Bernd/Plinke, Wulff/Weiber, Rolf(2006):
Multivariate Analysemethoden. Berlin/Heidelberg: Springer-Verlag.
 Bellgardt, Egon(2004): Statistik mit SPSS. München: Verlag Franz
Vahlen GmbH.
 Fahrmeir, Ludwig ed.al.(2005): Arbeitsbuch Statistik.
Berlin/Heidelberg: Springer-Verlag.
 Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005):
Einführung in die sozialwissenschaftliche Datenanalyse, Ein
multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für
Sozialwissenschaften/GWV Fachverlage GmbH.
 Kähler, Wolf-Michael(2006): Statistische Datenanalyse. Wiesbaden:
Friedr. Vieweg & Sohn Verlag/GWV Fachverlage GmbH.
 Janssen, Jürgen/Laatz, Wilfried(2003): Statistische Datenanalyse
mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag.

Más contenido relacionado

Destacado

How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationErica Santiago
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellSaba Software
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming LanguageSimplilearn
 

Destacado (20)

How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming Language
 

Uebung Varianzanalysen.ppt

  • 2. Allgemein  Bei all diesen Tests geht es um Zusammenhänge zwischen 2 oder mehr Variablen.  Dabei ist die abhängige Variable(AV) mindestens Intervallskalenniveau und die unabhängige/n Variable/n(UV) kategorial.  Es werden die arithmetischen Mittel erfasst und auf signifikante Unterschiede geprüft.
  • 3. T-Tests  Untersuchen, ob sich die Mittelwerte zweier SP signifikant unterscheiden (außer T-Test für eine SP: Vergleich eines Mittelwertes einer SP mit beliebigen Mittelwert ) Voraussetzungen:  Normalverteilung  min. intervallskalierte AV  dichotome UV  Nicht zu große Stichprobenumfänge (neigt dann zu signifikanten Ergebnissen) und Zufallsauswahl  für T-Test für unabhängige Stichproben(SP): unabhängige (Teil-)Stichproben  für T-Test für gepaarte SP: abhängige (Teil-)SP
  • 5. T-Test bei einer SP  Datensatz: Master_FP_2006.sav  Es geht um das Alter der Befragten: Variable: alter  Forschungsinteresse: Wir wollen herausfinden, ob sich der Altersdurchschnitt dieser Studie signifikant vom Altersdurchschnitt des Hochschulgesamtdatensatz unterscheidet. Hier wollen wir dazu den Ein-Stichproben-T-Test verwenden.  andere Anwendungsmöglichkeiten: z.B. Vergleich des Durchschnittseinkommen der eigenen Studie mit „offiziellem“ Durchschnittseinkommen der Gesamtbevölkerung
  • 6. T-Test bei einer SP Quelle: Janssen 2003: 306.  AnalysierenMittelwerte vergleichenT-Test bei einer SP  Hypothesen (für zweiseitig): H0: μ empir=33,8935 H1: μ empir ≠33,8935
  • 7. T-Test bei einer SP -Fenster  Testvariable(n)… Variable(n) bei der der Test durchgeführt werden soll hier: alter  Testwert… Wert, mit dem der empirische Mittelwert verglichen werden soll hier: 33,8935 (aus Hochschulgesamtdatensatz)  Optionen: Konfidenzintervall Fehlende Werte: Fallausschluss Test für Test... nur Ausschluss der Fälle, bei denen in der gerade analysierten abhängigen oder unabhängigen Variable ein fehlender Wert auftritt Listenweiser Fallausschluss… Ausschluss aller Fälle, in denen in irgendeiner dieser Variablen ein fehlender Wert auftritt
  • 8. T-Test bei einer SP -Ausgaben Statistik bei einer Stichprobe 4114 53,21 10,079 ,157 Alter der Befragten N Mittelwert Standardab weichung Standardfe hler des Mittelwertes Test bei einer Sichprobe 122,930 4113 ,000 19,317 19,01 19,63 Alter der Befragten T df Sig. (2-seitig) Mittlere Differenz Untere Obere 95% Konfidenzintervall der Differenz Testwert = 33.8935 Freiheits- grade |t|>tkrit=1,96 UND Sig.(2-seitig)* < 0,05 H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit von 5%) T-Wert Streuung um den Mittelwert Mittelwertsdifferenz: Differenz zum Testwert in diesem Bereich liegt mit 95%iger Sicherheit der wahre Wert *für 1-seitige Hypothesen: Sig.(2-seitig) durch 2 teilen
  • 9. T-Test bei unabhängigen SP  Datensatz: Master_FP_2006.sav  Es geht um die Frage 51:
  • 10. Menü Mittelwerte…  Analysieren  Mittelwerte vergleichen  Mittelwerte  … zum Vergleich der Mittelwerte u. a. deskriptiver Statistik sowie Kontrolle der Drittvariablen Fenster:  abhängige Variablen: f51beruf  unabhängige Variablen: f65gesch  Optionen: Zellenstatistik…was gewünscht ANOVA-Tabelle… Varianzanalyse (ohne Einbeziehung der Kontrollvariablen) und Eta… zur Bestimmung des Anteils der erklärten Varianz Linearitätstest… prüft, ob Zusammenhang durch lineare Regression erfasst werden kann (metrische, klassifizierte UV nötig)  Weiter… zur Einführung von Kontrollvariablen
  • 11. Menü Mittelwerte… Verarbeitete Fälle 4022 96,3% 153 3,7% 4175 100,0% Angesehenen Beruf ausüben * Geschlecht N Prozent N Prozent N Prozent Eingeschlossen Ausgeschlossen Insgesamt Fälle Bericht Angesehenen Beruf ausüben 2,89 1294 1,156 1,335 2,68 2728 1,148 1,318 2,75 4022 1,154 1,332 Geschlecht Weiblich Männlich Insgesamt Mittelwert N Standardab weichung Varianz Forschungsinteresse: Sind die Mittelwertunterschiede signifikant oder zufällig? Prüfung mit 2-Stichproben-T-Test für unabhängige SP
  • 12. T-Test bei unabhängigen SP  AnalysierenMittelwerte vergleichenT-Test bei unabhängigen SP  Hypothesen (für zweiseitig): H0: μweibl= μmännl H1: μ weibl ≠ μmännl Fenster:  Testvariable(n) hier: f51beruf  Gruppenvariable…UV hier: f65gesch  Gruppen def.: Gruppe 1 hier: 1 Gruppe 2 hier: 2 Trennwert… Teilungspunkt für ordinale oder metrische UV Bildung v. 2 Gruppen  Optionen: Konfidenzintervall Fehlende Werte: Fallausschluss Test für Test Listenweiser Fallausschluss
  • 13. T-Test bei unabhängigen SP - Ausgaben Gruppenstatistiken 1294 2,89 1,156 ,032 2728 2,68 1,148 ,022 Geschlecht Weiblich Männlich Angesehenen Beruf ausüben N Mittelwert Standardab weichung Standardfe hler des Mittelwertes
  • 14. T-Test bei unabhängigen SP - Ausgaben Test bei unabhängigen Stichproben 3,707 ,054 5,252 4020 ,000 ,204 ,039 ,128 ,280 5,239 2524,455 ,000 ,204 ,039 ,128 ,280 Varianzen sind gleich Varianzen sind nicht gleich Angesehenen Beruf ausüben F Signifikanz Levene-Test der Varianzgleich heit T df Sig. (2-seitig) Mittlere Differenz Standardfehler der Differenz Untere Obere 95% Konfidenzint ervall der Differenz T-Test für die Mittelwertgleichheit F- Wert Standardab -weichung der Differenz
  • 15. T-Test bei unabhängigen SP - Ausgaben Levene-Test für Varianzgleichheit:  H0: Varianzen der Variablen gleich  H1: Varianzen sind nicht gleich  Ergebnis: Signifikanz > 0,05 “Varianzen sind nicht gleich” ablesen T-Test:  |t|>tkrit=1,96 UND Sig.(2-seitig) < 0,05 H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit von 5%)
  • 16. T-Test bei gepaarten SP  Datensatz: abm.sav  Einkommen von Teilnehmern einer Arbeitsbeschaffungsmaßnahme  Forschungsinteresse: Unterschiede des Einkommen der Teilnehmer vor und nach der Arbeitsbeschaffungsmaßnahme Prüfung mit 2-Stichproben-T-Test für abhängige SP  AnalysierenMittelwerte vergleichenT- Test bei gepaarten SP
  • 17. T-Test bei gepaarten SP  Hypothesen (für zweiseitig): H0: μvar225= μvar310 H1: μvar225 ≠ μvar310 Fenster:  Gepaarte Variablen… es sind mehrere Paare möglich hier: var225(Bruttoeinkommen vor ABM) Strg-Taste halten var310(erstes Bruttoeinkommen nach ABM)  Optionen: Konfidenzintervall Fehlende Werte: Fallausschluss Test für Test Listenweiser Fallausschluss
  • 18. T-Test bei gepaarten SP Statistik bei gepaarten Stichproben 2783,54 80 1284,753 143,640 2631,80 80 920,817 102,950 BRUTTOEINKOMMEN VOR ABM ERSTES BRUTTOEINK. NACH ABM Paaren 1 Mittelwert N Standardab weichung Standardfe hler des Mittelwertes Korrelationen bei gepaarten Stichproben 80 ,644 ,000 BRUTTOEINKOMMEN VOR ABM & ERSTES BRUTTOEINK.NACH ABM Paaren 1 N Korrelation Signifikanz Korrelation recht hoch
  • 19. T-Test bei gepaarten SP Test bei gepaarten Stichproben 151,738 987,719 110,430 -68,069 371,544 1,374 79 ,173 BRUTTOEINKOMMEN VOR ABM - ERSTES BRUTTOEINK.NACH ABM Paaren 1 Mittelwert Standardabweichung Standardfehler des Mittelwertes Untere Obere 95% Konfidenzintervall der Differenz Gepaarte Differenzen T df Sig. (2-seitig) |t|<tkrit=1,994 UND Sig.(2-seitig) > 0,05  H0 kann nicht abgelehnt werden kein signifikanter Unterschied im Einkommen Mittelwert der Differenzen zwischen den Zeitpunkten Standard- abweichung der Differenzen zwischen den Zeitpunkten
  • 20. Varianzanalysen  Untersucht, ob sich die Mittelwerte von mehr als 2 SP signifikant unterscheiden  Prüft nur, ob Unterschied zwischen min. einem der verglichenen Paare signifikant ist  zur Prüfung zwischen welchen Vergleichspaaren signifikante Differenzen: Post-Hoc-Tests Voraussetzungen:  UV: alle Skalenniveaus möglich, kategorisiert  AV: min. Intervallskalierung  Varianzhomogenität geprüft mit Levene-Test  Normalverteilung  Zufallsstichproben  Für ANOVA: unabhängige SP  Für Varianzanalyse mit Meßwiederholung: abhängige SP
  • 22. Einfaktorielle ANOVA  Datensatz: Master_2006_FP  Forschungsinteresse: Frage 51Gibt es Unterschiede zwischen den Geburtskohorten? Prüfung mit Einfaktorieller ANOVA  AnalysierenMittelwerte vergleichenEinfaktorielle ANOVA  Hypothesen (für zweiseitig): H0: μ1=μ2=…=μi H1: μ1≠μ2≠…≠μi
  • 23. Einfaktorielle ANOVA Fenster:  Abhängige Variablen hier: f51beruf  Faktor… UV hier: f66gebja_koh  Kontraste: Polynomial UND Grad … Erklärung der Summe der Abweichungsquadrate zwischen den Gruppen durch Polynomterme bis zur 5.Ordnung Kontrast 1 von 1 : Koeffizienten… t-Test für a priori festgelegte Kontrastgruppen Kodierung mit -1 und +1 für zu vergleichende Gruppen und 0 für ausgeschlossene Gruppen (Koeffizientensumme… Koeffizienten müssen 0 ergeben)
  • 24. Einfaktorielle ANOVA - Post-Hoc Post-Hoc:  Varianz-Gleichheit angenommen: LSD Bonferroni Sidak Scheffé… Vergleich der Mittelwerte und Berechnung der kritischen Differenz hier: Scheffe-Test etc.  Keine Varianzgleichheit angenommen: Tamhane-T2 etc.  Signifikanzniveau …angeben als ,05 etc.
  • 25. Einfaktorielle ANOVA - Optionen Optionen:  Statistik: Deskriptive Statistik Feste und zufällige Effekte: Statistiken für Modell mit festen Effekten(Standardabweichung, Standardfehler, Konfidenzintervall) und zufälligen Effekten(Standardfehler, Konfidenzintervall, Varianz zwischen Komonenten) Test auf Homogenität der Varianzen… Levene-test Brown-Forsythe… Test auf Gleichheit der Mittelwerte der Gruppen für ungleiche Varianzen Welch… siehe Brown-Forsythe-Test  Diagramm der Mittelwerte: Liniendiagramm aus Punkten der Mittelwerte der Gruppen  Fehlende Werte: Fallauschluss Test für Test Listenweiser Testausschluss
  • 26. Einfaktorielle ANOVA ONEWAY deskriptive Statistiken Angesehenen Beruf ausüben 27 2,15 1,262 ,243 1,65 2,65 1 5 342 2,19 1,066 ,058 2,08 2,31 1 5 974 2,50 1,115 ,036 2,43 2,57 1 5 1378 2,89 1,151 ,031 2,83 2,95 1 5 1134 2,93 1,125 ,033 2,87 3,00 1 5 168 2,98 1,113 ,086 2,81 3,15 1 5 4023 2,75 1,154 ,018 2,71 2,78 1 5 1,00 2,00 3,00 4,00 5,00 6,00 Gesamt N Mittelwert Standardab weichung Standardf ehler Untergrenze Obergrenze 95%-Konfidenzintervall für den Mittelwert Minimum Maximum Test der Homogenität der Varianzen Angesehenen Beruf ausüben 1,700 5 4017 ,131 Levene- Statistik df1 df2 Signifikanz │F│< Fkrit=2,21 UND Signifikanz >0,05 Varianzhomogenität falls nicht: kann Varianzanalyse nicht durchgeführt werden F-Wert
  • 27. Einfaktorielle ANOVA ONEWAY ANOVA Angesehenen Beruf ausüben 250,027 5 50,005 39,364 ,000 5102,903 4017 1,270 5352,931 4022 Zwischen den Gruppen Innerhalb der Gruppen Gesamt Quadrats umme df Mittel der Quadrate F Signifikanz Varianzen Zerlegung der sum- mierten Ab- weichungsquadrate in SAQzw , SAQin und SAQge │F│> Fkrit=2,21 UND Signifikanz <0,05 signifikante Unterschiede zwischen Geburtskohorten
  • 28. Mehrfachvergleiche Abhängige Variable: Angesehenen Beruf ausüben Scheffé-Prozedur -,045 ,225 1,000 -,79 ,71 -,355 ,220 ,761 -1,09 ,38 -,744* ,219 ,042 -1,47 -,01 -,785* ,219 ,026 -1,52 -,05 -,834* ,234 ,026 -1,61 -,06 ,045 ,225 1,000 -,71 ,79 -,310* ,071 ,002 -,55 -,07 -,699* ,068 ,000 -,93 -,47 -,740* ,070 ,000 -,97 -,51 -,789* ,106 ,000 -1,14 -,44 ,355 ,220 ,761 -,38 1,09 ,310* ,071 ,002 ,07 ,55 -,389* ,047 ,000 -,55 -,23 -,430* ,049 ,000 -,59 -,27 -,479* ,094 ,000 -,79 -,17 ,744* ,219 ,042 ,01 1,47 ,699* ,068 ,000 ,47 ,93 ,389* ,047 ,000 ,23 ,55 -,041 ,045 ,975 -,19 ,11 -,090 ,092 ,966 -,40 ,22 ,785* ,219 ,026 ,05 1,52 ,740* ,070 ,000 ,51 ,97 ,430* ,049 ,000 ,27 ,59 ,041 ,045 ,975 -,11 ,19 -,049 ,093 ,998 -,36 ,26 ,834* ,234 ,026 ,06 1,61 ,789* ,106 ,000 ,44 1,14 ,479* ,094 ,000 ,17 ,79 ,090 ,092 ,966 -,22 ,40 ,049 ,093 ,998 -,26 ,36 (J) geburtskohorten in Jahrzehnte 1930-1939 1940-1949 1950-1959 1960-1969 ab 1970 bis 1929 1940-1949 1950-1959 1960-1969 ab 1970 bis 1929 1930-1939 1950-1959 1960-1969 ab 1970 bis 1929 1930-1939 1940-1949 1960-1969 ab 1970 bis 1929 1930-1939 1940-1949 1950-1959 ab 1970 bis 1929 1930-1939 1940-1949 1950-1959 1960-1969 (I) geburtskohorten in Jahrzehnte bis 1929 1930-1939 1940-1949 1950-1959 1960-1969 ab 1970 Mittlere Differenz(I-J) Standar dfehler Signifikanz Untergrenze Obergrenze 95%-Konfidenzintervall Die Differenz der Mittelwerte ist auf dem Niveau .05 signifikant. *.
  • 29. Einfaktorielle ANOVA 3 homogene Gruppen, deren Mittelwerte sich nicht signifikant unterscheiden: Gruppe 1: 1-3 und Gruppe 2: 3-5 und Gruppe 3: 4-6 Angesehenen Beruf ausüben Scheffé-Prozedur a,b 27 2,15 342 2,19 974 2,50 2,50 1378 2,89 2,89 1134 2,93 2,93 168 2,98 ,294 ,110 ,995 geburtskohorten in Jahrzehnte bis 1929 1930-1939 1940-1949 1950-1959 1960-1969 ab 1970 Signifikanz N 1 2 3 Untergruppe für Alpha = .05. Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. Verwendet ein harmonisches Mittel für Stichprobengröße = 123,590. a. Die Gruppengrößen sind nicht identisch. Es wird das harmonische Mittel der Gruppengrößen verwendet. Fehlerniveaus des Typs I sind nicht garantiert. b. Signifikanz innerhalb den Gruppen
  • 30. Weitere Varianzanalysen  AnalysierenAllgemeines lineares ModellUnivariat… für eine AV  AnalysierenAllgemeines lineares ModellMultivariat… für mehrere AV  AnalysierenAllgemeines lineares ModellMeßwiederholung… Varianzanalyse für abhängige SP  AnalysierenAllgemeines lineares ModellVarianzkomponenten… schätzt bei Modellen mit gemischten Effekten den Beitrag jedes Zufallseffekts zur Varianz der abhängigen Variablen.
  • 31. 2-faktorielle Varianzanalyse  Kann auch Wirkung ihrer Kombination(Interaktion) untersuchen  gleiche Zellhäufigkeiten… alle Zellen mit gleicher Anzahl der Fälle besetzt wechselseitig voneinander unabhängig  Gegenteil: ungleiche Zellhäufigkeiten: Effekte korrelieren miteinander  Datensatz: allbus90.sav  Forschungsinteresse: Welchen Einfluss hat der Schulbildung und das Geschlecht auf das Einkommen unter Kontrolle der Variablen Alter? Prüfung mit 2-faktorieller Varianzanalyse  AnalysierenAllgemeines lineares ModellUnivariat
  • 32. AnalysierenAllgemeines lineares ModellUnivariat Univariat:  Abhängige Variable hier: eink  Feste Faktoren… alle relevanten Merkmale des Faktors sind durch Untersuchungsanordnung vorgegeben hier: geschl, schul2  Zufallsfaktoren… kommen durch bzgl. dieses Merkmals zufällige Zuweisung von Fällen zu Untersuchungsgruppen zustande  Kovariaten… zusätzliche Einführung einer mit metrischen Variable (wichtig: keine Korrelation zu Faktoren) Kontrollvariable hier: alt  WLS-Gewichtung… für Gewichtung der Fälle (vorher Gewichtungsvariable bilden)
  • 33. AnalysierenAllgemeines lineares ModellUnivariat  Modell: Gesättigtes Modell… alle Faktoren und Kovariate sowie Wechselwirkungen zwischen Faktoren gehen ins Modell ein hier: gesättigtes Modell Anpassen… Auswahl der Haupteffekte (Faktoren und Kovariate) und Wechselwirkungen (auch mit Kovariaten), die in Modell eingehen sollen Term(e) konstruieren: u.a. Alle ?-Weg… Wechselwirkungen der ?.Ordnung Quadratsumme… zur Berechnung der Summe der Abweichungen  Typ I… Hierarchisch: Jeder Term wird nur für die in der Liste vor ihm stehenden korrigiertReihenfolge hat Einfluss auf Ergebnis Typ II: Regressionsmodell: Berechnung der Haupteffekte um alle anderen Terme (außer Interaktionen) korrigiert Typ III: Berechnung der Quadratsumme eines Effekts um alle anderen Effekte bereinigt, die nicht im Effekt enthalten sind robust gegenüber ungleichen Zellhäufigkeiten ungeeignet für leere Zellen Typ IV: für leere Zellen
  • 34. AnalysierenAllgemeines lineares ModellUnivariat  Kontraste… Vergleich von Gruppen (nur 1 Faktor) über a priori definierte Kontraste (ähnlich wie bei ANOVA): Einfach… Vergleich der Mittelwerte aller Faktorstufen (außer Referenzkategorie) mit Mittelwert der Referenzkategorie Wiederholt… Vergleich des Mittelwerts jeder Faktorstufe (außer der letzten) mit dem Mittelwert der folgenden Faktorstufe Polynomial… Vergleich des linearen etc. Effekts  für Schätzung von polynomialen Trends etc. Referenzkategorie… erste oder letzte Faktorstufe
  • 35. AnalysierenAllgemeines lineares ModellUnivariat  Diagramme: Profilplots… stellen den Zusammenhang zwischen max. 2 Faktoren und der AV dar: Horizontale Achse… 1.Faktor hier: schul Separate Linien… 2.Faktor hier: geschl Separate Diagramme… 3.Faktor  Post-Hoc… wie bei ANOVA  (Speichern… Hier kann man festlegen, dass bestimmte Werte als neue Variablen gespeichert werden können)
  • 36. AnalysierenAllgemeines lineares ModellUnivariat Optionen:  Geschätzte Randmittel: Mittelwerte anzeigen für… Auswahl der Faktoren und – kombinationen für Ausgabe der Mittelwerte hier: (Insgesamt) Haupteffekte vergleichen UND Anpassung des Konfidenzintervalls… Auswahl von Post-Hoc-Tests  Anzeigen: Deskriptive Statistik… für jede Faktorstufenkomination Schätzer der Effektgröße… partielle Eta-Werte für erklärte Varianz für jeden Faktor, Interaktion und Kovariate hier: beide ankreuzen Beobachtete Schärfe… Wahrscheinlichkeit einen tatsächlich vorhandenen Effekt auch zu entdecken etc.  Signifikanzniveau
  • 37. 2-faktorielle Varianzanalyse Zwischensubjektfaktoren Hauptsch ule 74 Mittelschul e 33 Fachh/Abi 35 MAENNLI CH 80 WEIBLICH 62 2 3 4 Schulbildung umkodiert 1 2 GESCHLECHT, BEFRAGTE<R> Wertelabel N Gesamtmittelwert Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN 2142,756a 94,009 1956,836 2328,676 Mittelwert Standardf ehler Untergrenze Obergrenze 95% Konfidenzintervall Die Kovariaten im Modell werden anhand der folgenden Werte berechnet: ALTER, BEFRAGTE<R> = 49,63. a.
  • 38. 2-faktorielle Varianzanalyse Deskriptive Statistiken Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN 2214,63 1130,896 40 1328,15 710,437 34 1807,32 1053,217 74 2895,24 1142,137 21 1897,92 633,394 12 2532,58 1091,131 33 2675,00 1321,606 19 1806,13 870,318 16 2277,80 1204,875 35 2502,63 1204,036 80 1561,77 774,572 62 2091,83 1136,262 142 GESCHLECHT, BEFRAGTE<R> MAENNLICH WEIBLICH Gesamt MAENNLICH WEIBLICH Gesamt MAENNLICH WEIBLICH Gesamt MAENNLICH WEIBLICH Gesamt Schulbildung umkodiert Hauptschule Mittelschule Fachh/Abi Gesamt Mittelwert Standardab weichung N
  • 39. 2-faktorielle Varianzanalyse Tests der Zwischensubjekteffekte Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN 42424611,068a 6 7070768,5 6,837 ,000 ,233 63559012,059 1 63559012 61,456 ,000 ,313 218591,240 1 218591,24 ,211 ,646 ,002 9909843,044 2 4954921,5 4,791 ,010 ,066 25432596,662 1 25432597 24,591 ,000 ,154 91478,764 2 45739,382 ,044 ,957 ,001 139619196,9 135 1034216,3 803401284,0 142 182043807,9 141 Quelle Korrigiertes Modell Konstanter Term alt schul2 geschl schul2 * geschl Fehler Gesamt Korrigierte Gesamtvariation Quadratsum me vom Typ III df Mittel der Quadrate F Signifikanz Partielles Eta-Quadrat R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199) a. Signifikanz>0,05Keine signifikante Interaktion Prüfung der Signifikanz der Haupteffekte: Geschlecht und Schulbildung haben signifikante Wirkung, weil Signifikanz<0,05; Kovariate Alter hat keine signifikante Wirkung, weil Sig. >0,05 (korrigiertes) R2=0,199 Modell erklärt ca. 20% der Gesamtvarianz: davon erklärt die Schulbildung ca. 7% und das Geschlecht ca. 15% der VarianzGeschlecht hat stärkere Wirkung als Schulbildung
  • 40. 2-faktorielle Varianzanalyse Tests der Zwischensubjekteffekte Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN 42424611,068a 6 7070768,5 6,837 ,000 ,233 63559012,059 1 63559012 61,456 ,000 ,313 218591,240 1 218591,24 ,211 ,646 ,002 9909843,044 2 4954921,5 4,791 ,010 ,066 25432596,662 1 25432597 24,591 ,000 ,154 91478,764 2 45739,382 ,044 ,957 ,001 139619196,9 135 1034216,3 803401284,0 142 182043807,9 141 Quelle Korrigiertes Modell Konstanter Term alt schul2 geschl schul2 * geschl Fehler Gesamt Korrigierte Gesamtvariation Quadratsum me vom Typ III df Mittel der Quadrate F Signifikanz Partielles Eta-Quadrat R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199) a.
  • 41.
  • 42. 2-faktorielle Varianzanalyse- Diagrammauswertung Separate Linien:  Wenn Zeilenvariable keinen Einfluss besitzt, verläuft sie parallel zur x-Achse  Besitzt sie Einfluss, steigt oder fällt sie hier: Einfluss des Geschlechts auf Einkommen  Wenn sie Einfluss hat, kann sie in verschiedenen Abschnitten unterschiedlich verlaufen, aber nicht parallel Horizontale Achse:  Wenn Spaltenvariable keinen Einfluss besitzt, fallen die einzelnen Linien zusammen  Wenn sie Einfluss hat: Abstand zwischen den Linien hier: Einfluss des Geschlechts auf Einkommen vorhanden  Wenn Interaktion vorliegt, verlaufen Linien zumindest in Bereichen nicht parallel hier: Linien verlaufen im Bereich Fachhochschule/Abi nicht mehr parallelleichte Interaktion  Wenn keine Interaktion vorliegt, verlaufen die Linien parallel Konstanz des Abstands
  • 43. Aufgaben Für diese Aufgaben wird der Datensatz Master_FP_2006 benötigt. Es geht um die Variablen studfach(1.abgeschlossenes Studienfach) und f51aufst(Berufserfolg bedeutet gute Aufstiegschancen zu haben). Es interessiert hier, ob das Studienfach beeinflusst, wie sehr der Aussage (nicht) zugestimmt wird, dass „Beruflicher Erfolg ist … gute Aufstiegschancen zu haben.“ a) Vergleicht zuerst die Mittelwerte der Gruppen der Variable studfach untereinander und mit dem Gesamtmittelwert der Variable studfach! b) Nun soll herausgefunden werden, ob sich die Mittelwerte von f51einko signifikant unterscheiden, je nachdem welches Studienfach studiert wurde. Welchen Test könnt ihr dazu verwenden? c) Führt den Test durch! Was ist das Ergebnis? d) Welchen Test müsste man verwenden, wenn man herausfinden will, ob es signifikante Mittelwertsdifferenzen bezüglich f70gesch(Haben Sie Geschwister?) bzgl. f51aufst gibt? e) Führt den Test durch! Was ist das Ergebnis?
  • 44. Literaturempfehlungen CD-Rom:  Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005): Einführung in die sozialwissenschaftliche Datenanalyse, Ein multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH. Lehrbuch:  Janssen, Jürgen/Laatz, Wilfried(2005): Statistische Datenanalyse mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag. SPSS:  Ergebnis-Assistent bei Tabellen (in Englisch)  Hilfe-Taste auf den Fenstern (erklärt Vorgang und seine Bedeutung)
  • 45. Quellen  Backhaus, Klaus/Erichson, Bernd/Plinke, Wulff/Weiber, Rolf(2006): Multivariate Analysemethoden. Berlin/Heidelberg: Springer-Verlag.  Bellgardt, Egon(2004): Statistik mit SPSS. München: Verlag Franz Vahlen GmbH.  Fahrmeir, Ludwig ed.al.(2005): Arbeitsbuch Statistik. Berlin/Heidelberg: Springer-Verlag.  Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005): Einführung in die sozialwissenschaftliche Datenanalyse, Ein multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH.  Kähler, Wolf-Michael(2006): Statistische Datenanalyse. Wiesbaden: Friedr. Vieweg & Sohn Verlag/GWV Fachverlage GmbH.  Janssen, Jürgen/Laatz, Wilfried(2003): Statistische Datenanalyse mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag.