SlideShare una empresa de Scribd logo
1 de 160
Descargar para leer sin conexión
Índice de la asignatura
• T1. Introducción a la investigación científica
• ¿Qué es investigar?
• Investigación educativa
• El proceso de la Investigación Científica
• T2. El proceso en investigaciones educativas
• Objetivos e hipótesis
• Diseños de investigación
• Tipos de variables
• Población y muestra: Técnicas de muestreo
• T3. Instrumentos de recogida de información
• Observación
• Técnicas de encuesta: entrevista y cuestionario (escalas de actitud y pruebas objetivas)
• Técnicas grupales
• T4. Análisis de datos en Ciencias Sociales (cuantitativo)
• Análisis descriptivo de datos
• Análisis inferencial de datos
Procesogeneraldeinvestigación
2º REVISIÓN BIBLIOGRÁFICA. FUENTES DOCUMENTALES
3º SELECCIÓN DEL MÉTODO Y DISEÑO DE INVESTIGACIÓN
FORMULACIÓN DE HIPÓTESIS
VARIABLES
1º PLANTEAMIENTO DEL PROBLEMA. SELECCIÓN DE UN TEMA A INVESTIGAR
SELECCIÓN DE LA MUESTRA
PLANIFICACIÓN DE LA OBTENCIÓN DE INFORMACIÓN Y ANÁLISIS DE DATOS
4º TÉCNICA DE RECOGIDA DE DATOS
5º TÉCNICA DE ANÁLISIS DE DATOS
6º CONCLUSIONES-REDACCIÓN DE INFORME
INSTRUMENTOS
VARIABLES
FIABILIDAD
Consistencia: La medida repetida en
las mismas condiciones devuelve
resultados iguales
VALIDEZ
medir realmente
aquello que se
pretende medir
Recogida de información
Tipos de Variables
DICOTÓMICAS
POLITÓMICAS
Sexo
Sí/no
Acierto/error
Comunidad autónoma
Estado civil
Color de ojos
Establecen orden o nivel
ORDINALES
Orden de llegada/alfabético/puntuaciones
Curso en la titulación
Bajo/medio/alto
DISCRETAS
CONTINUAS
Año de nacimiento
Número de objetos (libros, ordenadores,
…) o elementos (hermanos, …)
Peso
Estatura
Nº indivisibles (enteros)
Nº en una escala continua (decimales)
Establecen categorías
CUALITATIVAS
o
NOMINALES
Forman una escala
CUANTITATIVAS
Tipos de Variables
Número de créditos matriculados
¿Tienes carné de conducir?
Nota media en selectividad
Posición que ocupas entre tus hermanos
¿Sabes resolver una ecuación de primer grado?
Especialidad en el bachillerato
Tiempo de llegada a meta
Posición de llegada a meta
Motivación hacia el aprendizaje
Coeficiente intelectual
NOMINAL
DICOTÓMICA
NOMINAL POLITÓMICA
CUANTITATIVA
DISCRETA
CUANTITATIVA
CONTINUA
ORDINAL
Tipos de Variables
Estadística
Descriptiva
Inferencial
ESTADÍSTICA
Variables
“Ciencia que nos ayuda a conocer la
realidad. Cómo es, cómo ha sido y
cómo será. Nos ayuda a recoger
datos, organizarlos y visualizar la
información que los mismos
aportan”(Etxeberria y Tejedor,
2005: 16)
Recoge, organiza, resume, describe y
presenta los datos correspondientes
a un conjunto de variables de una
muestra.
Generaliza los resultados
obtenidos en una muestra a la
población objeto de estudio.
Estadística
POBLACIÓN
N = 150 000
n = 150
MUESTRA
ESTADÍSTICA
DESCRIPTIVA
ESTADÍSTICA
INFERENCIAL
Estadística
Estimación, a partir de los estadísticos
obtenidos para la muestra, de los
parámetros de la población.
Cálculo de los estadísticos de
una variable, o un grupo de
variables, en una muestra.
DESCRIPTIVA INFERENCIAL
Una variable CUALITATIVA
De los 66000 jubilados existentes en la provincia de Salamanca
(N=66000), se obtiene una muestra de 1000 personas
(n=1000). De esta muestra, 450 son hombres y 550 mujeres.
TABLA DE FRECUENCIAS
Sexo Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Hombre 450
Mujer 550
Total 1000
p1= 0.45f2= 550
Una variable CUALITATIVA
MODA
Sexo Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Hombre 450 0.45 45%
Mujer 550 0.55 55%
Total 1000 1 100%
Categoría o categorías que tienen una mayor
frecuencia absoluta (fi) en una variable
La moda en la variable sexo es ser mujer
Es el valor o valores que más se repite en la variable
En una variable pueden existir 2 o más modas (tantas como
puntuaciones)
Una variable CUALITATIVA
Se ha obtenido una muestra de 200 jóvenes extremeños, de
los que 55 son de la provincia de Badajoz…completar tabla!
TABLA DE FRECUENCIAS
Provincia Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Total 1 100%
MODA??
Una variable ORDINAL
Se obtiene una muestra de 500 estudiantes universitarios (n=500),
de los cuales 80 están cursando primero, 200 segundo, 130 tercero
y 90 cuarto.
TABLA DE FRECUENCIAS
Curso Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Primero 80
Segundo 200
Tercero 130
Cuarto 90
Total
P3= 26%
Una variable ORDINAL
Curso Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Primero 80
Segundo 200
Tercero 130
Cuarto 90
Total 500
La moda en la variable ‘curso’ es cursar segundo
MODA
Percentil: Un percentil (Pk) es una puntuación de la variable
xi, que deja por debajo de sí al k% de la muestra o
población.
Decil (D):
P10=D1
P40=D4
Cuartil (Q):
P25=Q1
P50=Q2=Mdn
P75=Q3
Una variable ORDINAL
PERCENTIL
Una variable ORDINAL
Curso Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Primero 80
Segundo 200
Tercero 130
Cuarto 90
Total 500
PERCENTIL
Fr. acumul. (fa) Pr. acumul. (pa)
Una variable ORDINAL
Curso fi pi Pi
Primero 80 0.16 16%
Segundo 200 0.40 40%
Tercero 130 0.26 26%
Cuarto 90 0.18 18%
Total 500 1 100%
La mediana en la variable ‘curso’ es cursar segundo.
Los estudiantes de segundo dejan por debajo de sí al 50% de la muestra.
MEDIANA
Valor (xi) que ocupa la posición central en una
distribución (variable), esto es, el Percentil 50.
fa
80
280
410
500
Pa
16%
56%
82%
100%
Mdn=
Segundo
Q2=D5=P50=
MEDIANA
Medidas de tendencia central
Puntuación (xi) que ocupa la posición central
en una distribución (variable)
Valor central, que deja por debajo de sí al 50% de los sujetos
No tiene sentido calcular la mediana en variables cualitativas.
Equivale al percentil 50 (P50), decil 5 (D5) ó cuartil 2 (Q2)
La mediana es única, sólo puede existir una mediana.
Tendencia central
Dispersión
ESTADÍSTICA
DESCRIPTIVA
Cálculo de los estadísticos de
una variable, o un grupo de
variables, en una muestra.
Posición
Forma
- Media
- Mediana
- Moda
- Varianza
- Desviación típica
- Coeficiente de variación
- Percentiles
 Deciles
Cuartiles
- Asimetría
- Curtosis
Una variable CUANTITATIVA
7.3. Medidas de Posición
7.1. Medidas de Tendencia Central
7.4. Medidas de Forma
7.2. Medidas de Dispersión
Una variable CUANTITATIVA
Una variable CUANTITATIVA
Se mide el Cociente Intelectual (CI) de un grupo de 14 jóvenes en
riesgo de exclusión, obteniendo las siguientes puntuaciones.
110, 105, 86, 93, 123, 108, 112, 99, 100, 105, 99, 90, 117, 102
SIEMPRE
ordenar de menor a mayor
86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123
Una variable CUANTITATIVA
Se mide el Cociente Intelectual (CI) de un grupo de 14 jóvenes en
riesgo de exclusión, obteniendo las siguientes puntuaciones.
86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123
Tendencia central: MODA
La moda en la variable CI para esta muestra es de 99 y 105
En este caso tenemos una distribución bimodal.
Una variable CUANTITATIVA
Tendencia central: MODA
Si las puntuaciones son discretas, pueden estar resumidas en
una tabla. En este caso debo tener en cuenta el ni de cada celda.
Puntuación ni pi
1 6 0,02
2 15 0,05
3 13 0,04
4 23 0,08
5 56 0,19
6 75 0,25
7 60 0,20
8 42 0,14
9 8 0,03
10 2 0,01
TOTAL 300 1
La moda de la puntuación en la prueba
es 6 puntos.
Una variable CUANTITATIVA
Se mide el Cociente Intelectual (CI) de un grupo de 14 jóvenes en
riesgo de exclusión, obteniendo las siguientes puntuaciones.
86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123
Tendencia central: MEDIANA
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Si n es impar, el valor de la mediana coincidirá con la puntuación en
la variable del sujeto (n+1)/2
Si n es par, el valor de la mediana será el promedio entre las dos
puntuaciones intermedias.
La puntuación 103.5 es la que deja al 50% de los sujetos por debajo
en esta muestra.
???
Una variable CUANTITATIVA
Tendencia central: MEDIANA
Si las puntuaciones son discretas, pueden estar resumidas en una
tabla. En este caso debo calcular el na y el pa.
Puntuación ni
1 6
2 15
3 13
4 23
5 56
6 75
7 60
8 42
9 8
10 2
TOTAL 300
na pa
La mediana se encuentra en la
puntuación….
Una variable CUANTITATIVA
86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123
Tendencia central: MEDIA
Indica el valor promedio de todas las
puntuaciones (xi)
La media del CI de la muestra de 103.5 puntos
Una variable CUANTITATIVA
Tendencia central: MEDIA
Si las puntuaciones son discretas, pueden estar resumidas en
una tabla. En este caso debo tener en cuenta el ni de cada celda.
Puntuación ni pi
1 6 0,02
2 15 0,05
3 13 0,04
4 23 0,08
5 56 0,19
6 75 0,25
7 60 0,20
8 42 0,14
9 8 0,03
10 2 0,01
TOTAL 300 1
La media de la puntuación en la prueba es
de 5.82
Fernando Martínez Abad
Susana Olmos Migueláñez
Indica el valor promedio de todas las
puntuaciones (xi)
Se calcula en variables cuantitativas (en las cualitativas no tiene
sentido)
La media es única, sólo puede existir una media.
MEDIA
Propiedades
1. Si se suma una constante (k) a todas las xi, la media se
incrementa lo que vale k
2. Si se multiplica una constante (k) a todas las xi, la media se
multiplica por k
3. El sumatorio de las puntuaciones diferenciales es 0
4. Cálculo de la media ponderada
Una variable CUANTITATIVA
Fernando Martínez Abad
Susana Olmos Migueláñez
7.3. Medidas de Posición
7.1. Medidas de Tendencia Central
7.4. Medidas de Forma
7.2. Medidas de Dispersión
Una variable CUANTITATIVA
210
200
190
180
170
160
150
140
130
120
110
100
90
80
70
60
50
40
30
20
10
0
Una variable CUANTITATIVA: dispersión
Indica la media de las diferencias entre
las puntuaciones observadas (xi) y su
media al cuadrado
VARIANZA
Es la raíz cuadrada de la varianza
DESVIACIÓN TÍPICA
Son las medidas más importantes de dispersión
Una variable CUANTITATIVA: dispersión
datos tablas
A mayor varianza o desv. típica, mayor dispersión en la variable
VARIANZA y DESVIACIÓN TÍPICA
Una variable CUANTITATIVA: dispersión
CI= {86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123}
La varianza de la variable CI es de 96.82, y la desviación
típica de 9.84
VARIANZA y DESVIACIÓN TÍPICA
Una variable CUANTITATIVA: dispersión
La varianza de las puntuaciones es de 3.26, y la
desviación típica de 1.81
Para puntuaciones son discretas, tener en cuenta el ni de cada celda.
Puntuación ni
1 6
2 15
3 13
4 23
5 56
6 75
7 60
8 42
9 8
10 2
TOTAL 300
Fernando Martínez Abad
Susana Olmos Migueláñez
Propiedades de la varianza y la desviación típica
1. Dado que es un número elevado al cuadrado, la varianza y la desviación típica siempre son
positivas
2. Si se suma una constante (k) a todas las xi, la varianza y la desviación típica no se alteran.
3. Si se multiplica una constante (k) a todas las xi, la desviación típica se ve multiplicada por k y la
varianza por k2
Una variable CUANTITATIVA: dispersión
Fernando Martínez Abad
Susana Olmos Migueláñez
Medida para comparar la dispersión de
diferentes variables, que estén medidas con
escalas diferentes y/o con muestras distintas
La varianza y la desviación típica son medidas absolutas. Así, no se pueden
comparar distintas varianzas o desviaciones típicas
El coeficiente de variación es una medida relativa, por lo que es un estadístico
que sirve para comparar dispersión entre variables medidas con diferentes
escalas y/o con muestras distintas
COEFICIENTE DE VARIACIÓN (CV)
Una variable CUANTITATIVA: dispersión
Fernando Martínez Abad
Susana Olmos Migueláñez
COEFICIENTE DE VARIACIÓN
Altura
175 cm
25 cm
60 cm
205 cm
Una variable CUANTITATIVA: dispersión
Fernando Martínez Abad
Susana Olmos Migueláñez
COEFICIENTE DE VARIACIÓN
Altura
132 cm
125 cm
91.75 cm
Una variable CUANTITATIVA: dispersión
Fernando Martínez Abad
Susana Olmos Migueláñez
COEFICIENTE DE VARIACIÓN
Ambas variables poseen la misma media en la variable altura, sin
embargo, la primera muestra es más dispersa, en concreto 4.17
veces más (75/18)
Una variable CUANTITATIVA: dispersión
Fernando Martínez Abad
Susana Olmos Migueláñez
7.1. Medidas de Tendencia Central
7.4. Medidas de Forma
7.2. Medidas de Dispersión
7.3. Medidas de Posición
Una variable CUANTITATIVA
PERCENTILES (deciles y cuartiles)
Una variable CUANTITATIVA: posición
CI= {86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123}
Calcular el Q1
P25
1 2 3 4 5 6 7 8 9 10 11 12 13 14
100 25
n=14 X X= 25*14/100= 3,5
La Q1 =99, es decir, hay al menos un 25% de sujetos
en la muestra que obtienen menos de 99 puntos.
PERCENTILES (deciles y cuartiles)
Una variable CUANTITATIVA: posición
Para puntuaciones son discretas, calcular pa.
Puntuación ni na
1 6
2 15
3 13
4 23
5 56
6 75
7 60
8 42
9 8
10 2
TOTAL 300
D8=…
pa
Fernando Martínez Abad
Susana Olmos Migueláñez
7.1. Medidas de Tendencia Central
7.4. Medidas de Forma
Estadística descriptiva
7.2. Medidas de Dispersión
7.3. Medidas de Posición
Fernando Martínez Abad
Susana Olmos Migueláñez
Una variable CUANTITATIVA: forma
Valor que indica el grado de simetría que tiene la
distribución de la variable X
Fernando Martínez Abad
Susana Olmos Migueláñez
ASIMETRÍA
Los valores del coeficiente de asimetría están entre -1 y 1
Si As<0, la distribución es asimétrica negativa
Si As>0, la distribución es asimétrica positiva
Si As=0, la distribución es simétrica
Una variable CUANTITATIVA: forma
Fernando Martínez Abad
Susana Olmos Migueláñez
ASIMETRÍA
Asimétrica negativa Simétrica Asimétrica positiva
Una variable CUANTITATIVA: forma
Valor que indica el grado de elevación que tiene la
distribución de la variable X
Fernando Martínez Abad
Susana Olmos Migueláñez
CURTOSIS
Si Curt<0, la distribución es platicúrtica
Si Curt>0, la distribución es leptocúrtica
Si Curt=0, la distribución es mesocúrtica
Una variable CUANTITATIVA: forma
Fernando Martínez Abad
Susana Olmos Migueláñez
Medidas de forma
CURTOSIS
Leptocúrtica Mesocúrtica Platicúrtica
Una variable
Diagrama de barras (v. cualitativa/ordinal)
Diagrama de sectores (v. cualitativa)
Histograma y curva de densidad (v. cuantitativa)
Diagrama de cajas (v. ordinal/cuantitativa)
REPRESENTACIÓN GRÁFICA DE VARIABLES
Dos variables
Diagr. de barras conjuntas (v. cualitativas/ordinales)
Diagrama de dispersión (v. cuantitativas)
Diagrama de sectores (v. cualitativas)
 El diagrama de sectores se emplea principalmente en la
representación de variables cualitativas, aunque también es posible
representar variables ordinales y cuantitativas discretas.
 El tamaño de los sectores puede representar frecuencias absolutas
(ni) o porcentajes (Pi).
525
705
Sexo Hombre
Mujer
n=1230
42,7%
57,3%
Sexo Mujer
Hombre
Diagrama de barras (v. cualitat./ordinales)
 El diagrama de barras se emplea en la representación de variables
cualitativas, ordinales y cuantitativas discretas.
 La altura de las barras puede representar frecuencias absolutas (ni)
o porcentajes (Pi), y cada barra representa una de las categorías o
puntuaciones de la variable.
86
327
175
595
47
0
100
200
300
400
500
600
700
Profesores Familia Amigos Solo Otros
Fuente de información
n=1230
7%
27%
14%
48%
4%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Profesores Familia Amigos Solo Otros
Fuente de información
Diagrama de cajas (v. ordinales/cuantitativas)
 El diagrama de cajas se emplea en la representación de variables
continuas.
 Muestra la distribución de la variable en función del Q1, Q2 y Q3
P75=Q3
P25=Q1
P50=Q2=D5
Valor máximo
Valor mínimo
Valor atípico
Histograma y curva de densidad
 El histograma se emplea en la representación de variables
cuantitativas continuas. A diferencia del diagrama de barras, el
histograma presenta las barras unidas.
 La Curva de densidad puede formar un gráfico por separado o
acompañar al histograma en un gráfico conjunto.
 La altura de la curva representa la frecuencia de observaciones para
una puntuación xi determinada.
 El eje vertical (y) representa frecuencias absolutas (ni) o porcentajes
(Pi), y el eje horizontal la escala de la variable.
Histograma y curva de densidad
Diagrama de barras conjuntas (v. cualitat./ord.)
 El diagrama de dispersión se emplea en la representación de dos o
más variables cuantitativas continuas. Permite comparar la
distribución de dos variables, observando su relación.
 Se trata de la representación gráfica de una tabla de contingencia.
Bajo Medio Alto
España 60 35 5
Alemania 40 85 25
60
35
5
40
85
25
0
20
40
60
80
100
Bajo Medio Alto
España
Alemania
Diagrama de dispersión (v. cuantitativas)
 El diagrama de dispersión se emplea en la representación de dos o
más variables cuantitativas continuas. Permite comparar la
distribución de dos variables, observando su relación.
 El eje vertical representa las puntuaciones de la variable ‘y’ y el
vertical las de la variable ‘x’.
0
2
4
6
8
10
12
14
16
18
20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
(4, 9)
(9, 12)
X Y
9 12
10 12
5 7
13 18
8 7
2 5
4 9
3 5
9 15
Gráficos o diagramas engañosos
 El gráfico, en función de cómo se represente, puede estar
presentado de tal manera que dé lugar a interpretaciones erróneas.
 La escala en la que se presenta la información es clave.
GC GE
Pretest 6,43 6,25
Postest 6,53 6,55
6,2
6,25
6,3
6,35
6,4
6,45
6,5
6,55
6,6
Pretest Postest
GC
GE
0
2
4
6
8
10
Pretest Postest
GC
GE
Coeficiente de correlación
Fernando Martínez Abad
Susana Olmos Migueláñez
El coeficiente de correlación mide la relación entre dos
variables.
Indica el tipo de relación entre dos variables y la intensidad
de la relación.
TIPO DE RELACIÓN:
DIRECTA  Valores positivos
INVERSA  Valores negativos
NULA  Cero
INTENSIDAD DE LA RELACIÓN:
ALTA  Valores cercanos a 1 o -1
BAJA  Valores cercanos a 0
Coeficiente de correlación
Fernando Martínez Abad
Susana Olmos Migueláñez
RELACIÓN DIRECTA
Tendencia de que a valores altos en la primera variable (X),
corresponden valores altos de la segunda (Y), y viceversa.
0
2
4
6
8
10
12
14
16
18
20
0 2 4 6 8 10 12 14
Coeficiente de correlación
Fernando Martínez Abad
Susana Olmos Migueláñez
RELACIÓN INVERSA
Tendencia de que a valores altos en la primera variable (X),
corresponden valores bajos de la segunda (Y), y viceversa.
0
2
4
6
8
10
12
14
0 2 4 6 8 10 12 14
Coeficiente de correlación
Fernando Martínez Abad
Susana Olmos Migueláñez
RELACIÓN NULA
No se observa ninguna tendencia lineal.
40
50
60
70
80
90
100
110
0 2 4 6 8 10 12 14
Bajo Medio Alto TOTAL
España
Alemania
TOTAL
Tabla de contingencia
La tabla de contingencia presenta la información conjunta
de dos variables cualitativas y/o ordinales.
Se obtiene una muestra de 250 familias, 150 alemanas y 100
españolas. Se mide el nivel de ingresos, y resulta que 60 familias
de las 100 que resultaron con ingresos bajos eran españolas, 120
familias tuvieron ingresos medios y 25 familias alemanas
declararon tener ingresos altos.
Tabla de contingencia
Bajo Medio Alto TOTAL
España 60 35 5 100
% España
Alemania 40 85 25 150
% Alemania
TOTAL 100 120 30 250
% TOTAL
El porcentaje por filas indica la proporción de personas que,
perteneciendo al grupo que indica la fila, cumplen la
condición de la columna respectiva.
Bajo % Bajo Medio % Medio Alto % Alto TOTAL % TOTAL
España 60 35 5 100
Alemania 40 85 25 150
TOTAL 100 120 30 250
Tabla de contingencia
El porcentaje por columnas indica la proporción de
personas que, perteneciendo al grupo que indica la
columna, cumplen la condición de la fila respectiva.
Bajo Medio Alto TOTAL
España 60 35 5 100
Alemania 40 85 25 150
TOTAL 100 120 30 250
Tabla de contingencia
El porcentaje total indica la proporción de personas que
representa la frecuencia de cada celda con respecto al total
de sujetos.
CUANTITATIVA ORDINAL
CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
CUANTITATIVA PEARSON SPEARMAN
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FICOEFICIENTE FI
Coeficiente de correlación en función del tipo
de variables
Coeficiente fi (Φ)
El coeficiente fi mide la relación entre dos variables
cualitativas dicotómicas.
Hombre Mujer
Aciertos a b
Errores c d
fi>0 indica mayores
proporciones en a y d
fi<0 indica mayores
proporciones en b y c
CUANTITATIVA ORDINAL
CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
CUANTITATIVA PEARSON SPEARMAN
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FI
Coeficiente de contingencia
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
Coeficiente de contingencia (CC)
El coeficiente de contingencia mide la relación entre dos
variables cualitativas. ya sean dicotómicas o politómicas.
Casado Divorciado Viudo TOTAL FILAS
Con afectación
severa
35 (56%) 15 (24%) 12 (20%) 62 (100%)
Sin afectación severa
5 (10%) 30 (63%) 13 (27%) 48 (100%)
TOTAL COLUMNAS 40 45 25 n=110
- El coeficiente de contingencia tiene valores entre 0 y 1.
- Valores cercanos a 1 indican que los porcentajes por filas de
cada columna (o viceversa) son muy diferentes.
A mayores diferencias en %, mayor CC CC=0,438
Coeficiente de contingencia (CC)
Casado Divorciado Viudo TOTAL
Con afectación
severa
35 (56%) 15 (24%) 12 (20%) 62
Sin afectación
severa
5 (10%) 30 (63%) 13 (27%) 48
TOTAL 40 45 25 n=110
Casado Divorciado Viudo TOTAL
Con afectación
severa
25 (40%) 20 (33%) 17 (27%) 62
Sin afectación
severa
20 (42%) 15 (31%) 13 (27%) 48
TOTAL 45 35 30 n=110
¿Mayor o Menor?
CC=0,438
CUANTITATIVA ORDINAL
CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
CUANTITATIVA PEARSON SPEARMAN
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FI
Coeficiente de correlación en función del tipo
de variables
PEARSON
DOS VARIABLES CUANTITATIVAS
Fernando Martínez Abad
Susana Olmos Migueláñez
El coeficiente de correlación de Pearson mide la relación
entre dos variables cuantitativas.
- Valores cercanos a 1 indican que a medida que aumenta una
variable, aumenta la otra (relación directa).
- Valores cercanos a -1 indican que a medida que aumenta una
variable disminuye la otra (relación inversa).
- Valores cercanos a 0 indican que no existe relación entre las dos
variables (relación nula).
CUANTITATIVA ORDINAL
CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
CUANTITATIVA PEARSON SPEARMAN
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FI
Coeficiente de correlación en función del tipo
de variables
SPEARMAN
SPEARMAN
DOS VARIABLES ORDINALES
El coeficiente de correlación de Spearman mide la relación entre
dos variables ordinales o entre una ordinal y otra cuantitativa.
- Valores cercanos a 1 indican que a medida que aumenta una
variable, aumenta la otra (relación directa).
ESTUDIOS PADRE
ESTUDIOS
MADRE
Sin estudios Básico Secundario Universitario
Sin estudios 10 6 1 0
Básico 4 22 12 6
Secundario 0 8 40 20
Universitario 2 2 11 69
0
5
10
15
20
25
30
35
40
Pobre En vías Emergente Rico
Baja
Media
Alta
Muy alta
DOS VARIABLES ORDINALES
El coeficiente de correlación de Spearman mide la relación entre
dos variables ordinales o entre una ordinal y otra cuantitativa.
- Valores cercanos a -1 indican que a medida que aumenta una
variable disminuye la otra (relación inversa).
NIVEL SOCIO-ECONÓMICO PAÍS
NIVEL
CRIMINALIDAD
PAÍS
Pobre En vías Emergente Rico
Baja 0 1 6 26
Media 4 8 30 4
Alta 10 12 8 2
Muy alta 35 9 0 1
0
5
10
15
20
25
30
35
40
Pobre En vías Emergente Rico
Baja
Media
Alta
Muy alta
CUANTITATIVA ORDINAL
CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
CUANTITATIVA PEARSON SPEARMAN
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FI
BISERIAL
PUNTUAL
Coeficiente de correlación en función del tipo
de variables
Correlación biserial-puntual (rbp)
El coeficiente de correlación biserial-puntual mide la
relación entre una variable cualitativa dicotómica y otra
variable cuantitativa.
- Valores positivos indican que los sujetos del grupo 1 tienen una
puntuación media más alta que los del grupo 0.
- Valores negativos indican que los sujetos del grupo 1 tienen una
puntuación media más baja que los del grupo 0.
- El coeficiente de correlación biserial-puntual adopta valores
entre -1 y 1.
Correlación biserial-puntual (rbp)
Se quiere comprobar si el sexo de los 12 jóvenes (14-16 años) que habitan una casa de
acogida tiene relación con sus habilidades sociales (medidas mediante la escala EHS
escolar. con puntuaciones de 1 a 100). Las puntuaciones son las que se muestran:
Sexo Punt. EHS
Hombre 25
Hombre 33
Hombre 70
Hombre 12
Hombre 50
Hombre 15
Hombre 26
Mujer 99
Mujer 85
Mujer 37
Mujer 49
Mujer 95
rbp ¿positivo o negativo?
Regresión lineal
La regresión es una técnica estadística empleada para
predecir los valores de una variable y (variable criterio o
dependiente) a partir de la una o más variables x (variables
predictoras o independientes).
Regresión lineal simple:
Sólo hay una variable predictora o independiente (x)
Regresión lineal múltiple:
Existen 2 o más var. predictoras o independientes (x)
La regresión lineal se puede aplicar sólo cuando las
variables dependientes son cuantitativas, y las
independientes cuantitativas y/o dicotómicas.
Regresión lineal simple
La regresión lineal consiste en el cálculo de la recta de
regresión, que es la recta que mejor se ajusta a la nube de
puntos del diagrama de dispersión.
“La recta de regresión será aquella que minimice el cuadrado de las distancias
entre los puntos y la recta. Por tanto, para averiguar la ecuación de la recta de
regresión, tenemos que calcular los valores a y b que hagan mínima la suma de
todas las d2, donde d representa la diferencia entre el punto y la recta d=y-
(a+bx)” (Etxeberría y Tejedor, 2005, p.216)
Ecuación de regresión simple
y’= Valores pronosticados en y para un valor concreto
en x
a = Ordenada en el origen
(punto de corte de la recta con el eje y)
b = Pendiente de la recta de regresión
ε = Error de la predicción
(diferencia entre el valor pronosticado y el real para
un sujeto)
Ecuación de regresión simple
0
2
4
6
8
10
12
14
16
18
20
0 2 4 6 8 10 12 14
ε=-4
(4, 2.4)
(9.1, 12)
No hay error!!
Recta de regresión simple
RECTA CRECIENTE: En este caso, a medida que aumenta el valor
de x, aumenta el de y. Así, la el valor de b (pendiente) es
positivo, al igual que el del coeficiente de correlación.
0
2
4
6
8
10
12
14
16
18
20
0 2 4 6 8 10 12 14
a = ?
b?
Recta de regresión
RECTA DECRECIENTE: A medida que aumenta el valor de x, el
valor de y disminuye. Así, el valor de b (pendiente) es negativo,
al igual que el del coeficiente de correlación.
0
2
4
6
8
10
12
14
0 2 4 6 8 10 12 14
a = ?
b ?
Ecuación de regresión múltiple
Mientras que en la regresión simple el modelo calcula 2
valores (parámetros), a y b, en la regresión múltiple se va
añadiendo un parámetro nuevo por cada variable nueva
incluida como predictora en el modelo.
𝒚′ = 𝒂 + 𝒃𝒙 𝟏 + 𝒄𝒙 𝟐 + 𝒅𝒙 𝟑 + ⋯ + 𝜺
Bondad de ajuste de la ecuación de regresión
Para medir la bondad de ajuste de la ecuación de regresión,
esto es, el error cometido al predecir los valores de y a
partir de un valor xi, se emplea el coeficiente de
determinación (R2).
El coeficiente de determinación tiene valores entre 0 y 1. Indica la
proporción o porcentaje de variabilidad explicada por el modelo, esto
es, la “proporción de los cambios de la variable criterio que son
explicados por la variable predictora” (Etxeberría y Tejedor, 2005, p.
223).
R2 = (rxy)2
Bondad de ajuste de la ecuación de regresión
Regresión simple
Act. Psicótica Empatía Comunicación Peso
2 10 12 80
9 5 6 56
8 6 10 95
3 9 15 67
1 13 18 85
9 5 6 76
11 4 3 69
3 9 12 105
7 3 5 101
13 2 5 96
8 5 7 51
6 4 9 48
1 9 8 68
2 8 7 82
Queremos predecir la actitud psicótica (variable dependiente ‘y’) a
partir de la empatía, las habilidades comunicativas y el peso
(variables independientes ‘x’) de un grupo de adolescentes:
Regresión simple
1. ¿Existe relación lineal entre las variables?
0
5
10
15
20
25
30
35
0 2 4 6 8
Empatía
Actitudpsicótica
0
5
10
15
20
25
30
35
0 2 4 6 8
Comunicación
Actitudpsicótica
0
5
10
15
20
25
30
35
0 2 4 6 8
Peso
Actitudpsicótica
rxy= -0.87 rxy= -0.71
rxy= -0.04
Regresión simple
2. Valores de los parámetros y ecuación de regresión
Act. Psicót. (Y) Empatía (X)
2 10
9 5
8 6
3 9
1 13
9 5
11 4
3 9
7 3
13 2
8 5
6 4
1 9
2 8
Y’ εi
rxy= -0.87
a= 13.17
b= -1.1 Y’ = 13.17 – 1.1 * X
Yi = 13.17 – 1.1 * Xi + εi
Regresión simple
2. Valores de los parámetros y ecuación de regresión
Y’
3,66
7,68
5
1,65
-0,36
7,68
9,69
3,66
8,35
8,35
7,01
5,67
6,34
7,01
εi
-1,66
1,32
3
1,35
1,36
1,32
1,31
-0,66
-1,35
4,65
0,99
0,33
-5,34
-5,01
Act. Psicót. (Y) Comunic. (X)
2 12
9 6
8 10
3 15
1 18
9 6
11 3
3 12
7 5
13 5
8 7
6 9
1 8
2 7
rxy= -0.71
a= 11. 7
b= -0.67 Y’ = 11.7 – 0.67 * X
Yi = 11. 7 – 0.67 * Xi + εi
Regresión simple
rxy= -0.87
3. Bondad de ajuste del modelo
R2= (-0,87)2=0.77  77%
Act. Psic. (Y) Empatía (X)
2 10
9 5
8 6
3 9
1 13
9 5
11 4
3 9
7 3
13 2
8 5
6 4
1 9
2 8
Y’
2,17
7,67
6,57
3,27
-1,13
7,67
8,77
3,27
9,87
10,97
7,67
8,77
3,27
4,37
εi
-0,17
1,33
1,43
-0,27
2,13
1,33
2,23
-0,27
-2,87
2,03
0,33
-2,77
-2,27
-2,37
S2
y= 14.35
S2
y’= 11.05
S2
ε= 3.30
S2
y = S2
y’ + S2
ε
14.35 = 11.05 + 3.30
R2= 0.77 = 11.05 / 14.35
Regresión simple y múltiple
rxy= -0.71
3. Bondad de ajuste del modelo
R2= (-0,71)2=0.51  51%
S2
y= 14.35
S2
y’= 7.28
S2
ε= 7.07
S2
y = S2
y’ + S2
ε
14.35 = 7.28 + 7.07
R2= 0.51 = 7.28 / 14.35
Y’
3,66
7,68
5
1,65
-0,36
7,68
9,69
3,66
8,35
8,35
7,01
5,67
6,34
7,01
εi
-1,66
1,32
3
1,35
1,36
1,32
1,31
-0,66
-1,35
4,65
0,99
0,33
-5,34
-5,01
Act. Psic. (Y) Comun. (X)
2 12
9 6
8 10
3 15
1 18
9 6
11 3
3 12
7 5
13 5
8 7
6 9
1 8
2 7
Regresión simple
El modelo de regresión explica el 77%
de la varianza total.
La empatía explica el 77% de la
variabilidad de la actitud psicótica.
Existe un 23% de variabilidad no
explicada en el modelo.
Regresión simple
Existe un 49% de varianza total de la
actitud psicótica que no explican las
habilidades de comunicación.
Regresión simple
Los kilogramos que pesa una
persona no ayudan en explicar su
actitud psicótica.
Regresión múltiple
Dado que la empatía y las habilidades en comunicación son
explicativas de las actitudes psicóticas, podemos plantear el
modelo de regresión múltiple:
En este caso, la solución de la ecuación de regresión con 2
variables predictoras es un plano en un espacio
tridimensional.
Regresión múltiple
Act. Psicótica Empatía Comunicación
2 10 12
9 5 6
8 6 10
3 9 15
1 13 18
9 5 6
11 4 3
3 9 12
7 3 5
13 2 5
8 5 7
6 4 9
1 9 8
2 8 7
Actitud psicótica
Hab. comunicación
Empatía
Regresión múltiple
¿Por qué sólo ha mejorado un 1% la bondad de ajuste al
incorporar las dos variables conjuntamente, si ambas tenían
un buen ajuste en el modelo de regresión simple?
Regresión múltiple
¿Por qué sólo ha mejorado un 1% la bondad de ajuste al
incorporar las dos variables conjuntamente, si ambas tenían
un buen ajuste en el modelo de regresión simple?
Hab. comunicación
Empatía
rxy empatía-comunicac.
rxy = 0.845
Empatía y comunicación correlacionan de
manera alta, por lo que parece que son
variables que están explicando lo mismo.
Así, el nivel explicativo conjunto, con
respecto al individual, crece muy poco…
Puntuaciones individuales
Los estadísticos de tendencia central, de dispersión y de
forma nos aportan una visión general sobre el
comportamiento de una variable.
Sin embargo, en ocasiones, nos interesa conocer, más que el
comportamiento de las variables, el comportamiento de
sujetos u observaciones concretas en una o varias
variables. En este caso, los estadísticos descriptivos no nos
sirven para este fin.
La tipificación o estandarización de las variables es el
procedimiento empleado en estos casos
Tipificación o estandarización
Tipificar o estandarizar una variable es ajustarla a una
norma, es decir, modificar las puntuaciones directas (xi) de
manera que la variable creada (zi) tenga una media y una
desviación típica determinadas previamente.
Cuando se estandariza una variable se modifican los estadísticos de
tendencia central y de dispersión, pero NUNCA los de forma y posición.
xi di zi
Z(0, 1)
Tipificación o estandarización
Medimos las habilidades sociales de un grupo de adolescentes
con problemas de comportamiento
ASERTIVIDAD
Una vez estudiado el comportamiento del grupo, nos interesa ver
qué habilidades sociales posee un joven en particular:
COMUNICACIÓNEMPATÍA
TIPIFICO (z)ASERTIVIDAD
EMPATÍA
COMUNICACIÓN
22
18
11.5
xi
ASERTIVIDAD
EMPATÍA
COMUNICACIÓN
zi
A partir de las puntuaciones zi, que tienen una distribución
Z(0, 1), podemos obtener cualquier distribución deseada
R(𝑅, 𝑆𝑟), en función de nuestros intereses.
Puntuaciones típicas derivadas
𝒓𝒊 = 𝑹 + (𝑺 𝒓 ∗ 𝒛𝒊)
𝑿 = 𝟏𝟎
𝑺 𝒙 = 𝟓 𝒛𝒊 =
𝟏𝟎 − 𝒙𝒊
𝟓
𝒎𝒊 = 𝟓 + (𝟏 ∗ 𝒛𝒊)
M(5, 1)
Z(0, 1) M(5, 1)
Utilidad de tipificar o estandarizar a puntuaciones zi:
Se obtiene una única escala métrica para todas las
variables, por lo que podemos comparar unos resultados
con otros con más objetividad y realismo que si
comparamos las puntuaciones directas. Podemos comparar
cualquier grupo de variables, sea cual sea su naturaleza.
Tipificación o estandarización
Las puntuaciones que están por encima de la media son
positivas y las que están por debajo negativas, por lo que se
facilita la interpretación de las puntuaciones individuales.
Con las puntuaciones típicas se pueden localizar mejor los
resultados atípicos o extremos.
A partir de las puntuaciones zi, que tienen una distribución
Z(0, 1), podemos obtener cualquier distribución deseada, en
función de nuestros intereses.
Puntuaciones típicas derivadas
Z(0, 1) T(50, 15) S(100, 10)= 6
Sx = 2 xi di zi ti si
8
5
6
9
3
4
7
• POBLACIONES INABARCABLES
• Agresividad de jóvenes internados en centros de acogida
» Recursos limitados
» Excesivo numero de casos
» Réplicas de la investigación
ESTADÍSTICA INFERENCIAL
“Conjunto de técnicas para llegar a inducciones (o inferencias)
acerca de una población completa basándose en datos de una
muestra integrante de la misma”
(Welkowitz, Ewen & Cohen, 1981, p. 106)
La Investigación en Ciencias Sociales
Intervalos de confianza
Gracias a la inferencia estadística, partiendo de unas
condiciones específicas de las distribuciones de las variables,
podré afirmar que, partiendo de una muestra determinada y
con un error concreto, el valor de un parámetro poblacional se
encuentra dentro de un intervalo dado.
Suponiendo que la muestra es representativa y que la variable es normal
Intervalos de confianza
Error= 5%  Z0.95=1.96
Error= 5%  Z0.95=1.96
Error= 1%  Z0.99=2.58
Error= 1%  Z0.99=2.58
𝑰. 𝑪. → 𝜽 ± (𝒁 𝟏−𝜶 ∗ 𝑺 𝑿)
𝑺 𝑿 = 𝟏
𝑺 𝑿 = 𝟑
𝑺 𝑿 =
𝑺 𝒙
𝟐
𝒏 − 𝟏
La hipótesis estadística
La inferencia estadística se basa en la formulación de hipótesis acerca
de los parámetros, y consiste en contrastar si esa hipótesis es cierta o
falsa.
Error= 5%
Z0.95=1.96
¿Se puede afirmar, con un error del 5%, que la media poblacional
de esta variable es 7.5?
H0: µ = 7.5
H1: µ ≠ 7.5
¿Acepto o rechazo la H0?
𝑺 𝑿 = 𝟏
La inferencia estadística se basa en la formulación de hipótesis acerca
de los parámetros, y consiste en contrastar si esa hipótesis es cierta o
falsa.
Error= 1%
Z0.99=2.58
¿Y con un error del 1%, se puede afirmar que la media poblacional
es 7.5?
H0: µ = 7.5
H1: µ ≠ 7.5
La hipótesis estadística
¿Acepto o rechazo la H0?
𝑺 𝑿 = 𝟏
Se observa mejor este procedimiento de manera gráfica:
Error= 5%H0: µ = 7.5
H1: µ ≠ 7.5
8.04 11.96
7.5
Zona de
Aceptación de H0
Rechazo H0 Rechazo H0
¿ACEPTO O RECHAZO
H0?
La hipótesis estadística
𝑺 𝑿 = 𝟏
Se observa mejor este procedimiento de manera gráfica:
Error= 1%
7.42 12.58
7.5
Zona de
Aceptación de H0
Rechazo H0 Rechazo H0
H0: µ = 7.5
H1: µ ≠ 7.5
La hipótesis estadística
¿ACEPTO O RECHAZO
H0?
𝑺 𝑿 = 𝟏
¿Y si lo que quiero es comparar grupos? ¿Es la media de hombres y
mujeres igual en la variable X?:
Error= 5%
Zona de
Aceptación de H0
ZONA DE ACEPTACIÓN!!!
ACEPTO H0 No existen
diferencias significativas entre
hombres y mujeres
H0: µ1 = µ2
H1: µ1 ≠ µ2
La hipótesis estadística
8.08 15.9214.08 21.92
𝑺 𝑿 = 𝟐
• Hipótesis nula (H0): Conjetura que se pone a
prueba con el contraste. Se acepta o se rechaza.
• Hipótesis alternativa (H1): Es la hipótesis
complementaria (opuesta) a la H0.
• Región de rechazo (RR): Conjunto de valores
para los que se rechaza H0. Existe también, por
tanto una región de aceptación (RA).
• Nivel de significación o error tipo I (α):
Probabilidad de rechazar la H0 cuando esta es
verdadera (Normalmente 0,05 o del 5%).
La formulación de hipótesis
• Ej. 1: Sabemos que para el conjunto de la población de mujeres
maltratadas en España, la media obtenida en el “Test de
Depresión de Hamilton” es de 24 puntos. Hemos obtenido una
muestra de 50 mujeres que han sufrido violencia de género, y tras
aplicar el citado test, obtenemos que X = 20; SX = 1,5. ¿Podemos
afirmar a un nivel de significación del 5% que la media obtenida en
nuestros datos procede de la población?
» H0: µ = 24
» H1: µ ≠ 24
» Si p≥0,05  Acepto H0
» Si p<0,05  Rechazo H0
La formulación de hipótesis
• Sig (p.)> 0,05  Acepto Hipótesis nula (H0): La
hipótesis nula siempre es la de igualdad.
Interpretación de resultados en software estadístico
P<0,05
RH0
P>0,05
AH0
P>0,05
AH0
• Sig (p.)< 0,05  Rechazo Hipótesis nula (H0):
Existen diferencias significativas entre grupos.
• MUESTREO
– La muestra seleccionada debe ser representativa de la
población de la que procede.
• NORMALIDAD
– Las variables cuantitativas sobre las que se va a realizar la
inferencia deben ajustarse a la distribución normal.
• HOMOCEDASTICIDAD
– En el caso de que se contrasten varias variables cuantitativas,
estas deben poseer varianzas semejantes.
Condiciones para la inferencia
• Muestreo probabilístico (simple, sistemático,
por conglomerados, por estratos, etc.)
– Todas las muestras de la población tienen las mismas
probabilidades de ser seleccionadas.
• Tamaño de muestra
– Para asegurarme (con una probabilidad determinada) de que
los estadísticos de la muestra se acercan a los parámetros
poblacionales, deberé seleccionar un tamaño de muestra
mínimo:
Muestreo representativo
 La distribución normal N( , Sx) es una distribución
teórica que aparece con mucha frecuencia cuando en
ciencias sociales medimos una variable.
 Las características sociológicas, psicológicas, educativas,
etc. de las poblaciones estudiadas suelen ajustarse a la
distribución normal.
 En estos casos, a medida que aumenta el tamaño de la
muestra con el que se mide una variable, la distribución
de esa variable tenderá hacia las características de la
distribución normal
 Cuando una variable se ajusta a la distribución normal,
entonces Z(0, 1)  N(0, 1)
Distribución normal
Distribución normal
0.15% 2.25% 15.85% 50%
Simétrica
Mesocúrtica
As=0
Curt=0
84.15% 97.75% 99.85%
media
mediana
moda
• Distribución de la variable sobre la que se
aplica inferencia similar a la distribución de la
curva normal
– CURTOSIS MESOCÚRTICA (Curt=0)
– SIMETRÍA (As=0)  Media=Moda=Mediana
» Prueba de Kolmogorov-Smirnov
• H0: La variable se ajusta a la curva normal  p ≥ α
• H1: La variable no se ajusta a la curva normal  p < α
Normalidad de las variables
• Varianzas similares de las variables cuantitativas
sobre las que se contrastan parámetros
– Estudio de la dispersión de los datos (Diagrama de cajas)
» Prueba de Levene
• H0: Las variables tienen varianzas iguales  p ≥ α
• H1: Las variables no tienen varianzas iguales  p < α
Homocedasticidad de las variables
• En el caso del cumplimiento de la condición de
normalidad emplearemos técnicas paramétricas
(basadas en la distribución normal de las
variables).
• En el caso de que no se cumpla esta condición
emplearemos técnicas no paramétricas (basadas
en la mediana y no la media).
Condiciones para la inferencia
Contraste PARAMÉTRICO o NO PARAMÉTRICO
PARAMÉTRICA
ESTADÍSTICA
INFERENCIAL
Cálculo de los parámetros
de una población.
NO PARAMÉTRICA
- Prueba T para grupos independientes
- Prueba T para grupos relacionados
- ANOVA
- Prueba de independencia Chi cuadrado
- U de Mann-Whitney para 2 grupos
independientes
- W de Wilcoxon para 2 grupos relacionados
- H de Kruskal-Wallis para k grupos
independientes
CUANTITATIVA ORDINAL
CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
CUANTITATIVA
PRUEBA DE T
GRUPOS REL.
ANOVA ANOVA
PRUEBA DE T
GRUPOS INDEP.
W de WILCOXON
H de KRUSKAL-
WALLIS
H de KRUSKAL-
WALLIS
U de MANN-
WHITNEY
ORDINAL
CHI
CUADRADO
CHI CUADRADO CHI CUADRADO
CUALITATIVA
POLITÓMICA
CHI CUADRADO CHI CUADRADO
CUALITATIVA
DICOTÓMICA
CHI CUADRADO
Contraste PARAMÉTRICO o NO PARAMÉTRICO
Las distribuciones de las variables cuantitativas
estudiadas se ajustan a la distribución normal
Técnicas paramétricas
• Si se verifica la normalidad de las variables cuantitativas
(contraste de KOLMOGOROV-SMIRNOV), aplico técnicas
paramétricas:
H0: La distribución es normal
H1: La distribución no es normal
Acepto la H0 de que la distribución de la variable FELICIDAD
es normal, por lo que puedo aplicar técnicas paramétricas
• Diferencia de medias: Prueba t muestras independientes
¿Existen diferencias en la altura de la población en función del sexo?
• H0: µ1 = µ2
• H1: µ1 ≠ µ2
H0: µ1 = µ2
H1: µ1 ≠ µ2
¿¿??
Una variable cuantitativa y una
variable dicotómica
Existen diferencias significativas entre hombres y mujeres
en lo que respecta a la altura.
Técnicas paramétricas
• Análisis de Varianza (ANOVA):
¿La comprensión lectora se ve afectada por el nivel sociocultural?
• H0: µ1 = µ2 = µ3
• H1: µ1 ≠ µ2 ≠ µ3
¿¿??
H0: µ1 = µ2 = µ3
H1: µ1 ≠ µ2 ≠ µ3
Técnicas paramétricas
Una variable cuantitativa y una
variable politómica u ordinal
Existen diferencias entre los grupos en comprensión lectora, por
lo que diferentes niveles socioculturales afectan a esta variable
• Diferencia de medias: Prueba t muestras relacionadas
¿Existen diferencias entre la felicidad y la satisfacción con la vida personal
de la población?
• H0: µ1 = µ2
• H1: µ1 ≠ µ2
¿¿??
Técnicas paramétricas Dos variables cuantitativas
Existen diferencias significativas entre la felicidad y la satisfacción
con la vida personal de los sujetos.
Las distribuciones de las variables cuantitativas
estudiadas NO se ajustan a la distribución normal y/o
no existe homocedasticidad entre las variables
Técnicas no paramétricas
• Si no existe normalidad en las variables cuantitativas
(contraste de KOLMOGOROV-SMIRNOV), aplico técnicas
no paramétricas:
H0: La distribución es normal
H1: La distribución no es normal
Rechazo la H0 de que la distribución de la variable FELICIDAD
no es normal, y NO puedo aplicar técnicas paramétricas
• Prueba U de Mann-Whitney
¿Existen diferencias en la felicidad de la población en función del sexo?
• H0: θ1 = θ2
• H1: θ1 ≠ θ2
¿¿??
Una variable cuantitativa y una
variable dicotómica
Técnicas NO paramétricas
No existen diferencias significativas entre hombres y mujeres
en el nivel de felicidad declarado.
• Test de Kruskal-Wallis
¿La felicidad se ve afectada por los estudios del sujeto?
• H0: θ1 = θ2 = θ3
• H1: θ1 ≠ θ2 ≠ θ3
¿¿??
H0: θ1 = θ2 = θ3
H1: θ1 ≠ θ2 ≠ θ3
Una variable cuantitativa y una
variable politómica u ordinal
Técnicas NO paramétricas
El nivel de estudios influye en la felicidad de los sujetos.
Parece que a mayor nivel de estudios, mayor felicidad.
• Prueba de Wilcoxon
¿Existen diferencias entre la felicidad y la satisfacción con la vida personal
de la población?
• H0: θ1 = θ2
• H1: θ1 ≠ θ2
¿¿??
Dos variables cuantitativas
Existen diferencias significativas entre la felicidad y la satisfacción
con la vida personal de los sujetos.
Técnicas NO paramétricas
• Prueba Chi cuadrado (c2)
¿Depende el uso de internet en los últimos 12 meses de los estudios que ha
alcanzado el sujeto?
• H0: Las variables son independientes
• H1: Las variables no son independientes
¿¿??
Pareja de variables ordinales
y/o cualitativas
Las variables no son independientes, por lo que el empleo de internet
depende del nivel de estudios
Técnicas NO paramétricas
BIBLIOGRAFÍA
Etxeberría, J. y Tejedor, F. J. (2005). Análisis descriptivo de datos
en educación. Madrid: La Muralla.
Tejedor, F. J. y Etxeberría, J. (2006). Análisis Inferencial De Datos
En Educación. Manuales de metodología de investigación
educativa. Madrid: La Muralla.
Welkowitz, J. (1981). Estadística aplicada a las ciencias de la
educación. Madrid: Santillana.
Fiabilidad y Validez

Más contenido relacionado

La actualidad más candente

5.medidas de tendencia central
5.medidas de tendencia central5.medidas de tendencia central
5.medidas de tendencia central
rosa61
 
Coeficientes de Correlacion de Spearman y Pearson
Coeficientes de Correlacion de Spearman y PearsonCoeficientes de Correlacion de Spearman y Pearson
Coeficientes de Correlacion de Spearman y Pearson
anicar31
 
Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4
Luis Quiazua
 
15 test estadísticos
15 test estadísticos15 test estadísticos
15 test estadísticos
Yerko Bravo
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
UTPL UTPL
 

La actualidad más candente (20)

REGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEALREGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN Y CORRELACIÓN LINEAL
 
Correlaciones
CorrelacionesCorrelaciones
Correlaciones
 
5.medidas de tendencia central
5.medidas de tendencia central5.medidas de tendencia central
5.medidas de tendencia central
 
2 prueba z,prueba t student y prueba chi-cuadrado
2 prueba z,prueba t student y prueba chi-cuadrado2 prueba z,prueba t student y prueba chi-cuadrado
2 prueba z,prueba t student y prueba chi-cuadrado
 
Analisis Factorial
Analisis FactorialAnalisis Factorial
Analisis Factorial
 
Coeficientes de Correlacion de Spearman y Pearson
Coeficientes de Correlacion de Spearman y PearsonCoeficientes de Correlacion de Spearman y Pearson
Coeficientes de Correlacion de Spearman y Pearson
 
Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4
 
Conjuntos
ConjuntosConjuntos
Conjuntos
 
Operacionalizacion de variables
Operacionalizacion de variables  Operacionalizacion de variables
Operacionalizacion de variables
 
15 test estadísticos
15 test estadísticos15 test estadísticos
15 test estadísticos
 
Inferencia estadistica
Inferencia estadisticaInferencia estadistica
Inferencia estadistica
 
Contraste de hipótesis con chi cuadrado
Contraste de hipótesis con chi cuadradoContraste de hipótesis con chi cuadrado
Contraste de hipótesis con chi cuadrado
 
Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...
Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...
Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...
 
Regresion simple.
Regresion simple.Regresion simple.
Regresion simple.
 
4 intervalos de confianza ok
4 intervalos de confianza ok4 intervalos de confianza ok
4 intervalos de confianza ok
 
Estadística descriptiva e inferencial
Estadística descriptiva e inferencialEstadística descriptiva e inferencial
Estadística descriptiva e inferencial
 
Medidas de tendencia central ppt
Medidas de tendencia central pptMedidas de tendencia central ppt
Medidas de tendencia central ppt
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
ESTADISTICA II ( I Bimestre Abril Agosto 2011)
ESTADISTICA II ( I Bimestre Abril Agosto 2011)ESTADISTICA II ( I Bimestre Abril Agosto 2011)
ESTADISTICA II ( I Bimestre Abril Agosto 2011)
 
Manual de descarga del software smart pls 3 y smartp ls2
Manual de descarga del software smart pls 3 y smartp ls2Manual de descarga del software smart pls 3 y smartp ls2
Manual de descarga del software smart pls 3 y smartp ls2
 

Destacado

Trabajo de mate David R., Marcos y Guille
Trabajo de mate David R., Marcos y GuilleTrabajo de mate David R., Marcos y Guille
Trabajo de mate David R., Marcos y Guille
premioeduca
 
áRea de figuras planas
áRea de figuras planasáRea de figuras planas
áRea de figuras planas
medinacr7
 
Area figuras planas
Area figuras planasArea figuras planas
Area figuras planas
abenaco782
 
Trabajo de Mate: área de figuras planas.
Trabajo de Mate: área de figuras planas.Trabajo de Mate: área de figuras planas.
Trabajo de Mate: área de figuras planas.
premioeduca
 
Tablas de frecuencia, contingencia y gráficos con
Tablas de frecuencia, contingencia y gráficos conTablas de frecuencia, contingencia y gráficos con
Tablas de frecuencia, contingencia y gráficos con
Virginia265
 
tablas de frecuencia
tablas de frecuenciatablas de frecuencia
tablas de frecuencia
32219
 
Mc pasos construccion_tablas frecuencia
Mc pasos construccion_tablas frecuenciaMc pasos construccion_tablas frecuencia
Mc pasos construccion_tablas frecuencia
patriciax
 
Tablas de frecuencia
Tablas de frecuenciaTablas de frecuencia
Tablas de frecuencia
natarey
 

Destacado (20)

Trabajo de mate David R., Marcos y Guille
Trabajo de mate David R., Marcos y GuilleTrabajo de mate David R., Marcos y Guille
Trabajo de mate David R., Marcos y Guille
 
Tablas de frecuencia
Tablas de frecuenciaTablas de frecuencia
Tablas de frecuencia
 
áRea de figuras planas
áRea de figuras planasáRea de figuras planas
áRea de figuras planas
 
Area figuras planas
Area figuras planasArea figuras planas
Area figuras planas
 
LAS FIGURAS PLANAS
LAS FIGURAS PLANASLAS FIGURAS PLANAS
LAS FIGURAS PLANAS
 
Trabajo de Mate: área de figuras planas.
Trabajo de Mate: área de figuras planas.Trabajo de Mate: área de figuras planas.
Trabajo de Mate: área de figuras planas.
 
Ejercicio de correlación biserial puntual
Ejercicio de correlación biserial puntualEjercicio de correlación biserial puntual
Ejercicio de correlación biserial puntual
 
Estadistica
Estadistica Estadistica
Estadistica
 
Seminario 5 estadistica
Seminario 5 estadisticaSeminario 5 estadistica
Seminario 5 estadistica
 
Las tablas de frecuencia
Las tablas de frecuenciaLas tablas de frecuencia
Las tablas de frecuencia
 
Tablas de frecuencia, contingencia y gráficos con
Tablas de frecuencia, contingencia y gráficos conTablas de frecuencia, contingencia y gráficos con
Tablas de frecuencia, contingencia y gráficos con
 
Tablas de frecuencia
Tablas de frecuenciaTablas de frecuencia
Tablas de frecuencia
 
Tablas de frecuencia
Tablas de frecuenciaTablas de frecuencia
Tablas de frecuencia
 
tablas de frecuencia
tablas de frecuenciatablas de frecuencia
tablas de frecuencia
 
Congruencia y semejanza
Congruencia y semejanzaCongruencia y semejanza
Congruencia y semejanza
 
Semejanza y congruencia de triagulos
Semejanza y congruencia de triagulosSemejanza y congruencia de triagulos
Semejanza y congruencia de triagulos
 
Tarea 5
Tarea 5Tarea 5
Tarea 5
 
Calculo de Area Figuras Planas
Calculo de Area Figuras PlanasCalculo de Area Figuras Planas
Calculo de Area Figuras Planas
 
Mc pasos construccion_tablas frecuencia
Mc pasos construccion_tablas frecuenciaMc pasos construccion_tablas frecuencia
Mc pasos construccion_tablas frecuencia
 
Tablas de frecuencia
Tablas de frecuenciaTablas de frecuencia
Tablas de frecuencia
 

Similar a Análisis de datos en Ciencias Sociales

Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadistica
ademiha
 

Similar a Análisis de datos en Ciencias Sociales (20)

3ra med veter medidas de tendencia central
3ra med veter  medidas de tendencia central3ra med veter  medidas de tendencia central
3ra med veter medidas de tendencia central
 
3ra psicologia medidas de tendencia central
3ra psicologia  medidas de tendencia central3ra psicologia  medidas de tendencia central
3ra psicologia medidas de tendencia central
 
3ra psicologia medidas de tendencia central
3ra psicologia  medidas de tendencia central3ra psicologia  medidas de tendencia central
3ra psicologia medidas de tendencia central
 
Estadisticos 29 3-2020
Estadisticos 29 3-2020Estadisticos 29 3-2020
Estadisticos 29 3-2020
 
Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadistica
 
Tb23 distribucion t_student_2012-3
Tb23 distribucion t_student_2012-3Tb23 distribucion t_student_2012-3
Tb23 distribucion t_student_2012-3
 
Guía métodos estadísticos.
Guía métodos estadísticos.Guía métodos estadísticos.
Guía métodos estadísticos.
 
Tratamiento de datos cuantitativos
Tratamiento de datos cuantitativosTratamiento de datos cuantitativos
Tratamiento de datos cuantitativos
 
Presentación de estadística
Presentación de estadísticaPresentación de estadística
Presentación de estadística
 
Estadistica 4 liceo
Estadistica 4 liceoEstadistica 4 liceo
Estadistica 4 liceo
 
medidas de tendencia central.pdf
medidas de tendencia central.pdfmedidas de tendencia central.pdf
medidas de tendencia central.pdf
 
TEMA 1 . 19 DE JUNIO-6.pptx
TEMA 1 . 19 DE JUNIO-6.pptxTEMA 1 . 19 DE JUNIO-6.pptx
TEMA 1 . 19 DE JUNIO-6.pptx
 
Psico 6ta medidas posición relativa
Psico 6ta  medidas posición relativaPsico 6ta  medidas posición relativa
Psico 6ta medidas posición relativa
 
estadistica_Descriptiva.doc
estadistica_Descriptiva.docestadistica_Descriptiva.doc
estadistica_Descriptiva.doc
 
Estadisticos
EstadisticosEstadisticos
Estadisticos
 
Iniciación-a-la-Estadística-DATATHON-2022-EVD-y-ACL.pdf
Iniciación-a-la-Estadística-DATATHON-2022-EVD-y-ACL.pdfIniciación-a-la-Estadística-DATATHON-2022-EVD-y-ACL.pdf
Iniciación-a-la-Estadística-DATATHON-2022-EVD-y-ACL.pdf
 
Estadistica para la investigación (sesión3)
Estadistica para la investigación (sesión3)Estadistica para la investigación (sesión3)
Estadistica para la investigación (sesión3)
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Tema 3 Medidas De Posición
Tema 3 Medidas De PosiciónTema 3 Medidas De Posición
Tema 3 Medidas De Posición
 
Estadistica
EstadisticaEstadistica
Estadistica
 

Más de Universidad de Salamancca

Más de Universidad de Salamancca (10)

Manual básico de empleo de SPSS
Manual básico de empleo de SPSSManual básico de empleo de SPSS
Manual básico de empleo de SPSS
 
Manual básico pspp
Manual básico psppManual básico pspp
Manual básico pspp
 
Análisis de datos inferencial paramétrico y no paramétrico en Ciencias Sociales
Análisis de datos inferencial paramétrico y no paramétrico en Ciencias SocialesAnálisis de datos inferencial paramétrico y no paramétrico en Ciencias Sociales
Análisis de datos inferencial paramétrico y no paramétrico en Ciencias Sociales
 
El diseño de materiales para la formación eLearning
El diseño de materiales para la formación eLearningEl diseño de materiales para la formación eLearning
El diseño de materiales para la formación eLearning
 
Introducción a la formación no presencial y e learning
Introducción a la formación no presencial y e learningIntroducción a la formación no presencial y e learning
Introducción a la formación no presencial y e learning
 
Diseño y Desarrollo de proyectos de Investigación en Ciencias Sociales
Diseño y Desarrollo de proyectos de Investigación en Ciencias SocialesDiseño y Desarrollo de proyectos de Investigación en Ciencias Sociales
Diseño y Desarrollo de proyectos de Investigación en Ciencias Sociales
 
Instrumentos de Recogida de Información en Ciencias Sociales
Instrumentos de Recogida de Información en Ciencias SocialesInstrumentos de Recogida de Información en Ciencias Sociales
Instrumentos de Recogida de Información en Ciencias Sociales
 
El proceso de las investigaciones científicas en Ciencias Sociales
El proceso de las investigaciones científicas en Ciencias SocialesEl proceso de las investigaciones científicas en Ciencias Sociales
El proceso de las investigaciones científicas en Ciencias Sociales
 
Introducción a la Investigación Científica en Ciencias Sociales
Introducción a la Investigación Científica en Ciencias SocialesIntroducción a la Investigación Científica en Ciencias Sociales
Introducción a la Investigación Científica en Ciencias Sociales
 
Fútbol en Europa y en Estados Unidos
Fútbol en Europa y en Estados UnidosFútbol en Europa y en Estados Unidos
Fútbol en Europa y en Estados Unidos
 

Último

TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
jlorentemartos
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
Wilian24
 

Último (20)

UNIDAD DIDACTICA nivel inicial EL SUPERMERCADO.docx
UNIDAD DIDACTICA nivel inicial EL SUPERMERCADO.docxUNIDAD DIDACTICA nivel inicial EL SUPERMERCADO.docx
UNIDAD DIDACTICA nivel inicial EL SUPERMERCADO.docx
 
activ4-bloque4 transversal doctorado.pdf
activ4-bloque4 transversal doctorado.pdfactiv4-bloque4 transversal doctorado.pdf
activ4-bloque4 transversal doctorado.pdf
 
Los dos testigos. Testifican de la Verdad
Los dos testigos. Testifican de la VerdadLos dos testigos. Testifican de la Verdad
Los dos testigos. Testifican de la Verdad
 
La Evaluacion Formativa SM6 Ccesa007.pdf
La Evaluacion Formativa SM6  Ccesa007.pdfLa Evaluacion Formativa SM6  Ccesa007.pdf
La Evaluacion Formativa SM6 Ccesa007.pdf
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
LA JUNGLA DE COLORES.pptx Cuento de animales
LA JUNGLA DE COLORES.pptx  Cuento de animalesLA JUNGLA DE COLORES.pptx  Cuento de animales
LA JUNGLA DE COLORES.pptx Cuento de animales
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 
Power Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptxPower Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptx
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
Código Civil de la República Bolivariana de Venezuela
Código Civil de la República Bolivariana de VenezuelaCódigo Civil de la República Bolivariana de Venezuela
Código Civil de la República Bolivariana de Venezuela
 
Educacion Basada en Evidencias SM5 Ccesa007.pdf
Educacion Basada en Evidencias  SM5  Ccesa007.pdfEducacion Basada en Evidencias  SM5  Ccesa007.pdf
Educacion Basada en Evidencias SM5 Ccesa007.pdf
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
animalesdelaproincia de beunos aires.pdf
animalesdelaproincia de beunos aires.pdfanimalesdelaproincia de beunos aires.pdf
animalesdelaproincia de beunos aires.pdf
 
PP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomasPP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomas
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Factores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdfFactores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdf
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
Sesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdfSesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdf
 
Lecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigosLecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigos
 
Actividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docxActividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docx
 

Análisis de datos en Ciencias Sociales

  • 1.
  • 2.
  • 3. Índice de la asignatura • T1. Introducción a la investigación científica • ¿Qué es investigar? • Investigación educativa • El proceso de la Investigación Científica • T2. El proceso en investigaciones educativas • Objetivos e hipótesis • Diseños de investigación • Tipos de variables • Población y muestra: Técnicas de muestreo • T3. Instrumentos de recogida de información • Observación • Técnicas de encuesta: entrevista y cuestionario (escalas de actitud y pruebas objetivas) • Técnicas grupales • T4. Análisis de datos en Ciencias Sociales (cuantitativo) • Análisis descriptivo de datos • Análisis inferencial de datos
  • 4. Procesogeneraldeinvestigación 2º REVISIÓN BIBLIOGRÁFICA. FUENTES DOCUMENTALES 3º SELECCIÓN DEL MÉTODO Y DISEÑO DE INVESTIGACIÓN FORMULACIÓN DE HIPÓTESIS VARIABLES 1º PLANTEAMIENTO DEL PROBLEMA. SELECCIÓN DE UN TEMA A INVESTIGAR SELECCIÓN DE LA MUESTRA PLANIFICACIÓN DE LA OBTENCIÓN DE INFORMACIÓN Y ANÁLISIS DE DATOS 4º TÉCNICA DE RECOGIDA DE DATOS 5º TÉCNICA DE ANÁLISIS DE DATOS 6º CONCLUSIONES-REDACCIÓN DE INFORME
  • 5. INSTRUMENTOS VARIABLES FIABILIDAD Consistencia: La medida repetida en las mismas condiciones devuelve resultados iguales VALIDEZ medir realmente aquello que se pretende medir Recogida de información
  • 6. Tipos de Variables DICOTÓMICAS POLITÓMICAS Sexo Sí/no Acierto/error Comunidad autónoma Estado civil Color de ojos Establecen orden o nivel ORDINALES Orden de llegada/alfabético/puntuaciones Curso en la titulación Bajo/medio/alto DISCRETAS CONTINUAS Año de nacimiento Número de objetos (libros, ordenadores, …) o elementos (hermanos, …) Peso Estatura Nº indivisibles (enteros) Nº en una escala continua (decimales) Establecen categorías CUALITATIVAS o NOMINALES Forman una escala CUANTITATIVAS
  • 7. Tipos de Variables Número de créditos matriculados ¿Tienes carné de conducir? Nota media en selectividad Posición que ocupas entre tus hermanos ¿Sabes resolver una ecuación de primer grado? Especialidad en el bachillerato Tiempo de llegada a meta Posición de llegada a meta Motivación hacia el aprendizaje Coeficiente intelectual NOMINAL DICOTÓMICA NOMINAL POLITÓMICA CUANTITATIVA DISCRETA CUANTITATIVA CONTINUA ORDINAL
  • 9. Estadística Descriptiva Inferencial ESTADÍSTICA Variables “Ciencia que nos ayuda a conocer la realidad. Cómo es, cómo ha sido y cómo será. Nos ayuda a recoger datos, organizarlos y visualizar la información que los mismos aportan”(Etxeberria y Tejedor, 2005: 16) Recoge, organiza, resume, describe y presenta los datos correspondientes a un conjunto de variables de una muestra. Generaliza los resultados obtenidos en una muestra a la población objeto de estudio.
  • 10. Estadística POBLACIÓN N = 150 000 n = 150 MUESTRA ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA INFERENCIAL
  • 11. Estadística Estimación, a partir de los estadísticos obtenidos para la muestra, de los parámetros de la población. Cálculo de los estadísticos de una variable, o un grupo de variables, en una muestra. DESCRIPTIVA INFERENCIAL
  • 12.
  • 13.
  • 14.
  • 15. Una variable CUALITATIVA De los 66000 jubilados existentes en la provincia de Salamanca (N=66000), se obtiene una muestra de 1000 personas (n=1000). De esta muestra, 450 son hombres y 550 mujeres. TABLA DE FRECUENCIAS Sexo Frecuencia (fi) Proporción (pi) Porcentaje (Pi) Hombre 450 Mujer 550 Total 1000 p1= 0.45f2= 550
  • 16. Una variable CUALITATIVA MODA Sexo Frecuencia (fi) Proporción (pi) Porcentaje (Pi) Hombre 450 0.45 45% Mujer 550 0.55 55% Total 1000 1 100% Categoría o categorías que tienen una mayor frecuencia absoluta (fi) en una variable La moda en la variable sexo es ser mujer Es el valor o valores que más se repite en la variable En una variable pueden existir 2 o más modas (tantas como puntuaciones)
  • 17. Una variable CUALITATIVA Se ha obtenido una muestra de 200 jóvenes extremeños, de los que 55 son de la provincia de Badajoz…completar tabla! TABLA DE FRECUENCIAS Provincia Frecuencia (fi) Proporción (pi) Porcentaje (Pi) Total 1 100% MODA??
  • 18.
  • 19. Una variable ORDINAL Se obtiene una muestra de 500 estudiantes universitarios (n=500), de los cuales 80 están cursando primero, 200 segundo, 130 tercero y 90 cuarto. TABLA DE FRECUENCIAS Curso Frecuencia (fi) Proporción (pi) Porcentaje (Pi) Primero 80 Segundo 200 Tercero 130 Cuarto 90 Total P3= 26%
  • 20. Una variable ORDINAL Curso Frecuencia (fi) Proporción (pi) Porcentaje (Pi) Primero 80 Segundo 200 Tercero 130 Cuarto 90 Total 500 La moda en la variable ‘curso’ es cursar segundo MODA
  • 21. Percentil: Un percentil (Pk) es una puntuación de la variable xi, que deja por debajo de sí al k% de la muestra o población. Decil (D): P10=D1 P40=D4 Cuartil (Q): P25=Q1 P50=Q2=Mdn P75=Q3 Una variable ORDINAL PERCENTIL
  • 22. Una variable ORDINAL Curso Frecuencia (fi) Proporción (pi) Porcentaje (Pi) Primero 80 Segundo 200 Tercero 130 Cuarto 90 Total 500 PERCENTIL Fr. acumul. (fa) Pr. acumul. (pa)
  • 23. Una variable ORDINAL Curso fi pi Pi Primero 80 0.16 16% Segundo 200 0.40 40% Tercero 130 0.26 26% Cuarto 90 0.18 18% Total 500 1 100% La mediana en la variable ‘curso’ es cursar segundo. Los estudiantes de segundo dejan por debajo de sí al 50% de la muestra. MEDIANA Valor (xi) que ocupa la posición central en una distribución (variable), esto es, el Percentil 50. fa 80 280 410 500 Pa 16% 56% 82% 100% Mdn= Segundo Q2=D5=P50=
  • 24. MEDIANA Medidas de tendencia central Puntuación (xi) que ocupa la posición central en una distribución (variable) Valor central, que deja por debajo de sí al 50% de los sujetos No tiene sentido calcular la mediana en variables cualitativas. Equivale al percentil 50 (P50), decil 5 (D5) ó cuartil 2 (Q2) La mediana es única, sólo puede existir una mediana.
  • 25.
  • 26. Tendencia central Dispersión ESTADÍSTICA DESCRIPTIVA Cálculo de los estadísticos de una variable, o un grupo de variables, en una muestra. Posición Forma - Media - Mediana - Moda - Varianza - Desviación típica - Coeficiente de variación - Percentiles  Deciles Cuartiles - Asimetría - Curtosis Una variable CUANTITATIVA
  • 27. 7.3. Medidas de Posición 7.1. Medidas de Tendencia Central 7.4. Medidas de Forma 7.2. Medidas de Dispersión Una variable CUANTITATIVA
  • 28. Una variable CUANTITATIVA Se mide el Cociente Intelectual (CI) de un grupo de 14 jóvenes en riesgo de exclusión, obteniendo las siguientes puntuaciones. 110, 105, 86, 93, 123, 108, 112, 99, 100, 105, 99, 90, 117, 102 SIEMPRE ordenar de menor a mayor 86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123
  • 29. Una variable CUANTITATIVA Se mide el Cociente Intelectual (CI) de un grupo de 14 jóvenes en riesgo de exclusión, obteniendo las siguientes puntuaciones. 86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123 Tendencia central: MODA La moda en la variable CI para esta muestra es de 99 y 105 En este caso tenemos una distribución bimodal.
  • 30. Una variable CUANTITATIVA Tendencia central: MODA Si las puntuaciones son discretas, pueden estar resumidas en una tabla. En este caso debo tener en cuenta el ni de cada celda. Puntuación ni pi 1 6 0,02 2 15 0,05 3 13 0,04 4 23 0,08 5 56 0,19 6 75 0,25 7 60 0,20 8 42 0,14 9 8 0,03 10 2 0,01 TOTAL 300 1 La moda de la puntuación en la prueba es 6 puntos.
  • 31. Una variable CUANTITATIVA Se mide el Cociente Intelectual (CI) de un grupo de 14 jóvenes en riesgo de exclusión, obteniendo las siguientes puntuaciones. 86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123 Tendencia central: MEDIANA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Si n es impar, el valor de la mediana coincidirá con la puntuación en la variable del sujeto (n+1)/2 Si n es par, el valor de la mediana será el promedio entre las dos puntuaciones intermedias. La puntuación 103.5 es la que deja al 50% de los sujetos por debajo en esta muestra. ???
  • 32. Una variable CUANTITATIVA Tendencia central: MEDIANA Si las puntuaciones son discretas, pueden estar resumidas en una tabla. En este caso debo calcular el na y el pa. Puntuación ni 1 6 2 15 3 13 4 23 5 56 6 75 7 60 8 42 9 8 10 2 TOTAL 300 na pa La mediana se encuentra en la puntuación….
  • 33. Una variable CUANTITATIVA 86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123 Tendencia central: MEDIA Indica el valor promedio de todas las puntuaciones (xi) La media del CI de la muestra de 103.5 puntos
  • 34. Una variable CUANTITATIVA Tendencia central: MEDIA Si las puntuaciones son discretas, pueden estar resumidas en una tabla. En este caso debo tener en cuenta el ni de cada celda. Puntuación ni pi 1 6 0,02 2 15 0,05 3 13 0,04 4 23 0,08 5 56 0,19 6 75 0,25 7 60 0,20 8 42 0,14 9 8 0,03 10 2 0,01 TOTAL 300 1 La media de la puntuación en la prueba es de 5.82
  • 35. Fernando Martínez Abad Susana Olmos Migueláñez Indica el valor promedio de todas las puntuaciones (xi) Se calcula en variables cuantitativas (en las cualitativas no tiene sentido) La media es única, sólo puede existir una media. MEDIA Propiedades 1. Si se suma una constante (k) a todas las xi, la media se incrementa lo que vale k 2. Si se multiplica una constante (k) a todas las xi, la media se multiplica por k 3. El sumatorio de las puntuaciones diferenciales es 0 4. Cálculo de la media ponderada Una variable CUANTITATIVA
  • 36. Fernando Martínez Abad Susana Olmos Migueláñez 7.3. Medidas de Posición 7.1. Medidas de Tendencia Central 7.4. Medidas de Forma 7.2. Medidas de Dispersión Una variable CUANTITATIVA
  • 38. Indica la media de las diferencias entre las puntuaciones observadas (xi) y su media al cuadrado VARIANZA Es la raíz cuadrada de la varianza DESVIACIÓN TÍPICA Son las medidas más importantes de dispersión Una variable CUANTITATIVA: dispersión datos tablas A mayor varianza o desv. típica, mayor dispersión en la variable
  • 39. VARIANZA y DESVIACIÓN TÍPICA Una variable CUANTITATIVA: dispersión CI= {86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123} La varianza de la variable CI es de 96.82, y la desviación típica de 9.84
  • 40. VARIANZA y DESVIACIÓN TÍPICA Una variable CUANTITATIVA: dispersión La varianza de las puntuaciones es de 3.26, y la desviación típica de 1.81 Para puntuaciones son discretas, tener en cuenta el ni de cada celda. Puntuación ni 1 6 2 15 3 13 4 23 5 56 6 75 7 60 8 42 9 8 10 2 TOTAL 300
  • 41. Fernando Martínez Abad Susana Olmos Migueláñez Propiedades de la varianza y la desviación típica 1. Dado que es un número elevado al cuadrado, la varianza y la desviación típica siempre son positivas 2. Si se suma una constante (k) a todas las xi, la varianza y la desviación típica no se alteran. 3. Si se multiplica una constante (k) a todas las xi, la desviación típica se ve multiplicada por k y la varianza por k2 Una variable CUANTITATIVA: dispersión
  • 42. Fernando Martínez Abad Susana Olmos Migueláñez Medida para comparar la dispersión de diferentes variables, que estén medidas con escalas diferentes y/o con muestras distintas La varianza y la desviación típica son medidas absolutas. Así, no se pueden comparar distintas varianzas o desviaciones típicas El coeficiente de variación es una medida relativa, por lo que es un estadístico que sirve para comparar dispersión entre variables medidas con diferentes escalas y/o con muestras distintas COEFICIENTE DE VARIACIÓN (CV) Una variable CUANTITATIVA: dispersión
  • 43. Fernando Martínez Abad Susana Olmos Migueláñez COEFICIENTE DE VARIACIÓN Altura 175 cm 25 cm 60 cm 205 cm Una variable CUANTITATIVA: dispersión
  • 44. Fernando Martínez Abad Susana Olmos Migueláñez COEFICIENTE DE VARIACIÓN Altura 132 cm 125 cm 91.75 cm Una variable CUANTITATIVA: dispersión
  • 45. Fernando Martínez Abad Susana Olmos Migueláñez COEFICIENTE DE VARIACIÓN Ambas variables poseen la misma media en la variable altura, sin embargo, la primera muestra es más dispersa, en concreto 4.17 veces más (75/18) Una variable CUANTITATIVA: dispersión
  • 46. Fernando Martínez Abad Susana Olmos Migueláñez 7.1. Medidas de Tendencia Central 7.4. Medidas de Forma 7.2. Medidas de Dispersión 7.3. Medidas de Posición Una variable CUANTITATIVA
  • 47. PERCENTILES (deciles y cuartiles) Una variable CUANTITATIVA: posición CI= {86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123} Calcular el Q1 P25 1 2 3 4 5 6 7 8 9 10 11 12 13 14 100 25 n=14 X X= 25*14/100= 3,5 La Q1 =99, es decir, hay al menos un 25% de sujetos en la muestra que obtienen menos de 99 puntos.
  • 48. PERCENTILES (deciles y cuartiles) Una variable CUANTITATIVA: posición Para puntuaciones son discretas, calcular pa. Puntuación ni na 1 6 2 15 3 13 4 23 5 56 6 75 7 60 8 42 9 8 10 2 TOTAL 300 D8=… pa
  • 49. Fernando Martínez Abad Susana Olmos Migueláñez 7.1. Medidas de Tendencia Central 7.4. Medidas de Forma Estadística descriptiva 7.2. Medidas de Dispersión 7.3. Medidas de Posición
  • 50. Fernando Martínez Abad Susana Olmos Migueláñez Una variable CUANTITATIVA: forma
  • 51. Valor que indica el grado de simetría que tiene la distribución de la variable X Fernando Martínez Abad Susana Olmos Migueláñez ASIMETRÍA Los valores del coeficiente de asimetría están entre -1 y 1 Si As<0, la distribución es asimétrica negativa Si As>0, la distribución es asimétrica positiva Si As=0, la distribución es simétrica Una variable CUANTITATIVA: forma
  • 52. Fernando Martínez Abad Susana Olmos Migueláñez ASIMETRÍA Asimétrica negativa Simétrica Asimétrica positiva Una variable CUANTITATIVA: forma
  • 53. Valor que indica el grado de elevación que tiene la distribución de la variable X Fernando Martínez Abad Susana Olmos Migueláñez CURTOSIS Si Curt<0, la distribución es platicúrtica Si Curt>0, la distribución es leptocúrtica Si Curt=0, la distribución es mesocúrtica Una variable CUANTITATIVA: forma
  • 54. Fernando Martínez Abad Susana Olmos Migueláñez Medidas de forma CURTOSIS Leptocúrtica Mesocúrtica Platicúrtica
  • 55.
  • 56. Una variable Diagrama de barras (v. cualitativa/ordinal) Diagrama de sectores (v. cualitativa) Histograma y curva de densidad (v. cuantitativa) Diagrama de cajas (v. ordinal/cuantitativa) REPRESENTACIÓN GRÁFICA DE VARIABLES Dos variables Diagr. de barras conjuntas (v. cualitativas/ordinales) Diagrama de dispersión (v. cuantitativas)
  • 57. Diagrama de sectores (v. cualitativas)  El diagrama de sectores se emplea principalmente en la representación de variables cualitativas, aunque también es posible representar variables ordinales y cuantitativas discretas.  El tamaño de los sectores puede representar frecuencias absolutas (ni) o porcentajes (Pi). 525 705 Sexo Hombre Mujer n=1230 42,7% 57,3% Sexo Mujer Hombre
  • 58. Diagrama de barras (v. cualitat./ordinales)  El diagrama de barras se emplea en la representación de variables cualitativas, ordinales y cuantitativas discretas.  La altura de las barras puede representar frecuencias absolutas (ni) o porcentajes (Pi), y cada barra representa una de las categorías o puntuaciones de la variable. 86 327 175 595 47 0 100 200 300 400 500 600 700 Profesores Familia Amigos Solo Otros Fuente de información n=1230 7% 27% 14% 48% 4% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Profesores Familia Amigos Solo Otros Fuente de información
  • 59. Diagrama de cajas (v. ordinales/cuantitativas)  El diagrama de cajas se emplea en la representación de variables continuas.  Muestra la distribución de la variable en función del Q1, Q2 y Q3 P75=Q3 P25=Q1 P50=Q2=D5 Valor máximo Valor mínimo Valor atípico
  • 60. Histograma y curva de densidad  El histograma se emplea en la representación de variables cuantitativas continuas. A diferencia del diagrama de barras, el histograma presenta las barras unidas.  La Curva de densidad puede formar un gráfico por separado o acompañar al histograma en un gráfico conjunto.  La altura de la curva representa la frecuencia de observaciones para una puntuación xi determinada.  El eje vertical (y) representa frecuencias absolutas (ni) o porcentajes (Pi), y el eje horizontal la escala de la variable.
  • 61. Histograma y curva de densidad
  • 62. Diagrama de barras conjuntas (v. cualitat./ord.)  El diagrama de dispersión se emplea en la representación de dos o más variables cuantitativas continuas. Permite comparar la distribución de dos variables, observando su relación.  Se trata de la representación gráfica de una tabla de contingencia. Bajo Medio Alto España 60 35 5 Alemania 40 85 25 60 35 5 40 85 25 0 20 40 60 80 100 Bajo Medio Alto España Alemania
  • 63. Diagrama de dispersión (v. cuantitativas)  El diagrama de dispersión se emplea en la representación de dos o más variables cuantitativas continuas. Permite comparar la distribución de dos variables, observando su relación.  El eje vertical representa las puntuaciones de la variable ‘y’ y el vertical las de la variable ‘x’. 0 2 4 6 8 10 12 14 16 18 20 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 (4, 9) (9, 12) X Y 9 12 10 12 5 7 13 18 8 7 2 5 4 9 3 5 9 15
  • 64. Gráficos o diagramas engañosos  El gráfico, en función de cómo se represente, puede estar presentado de tal manera que dé lugar a interpretaciones erróneas.  La escala en la que se presenta la información es clave. GC GE Pretest 6,43 6,25 Postest 6,53 6,55 6,2 6,25 6,3 6,35 6,4 6,45 6,5 6,55 6,6 Pretest Postest GC GE 0 2 4 6 8 10 Pretest Postest GC GE
  • 65.
  • 66. Coeficiente de correlación Fernando Martínez Abad Susana Olmos Migueláñez El coeficiente de correlación mide la relación entre dos variables. Indica el tipo de relación entre dos variables y la intensidad de la relación. TIPO DE RELACIÓN: DIRECTA  Valores positivos INVERSA  Valores negativos NULA  Cero INTENSIDAD DE LA RELACIÓN: ALTA  Valores cercanos a 1 o -1 BAJA  Valores cercanos a 0
  • 67. Coeficiente de correlación Fernando Martínez Abad Susana Olmos Migueláñez RELACIÓN DIRECTA Tendencia de que a valores altos en la primera variable (X), corresponden valores altos de la segunda (Y), y viceversa. 0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14
  • 68. Coeficiente de correlación Fernando Martínez Abad Susana Olmos Migueláñez RELACIÓN INVERSA Tendencia de que a valores altos en la primera variable (X), corresponden valores bajos de la segunda (Y), y viceversa. 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 14
  • 69. Coeficiente de correlación Fernando Martínez Abad Susana Olmos Migueláñez RELACIÓN NULA No se observa ninguna tendencia lineal. 40 50 60 70 80 90 100 110 0 2 4 6 8 10 12 14
  • 70.
  • 71. Bajo Medio Alto TOTAL España Alemania TOTAL Tabla de contingencia La tabla de contingencia presenta la información conjunta de dos variables cualitativas y/o ordinales. Se obtiene una muestra de 250 familias, 150 alemanas y 100 españolas. Se mide el nivel de ingresos, y resulta que 60 familias de las 100 que resultaron con ingresos bajos eran españolas, 120 familias tuvieron ingresos medios y 25 familias alemanas declararon tener ingresos altos.
  • 72. Tabla de contingencia Bajo Medio Alto TOTAL España 60 35 5 100 % España Alemania 40 85 25 150 % Alemania TOTAL 100 120 30 250 % TOTAL El porcentaje por filas indica la proporción de personas que, perteneciendo al grupo que indica la fila, cumplen la condición de la columna respectiva.
  • 73. Bajo % Bajo Medio % Medio Alto % Alto TOTAL % TOTAL España 60 35 5 100 Alemania 40 85 25 150 TOTAL 100 120 30 250 Tabla de contingencia El porcentaje por columnas indica la proporción de personas que, perteneciendo al grupo que indica la columna, cumplen la condición de la fila respectiva.
  • 74. Bajo Medio Alto TOTAL España 60 35 5 100 Alemania 40 85 25 150 TOTAL 100 120 30 250 Tabla de contingencia El porcentaje total indica la proporción de personas que representa la frecuencia de cada celda con respecto al total de sujetos.
  • 75. CUANTITATIVA ORDINAL CUALITATIVA POLITÓMICA CUALITATIVA DICOTÓMICA CUANTITATIVA PEARSON SPEARMAN BISERIAL PUNTUAL ORDINAL SPEARMAN COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA POLITÓMICA COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA DICOTÓMICA COEFICIENTE FICOEFICIENTE FI Coeficiente de correlación en función del tipo de variables
  • 76. Coeficiente fi (Φ) El coeficiente fi mide la relación entre dos variables cualitativas dicotómicas. Hombre Mujer Aciertos a b Errores c d fi>0 indica mayores proporciones en a y d fi<0 indica mayores proporciones en b y c
  • 77. CUANTITATIVA ORDINAL CUALITATIVA POLITÓMICA CUALITATIVA DICOTÓMICA CUANTITATIVA PEARSON SPEARMAN BISERIAL PUNTUAL ORDINAL SPEARMAN COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA POLITÓMICA COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA DICOTÓMICA COEFICIENTE FI Coeficiente de contingencia COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA
  • 78. Coeficiente de contingencia (CC) El coeficiente de contingencia mide la relación entre dos variables cualitativas. ya sean dicotómicas o politómicas. Casado Divorciado Viudo TOTAL FILAS Con afectación severa 35 (56%) 15 (24%) 12 (20%) 62 (100%) Sin afectación severa 5 (10%) 30 (63%) 13 (27%) 48 (100%) TOTAL COLUMNAS 40 45 25 n=110 - El coeficiente de contingencia tiene valores entre 0 y 1. - Valores cercanos a 1 indican que los porcentajes por filas de cada columna (o viceversa) son muy diferentes. A mayores diferencias en %, mayor CC CC=0,438
  • 79. Coeficiente de contingencia (CC) Casado Divorciado Viudo TOTAL Con afectación severa 35 (56%) 15 (24%) 12 (20%) 62 Sin afectación severa 5 (10%) 30 (63%) 13 (27%) 48 TOTAL 40 45 25 n=110 Casado Divorciado Viudo TOTAL Con afectación severa 25 (40%) 20 (33%) 17 (27%) 62 Sin afectación severa 20 (42%) 15 (31%) 13 (27%) 48 TOTAL 45 35 30 n=110 ¿Mayor o Menor? CC=0,438
  • 80.
  • 81. CUANTITATIVA ORDINAL CUALITATIVA POLITÓMICA CUALITATIVA DICOTÓMICA CUANTITATIVA PEARSON SPEARMAN BISERIAL PUNTUAL ORDINAL SPEARMAN COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA POLITÓMICA COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA DICOTÓMICA COEFICIENTE FI Coeficiente de correlación en función del tipo de variables PEARSON
  • 82. DOS VARIABLES CUANTITATIVAS Fernando Martínez Abad Susana Olmos Migueláñez El coeficiente de correlación de Pearson mide la relación entre dos variables cuantitativas. - Valores cercanos a 1 indican que a medida que aumenta una variable, aumenta la otra (relación directa). - Valores cercanos a -1 indican que a medida que aumenta una variable disminuye la otra (relación inversa). - Valores cercanos a 0 indican que no existe relación entre las dos variables (relación nula).
  • 83.
  • 84. CUANTITATIVA ORDINAL CUALITATIVA POLITÓMICA CUALITATIVA DICOTÓMICA CUANTITATIVA PEARSON SPEARMAN BISERIAL PUNTUAL ORDINAL SPEARMAN COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA POLITÓMICA COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA DICOTÓMICA COEFICIENTE FI Coeficiente de correlación en función del tipo de variables SPEARMAN SPEARMAN
  • 85. DOS VARIABLES ORDINALES El coeficiente de correlación de Spearman mide la relación entre dos variables ordinales o entre una ordinal y otra cuantitativa. - Valores cercanos a 1 indican que a medida que aumenta una variable, aumenta la otra (relación directa). ESTUDIOS PADRE ESTUDIOS MADRE Sin estudios Básico Secundario Universitario Sin estudios 10 6 1 0 Básico 4 22 12 6 Secundario 0 8 40 20 Universitario 2 2 11 69 0 5 10 15 20 25 30 35 40 Pobre En vías Emergente Rico Baja Media Alta Muy alta
  • 86. DOS VARIABLES ORDINALES El coeficiente de correlación de Spearman mide la relación entre dos variables ordinales o entre una ordinal y otra cuantitativa. - Valores cercanos a -1 indican que a medida que aumenta una variable disminuye la otra (relación inversa). NIVEL SOCIO-ECONÓMICO PAÍS NIVEL CRIMINALIDAD PAÍS Pobre En vías Emergente Rico Baja 0 1 6 26 Media 4 8 30 4 Alta 10 12 8 2 Muy alta 35 9 0 1 0 5 10 15 20 25 30 35 40 Pobre En vías Emergente Rico Baja Media Alta Muy alta
  • 87.
  • 88. CUANTITATIVA ORDINAL CUALITATIVA POLITÓMICA CUALITATIVA DICOTÓMICA CUANTITATIVA PEARSON SPEARMAN BISERIAL PUNTUAL ORDINAL SPEARMAN COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA POLITÓMICA COEFICIENTE DE CONTINGENCIA COEFICIENTE DE CONTINGENCIA CUALITATIVA DICOTÓMICA COEFICIENTE FI BISERIAL PUNTUAL Coeficiente de correlación en función del tipo de variables
  • 89. Correlación biserial-puntual (rbp) El coeficiente de correlación biserial-puntual mide la relación entre una variable cualitativa dicotómica y otra variable cuantitativa. - Valores positivos indican que los sujetos del grupo 1 tienen una puntuación media más alta que los del grupo 0. - Valores negativos indican que los sujetos del grupo 1 tienen una puntuación media más baja que los del grupo 0. - El coeficiente de correlación biserial-puntual adopta valores entre -1 y 1.
  • 90. Correlación biserial-puntual (rbp) Se quiere comprobar si el sexo de los 12 jóvenes (14-16 años) que habitan una casa de acogida tiene relación con sus habilidades sociales (medidas mediante la escala EHS escolar. con puntuaciones de 1 a 100). Las puntuaciones son las que se muestran: Sexo Punt. EHS Hombre 25 Hombre 33 Hombre 70 Hombre 12 Hombre 50 Hombre 15 Hombre 26 Mujer 99 Mujer 85 Mujer 37 Mujer 49 Mujer 95 rbp ¿positivo o negativo?
  • 91.
  • 92. Regresión lineal La regresión es una técnica estadística empleada para predecir los valores de una variable y (variable criterio o dependiente) a partir de la una o más variables x (variables predictoras o independientes). Regresión lineal simple: Sólo hay una variable predictora o independiente (x) Regresión lineal múltiple: Existen 2 o más var. predictoras o independientes (x) La regresión lineal se puede aplicar sólo cuando las variables dependientes son cuantitativas, y las independientes cuantitativas y/o dicotómicas.
  • 93. Regresión lineal simple La regresión lineal consiste en el cálculo de la recta de regresión, que es la recta que mejor se ajusta a la nube de puntos del diagrama de dispersión. “La recta de regresión será aquella que minimice el cuadrado de las distancias entre los puntos y la recta. Por tanto, para averiguar la ecuación de la recta de regresión, tenemos que calcular los valores a y b que hagan mínima la suma de todas las d2, donde d representa la diferencia entre el punto y la recta d=y- (a+bx)” (Etxeberría y Tejedor, 2005, p.216)
  • 94. Ecuación de regresión simple y’= Valores pronosticados en y para un valor concreto en x a = Ordenada en el origen (punto de corte de la recta con el eje y) b = Pendiente de la recta de regresión ε = Error de la predicción (diferencia entre el valor pronosticado y el real para un sujeto)
  • 95. Ecuación de regresión simple 0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 ε=-4 (4, 2.4) (9.1, 12) No hay error!!
  • 96. Recta de regresión simple RECTA CRECIENTE: En este caso, a medida que aumenta el valor de x, aumenta el de y. Así, la el valor de b (pendiente) es positivo, al igual que el del coeficiente de correlación. 0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 a = ? b?
  • 97. Recta de regresión RECTA DECRECIENTE: A medida que aumenta el valor de x, el valor de y disminuye. Así, el valor de b (pendiente) es negativo, al igual que el del coeficiente de correlación. 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 14 a = ? b ?
  • 98. Ecuación de regresión múltiple Mientras que en la regresión simple el modelo calcula 2 valores (parámetros), a y b, en la regresión múltiple se va añadiendo un parámetro nuevo por cada variable nueva incluida como predictora en el modelo. 𝒚′ = 𝒂 + 𝒃𝒙 𝟏 + 𝒄𝒙 𝟐 + 𝒅𝒙 𝟑 + ⋯ + 𝜺
  • 99. Bondad de ajuste de la ecuación de regresión Para medir la bondad de ajuste de la ecuación de regresión, esto es, el error cometido al predecir los valores de y a partir de un valor xi, se emplea el coeficiente de determinación (R2). El coeficiente de determinación tiene valores entre 0 y 1. Indica la proporción o porcentaje de variabilidad explicada por el modelo, esto es, la “proporción de los cambios de la variable criterio que son explicados por la variable predictora” (Etxeberría y Tejedor, 2005, p. 223). R2 = (rxy)2
  • 100. Bondad de ajuste de la ecuación de regresión
  • 101. Regresión simple Act. Psicótica Empatía Comunicación Peso 2 10 12 80 9 5 6 56 8 6 10 95 3 9 15 67 1 13 18 85 9 5 6 76 11 4 3 69 3 9 12 105 7 3 5 101 13 2 5 96 8 5 7 51 6 4 9 48 1 9 8 68 2 8 7 82 Queremos predecir la actitud psicótica (variable dependiente ‘y’) a partir de la empatía, las habilidades comunicativas y el peso (variables independientes ‘x’) de un grupo de adolescentes:
  • 102. Regresión simple 1. ¿Existe relación lineal entre las variables? 0 5 10 15 20 25 30 35 0 2 4 6 8 Empatía Actitudpsicótica 0 5 10 15 20 25 30 35 0 2 4 6 8 Comunicación Actitudpsicótica 0 5 10 15 20 25 30 35 0 2 4 6 8 Peso Actitudpsicótica rxy= -0.87 rxy= -0.71 rxy= -0.04
  • 103. Regresión simple 2. Valores de los parámetros y ecuación de regresión Act. Psicót. (Y) Empatía (X) 2 10 9 5 8 6 3 9 1 13 9 5 11 4 3 9 7 3 13 2 8 5 6 4 1 9 2 8 Y’ εi rxy= -0.87 a= 13.17 b= -1.1 Y’ = 13.17 – 1.1 * X Yi = 13.17 – 1.1 * Xi + εi
  • 104. Regresión simple 2. Valores de los parámetros y ecuación de regresión Y’ 3,66 7,68 5 1,65 -0,36 7,68 9,69 3,66 8,35 8,35 7,01 5,67 6,34 7,01 εi -1,66 1,32 3 1,35 1,36 1,32 1,31 -0,66 -1,35 4,65 0,99 0,33 -5,34 -5,01 Act. Psicót. (Y) Comunic. (X) 2 12 9 6 8 10 3 15 1 18 9 6 11 3 3 12 7 5 13 5 8 7 6 9 1 8 2 7 rxy= -0.71 a= 11. 7 b= -0.67 Y’ = 11.7 – 0.67 * X Yi = 11. 7 – 0.67 * Xi + εi
  • 105. Regresión simple rxy= -0.87 3. Bondad de ajuste del modelo R2= (-0,87)2=0.77  77% Act. Psic. (Y) Empatía (X) 2 10 9 5 8 6 3 9 1 13 9 5 11 4 3 9 7 3 13 2 8 5 6 4 1 9 2 8 Y’ 2,17 7,67 6,57 3,27 -1,13 7,67 8,77 3,27 9,87 10,97 7,67 8,77 3,27 4,37 εi -0,17 1,33 1,43 -0,27 2,13 1,33 2,23 -0,27 -2,87 2,03 0,33 -2,77 -2,27 -2,37 S2 y= 14.35 S2 y’= 11.05 S2 ε= 3.30 S2 y = S2 y’ + S2 ε 14.35 = 11.05 + 3.30 R2= 0.77 = 11.05 / 14.35
  • 106. Regresión simple y múltiple rxy= -0.71 3. Bondad de ajuste del modelo R2= (-0,71)2=0.51  51% S2 y= 14.35 S2 y’= 7.28 S2 ε= 7.07 S2 y = S2 y’ + S2 ε 14.35 = 7.28 + 7.07 R2= 0.51 = 7.28 / 14.35 Y’ 3,66 7,68 5 1,65 -0,36 7,68 9,69 3,66 8,35 8,35 7,01 5,67 6,34 7,01 εi -1,66 1,32 3 1,35 1,36 1,32 1,31 -0,66 -1,35 4,65 0,99 0,33 -5,34 -5,01 Act. Psic. (Y) Comun. (X) 2 12 9 6 8 10 3 15 1 18 9 6 11 3 3 12 7 5 13 5 8 7 6 9 1 8 2 7
  • 107. Regresión simple El modelo de regresión explica el 77% de la varianza total. La empatía explica el 77% de la variabilidad de la actitud psicótica. Existe un 23% de variabilidad no explicada en el modelo.
  • 108. Regresión simple Existe un 49% de varianza total de la actitud psicótica que no explican las habilidades de comunicación.
  • 109. Regresión simple Los kilogramos que pesa una persona no ayudan en explicar su actitud psicótica.
  • 110. Regresión múltiple Dado que la empatía y las habilidades en comunicación son explicativas de las actitudes psicóticas, podemos plantear el modelo de regresión múltiple: En este caso, la solución de la ecuación de regresión con 2 variables predictoras es un plano en un espacio tridimensional.
  • 111. Regresión múltiple Act. Psicótica Empatía Comunicación 2 10 12 9 5 6 8 6 10 3 9 15 1 13 18 9 5 6 11 4 3 3 9 12 7 3 5 13 2 5 8 5 7 6 4 9 1 9 8 2 8 7 Actitud psicótica Hab. comunicación Empatía
  • 112. Regresión múltiple ¿Por qué sólo ha mejorado un 1% la bondad de ajuste al incorporar las dos variables conjuntamente, si ambas tenían un buen ajuste en el modelo de regresión simple?
  • 113. Regresión múltiple ¿Por qué sólo ha mejorado un 1% la bondad de ajuste al incorporar las dos variables conjuntamente, si ambas tenían un buen ajuste en el modelo de regresión simple? Hab. comunicación Empatía rxy empatía-comunicac. rxy = 0.845 Empatía y comunicación correlacionan de manera alta, por lo que parece que son variables que están explicando lo mismo. Así, el nivel explicativo conjunto, con respecto al individual, crece muy poco…
  • 114.
  • 115. Puntuaciones individuales Los estadísticos de tendencia central, de dispersión y de forma nos aportan una visión general sobre el comportamiento de una variable. Sin embargo, en ocasiones, nos interesa conocer, más que el comportamiento de las variables, el comportamiento de sujetos u observaciones concretas en una o varias variables. En este caso, los estadísticos descriptivos no nos sirven para este fin. La tipificación o estandarización de las variables es el procedimiento empleado en estos casos
  • 116. Tipificación o estandarización Tipificar o estandarizar una variable es ajustarla a una norma, es decir, modificar las puntuaciones directas (xi) de manera que la variable creada (zi) tenga una media y una desviación típica determinadas previamente. Cuando se estandariza una variable se modifican los estadísticos de tendencia central y de dispersión, pero NUNCA los de forma y posición. xi di zi Z(0, 1)
  • 117. Tipificación o estandarización Medimos las habilidades sociales de un grupo de adolescentes con problemas de comportamiento ASERTIVIDAD Una vez estudiado el comportamiento del grupo, nos interesa ver qué habilidades sociales posee un joven en particular: COMUNICACIÓNEMPATÍA TIPIFICO (z)ASERTIVIDAD EMPATÍA COMUNICACIÓN 22 18 11.5 xi ASERTIVIDAD EMPATÍA COMUNICACIÓN zi
  • 118. A partir de las puntuaciones zi, que tienen una distribución Z(0, 1), podemos obtener cualquier distribución deseada R(𝑅, 𝑆𝑟), en función de nuestros intereses. Puntuaciones típicas derivadas 𝒓𝒊 = 𝑹 + (𝑺 𝒓 ∗ 𝒛𝒊) 𝑿 = 𝟏𝟎 𝑺 𝒙 = 𝟓 𝒛𝒊 = 𝟏𝟎 − 𝒙𝒊 𝟓 𝒎𝒊 = 𝟓 + (𝟏 ∗ 𝒛𝒊) M(5, 1) Z(0, 1) M(5, 1)
  • 119. Utilidad de tipificar o estandarizar a puntuaciones zi: Se obtiene una única escala métrica para todas las variables, por lo que podemos comparar unos resultados con otros con más objetividad y realismo que si comparamos las puntuaciones directas. Podemos comparar cualquier grupo de variables, sea cual sea su naturaleza. Tipificación o estandarización Las puntuaciones que están por encima de la media son positivas y las que están por debajo negativas, por lo que se facilita la interpretación de las puntuaciones individuales. Con las puntuaciones típicas se pueden localizar mejor los resultados atípicos o extremos.
  • 120. A partir de las puntuaciones zi, que tienen una distribución Z(0, 1), podemos obtener cualquier distribución deseada, en función de nuestros intereses. Puntuaciones típicas derivadas Z(0, 1) T(50, 15) S(100, 10)= 6 Sx = 2 xi di zi ti si 8 5 6 9 3 4 7
  • 121.
  • 122. • POBLACIONES INABARCABLES • Agresividad de jóvenes internados en centros de acogida » Recursos limitados » Excesivo numero de casos » Réplicas de la investigación ESTADÍSTICA INFERENCIAL “Conjunto de técnicas para llegar a inducciones (o inferencias) acerca de una población completa basándose en datos de una muestra integrante de la misma” (Welkowitz, Ewen & Cohen, 1981, p. 106) La Investigación en Ciencias Sociales
  • 123. Intervalos de confianza Gracias a la inferencia estadística, partiendo de unas condiciones específicas de las distribuciones de las variables, podré afirmar que, partiendo de una muestra determinada y con un error concreto, el valor de un parámetro poblacional se encuentra dentro de un intervalo dado.
  • 124. Suponiendo que la muestra es representativa y que la variable es normal Intervalos de confianza Error= 5%  Z0.95=1.96 Error= 5%  Z0.95=1.96 Error= 1%  Z0.99=2.58 Error= 1%  Z0.99=2.58 𝑰. 𝑪. → 𝜽 ± (𝒁 𝟏−𝜶 ∗ 𝑺 𝑿) 𝑺 𝑿 = 𝟏 𝑺 𝑿 = 𝟑 𝑺 𝑿 = 𝑺 𝒙 𝟐 𝒏 − 𝟏
  • 125. La hipótesis estadística La inferencia estadística se basa en la formulación de hipótesis acerca de los parámetros, y consiste en contrastar si esa hipótesis es cierta o falsa. Error= 5% Z0.95=1.96 ¿Se puede afirmar, con un error del 5%, que la media poblacional de esta variable es 7.5? H0: µ = 7.5 H1: µ ≠ 7.5 ¿Acepto o rechazo la H0? 𝑺 𝑿 = 𝟏
  • 126. La inferencia estadística se basa en la formulación de hipótesis acerca de los parámetros, y consiste en contrastar si esa hipótesis es cierta o falsa. Error= 1% Z0.99=2.58 ¿Y con un error del 1%, se puede afirmar que la media poblacional es 7.5? H0: µ = 7.5 H1: µ ≠ 7.5 La hipótesis estadística ¿Acepto o rechazo la H0? 𝑺 𝑿 = 𝟏
  • 127. Se observa mejor este procedimiento de manera gráfica: Error= 5%H0: µ = 7.5 H1: µ ≠ 7.5 8.04 11.96 7.5 Zona de Aceptación de H0 Rechazo H0 Rechazo H0 ¿ACEPTO O RECHAZO H0? La hipótesis estadística 𝑺 𝑿 = 𝟏
  • 128. Se observa mejor este procedimiento de manera gráfica: Error= 1% 7.42 12.58 7.5 Zona de Aceptación de H0 Rechazo H0 Rechazo H0 H0: µ = 7.5 H1: µ ≠ 7.5 La hipótesis estadística ¿ACEPTO O RECHAZO H0? 𝑺 𝑿 = 𝟏
  • 129. ¿Y si lo que quiero es comparar grupos? ¿Es la media de hombres y mujeres igual en la variable X?: Error= 5% Zona de Aceptación de H0 ZONA DE ACEPTACIÓN!!! ACEPTO H0 No existen diferencias significativas entre hombres y mujeres H0: µ1 = µ2 H1: µ1 ≠ µ2 La hipótesis estadística 8.08 15.9214.08 21.92 𝑺 𝑿 = 𝟐
  • 130. • Hipótesis nula (H0): Conjetura que se pone a prueba con el contraste. Se acepta o se rechaza. • Hipótesis alternativa (H1): Es la hipótesis complementaria (opuesta) a la H0. • Región de rechazo (RR): Conjunto de valores para los que se rechaza H0. Existe también, por tanto una región de aceptación (RA). • Nivel de significación o error tipo I (α): Probabilidad de rechazar la H0 cuando esta es verdadera (Normalmente 0,05 o del 5%). La formulación de hipótesis
  • 131. • Ej. 1: Sabemos que para el conjunto de la población de mujeres maltratadas en España, la media obtenida en el “Test de Depresión de Hamilton” es de 24 puntos. Hemos obtenido una muestra de 50 mujeres que han sufrido violencia de género, y tras aplicar el citado test, obtenemos que X = 20; SX = 1,5. ¿Podemos afirmar a un nivel de significación del 5% que la media obtenida en nuestros datos procede de la población? » H0: µ = 24 » H1: µ ≠ 24 » Si p≥0,05  Acepto H0 » Si p<0,05  Rechazo H0 La formulación de hipótesis
  • 132. • Sig (p.)> 0,05  Acepto Hipótesis nula (H0): La hipótesis nula siempre es la de igualdad. Interpretación de resultados en software estadístico P<0,05 RH0 P>0,05 AH0 P>0,05 AH0 • Sig (p.)< 0,05  Rechazo Hipótesis nula (H0): Existen diferencias significativas entre grupos.
  • 133. • MUESTREO – La muestra seleccionada debe ser representativa de la población de la que procede. • NORMALIDAD – Las variables cuantitativas sobre las que se va a realizar la inferencia deben ajustarse a la distribución normal. • HOMOCEDASTICIDAD – En el caso de que se contrasten varias variables cuantitativas, estas deben poseer varianzas semejantes. Condiciones para la inferencia
  • 134. • Muestreo probabilístico (simple, sistemático, por conglomerados, por estratos, etc.) – Todas las muestras de la población tienen las mismas probabilidades de ser seleccionadas. • Tamaño de muestra – Para asegurarme (con una probabilidad determinada) de que los estadísticos de la muestra se acercan a los parámetros poblacionales, deberé seleccionar un tamaño de muestra mínimo: Muestreo representativo
  • 135.  La distribución normal N( , Sx) es una distribución teórica que aparece con mucha frecuencia cuando en ciencias sociales medimos una variable.  Las características sociológicas, psicológicas, educativas, etc. de las poblaciones estudiadas suelen ajustarse a la distribución normal.  En estos casos, a medida que aumenta el tamaño de la muestra con el que se mide una variable, la distribución de esa variable tenderá hacia las características de la distribución normal  Cuando una variable se ajusta a la distribución normal, entonces Z(0, 1)  N(0, 1) Distribución normal
  • 136. Distribución normal 0.15% 2.25% 15.85% 50% Simétrica Mesocúrtica As=0 Curt=0 84.15% 97.75% 99.85% media mediana moda
  • 137. • Distribución de la variable sobre la que se aplica inferencia similar a la distribución de la curva normal – CURTOSIS MESOCÚRTICA (Curt=0) – SIMETRÍA (As=0)  Media=Moda=Mediana » Prueba de Kolmogorov-Smirnov • H0: La variable se ajusta a la curva normal  p ≥ α • H1: La variable no se ajusta a la curva normal  p < α Normalidad de las variables
  • 138. • Varianzas similares de las variables cuantitativas sobre las que se contrastan parámetros – Estudio de la dispersión de los datos (Diagrama de cajas) » Prueba de Levene • H0: Las variables tienen varianzas iguales  p ≥ α • H1: Las variables no tienen varianzas iguales  p < α Homocedasticidad de las variables
  • 139. • En el caso del cumplimiento de la condición de normalidad emplearemos técnicas paramétricas (basadas en la distribución normal de las variables). • En el caso de que no se cumpla esta condición emplearemos técnicas no paramétricas (basadas en la mediana y no la media). Condiciones para la inferencia
  • 140. Contraste PARAMÉTRICO o NO PARAMÉTRICO PARAMÉTRICA ESTADÍSTICA INFERENCIAL Cálculo de los parámetros de una población. NO PARAMÉTRICA - Prueba T para grupos independientes - Prueba T para grupos relacionados - ANOVA - Prueba de independencia Chi cuadrado - U de Mann-Whitney para 2 grupos independientes - W de Wilcoxon para 2 grupos relacionados - H de Kruskal-Wallis para k grupos independientes
  • 141. CUANTITATIVA ORDINAL CUALITATIVA POLITÓMICA CUALITATIVA DICOTÓMICA CUANTITATIVA PRUEBA DE T GRUPOS REL. ANOVA ANOVA PRUEBA DE T GRUPOS INDEP. W de WILCOXON H de KRUSKAL- WALLIS H de KRUSKAL- WALLIS U de MANN- WHITNEY ORDINAL CHI CUADRADO CHI CUADRADO CHI CUADRADO CUALITATIVA POLITÓMICA CHI CUADRADO CHI CUADRADO CUALITATIVA DICOTÓMICA CHI CUADRADO Contraste PARAMÉTRICO o NO PARAMÉTRICO
  • 142. Las distribuciones de las variables cuantitativas estudiadas se ajustan a la distribución normal
  • 143. Técnicas paramétricas • Si se verifica la normalidad de las variables cuantitativas (contraste de KOLMOGOROV-SMIRNOV), aplico técnicas paramétricas: H0: La distribución es normal H1: La distribución no es normal Acepto la H0 de que la distribución de la variable FELICIDAD es normal, por lo que puedo aplicar técnicas paramétricas
  • 144.
  • 145. • Diferencia de medias: Prueba t muestras independientes ¿Existen diferencias en la altura de la población en función del sexo? • H0: µ1 = µ2 • H1: µ1 ≠ µ2 H0: µ1 = µ2 H1: µ1 ≠ µ2 ¿¿?? Una variable cuantitativa y una variable dicotómica Existen diferencias significativas entre hombres y mujeres en lo que respecta a la altura. Técnicas paramétricas
  • 146. • Análisis de Varianza (ANOVA): ¿La comprensión lectora se ve afectada por el nivel sociocultural? • H0: µ1 = µ2 = µ3 • H1: µ1 ≠ µ2 ≠ µ3 ¿¿?? H0: µ1 = µ2 = µ3 H1: µ1 ≠ µ2 ≠ µ3 Técnicas paramétricas Una variable cuantitativa y una variable politómica u ordinal Existen diferencias entre los grupos en comprensión lectora, por lo que diferentes niveles socioculturales afectan a esta variable
  • 147.
  • 148. • Diferencia de medias: Prueba t muestras relacionadas ¿Existen diferencias entre la felicidad y la satisfacción con la vida personal de la población? • H0: µ1 = µ2 • H1: µ1 ≠ µ2 ¿¿?? Técnicas paramétricas Dos variables cuantitativas Existen diferencias significativas entre la felicidad y la satisfacción con la vida personal de los sujetos.
  • 149. Las distribuciones de las variables cuantitativas estudiadas NO se ajustan a la distribución normal y/o no existe homocedasticidad entre las variables
  • 150. Técnicas no paramétricas • Si no existe normalidad en las variables cuantitativas (contraste de KOLMOGOROV-SMIRNOV), aplico técnicas no paramétricas: H0: La distribución es normal H1: La distribución no es normal Rechazo la H0 de que la distribución de la variable FELICIDAD no es normal, y NO puedo aplicar técnicas paramétricas
  • 151.
  • 152. • Prueba U de Mann-Whitney ¿Existen diferencias en la felicidad de la población en función del sexo? • H0: θ1 = θ2 • H1: θ1 ≠ θ2 ¿¿?? Una variable cuantitativa y una variable dicotómica Técnicas NO paramétricas No existen diferencias significativas entre hombres y mujeres en el nivel de felicidad declarado.
  • 153. • Test de Kruskal-Wallis ¿La felicidad se ve afectada por los estudios del sujeto? • H0: θ1 = θ2 = θ3 • H1: θ1 ≠ θ2 ≠ θ3 ¿¿?? H0: θ1 = θ2 = θ3 H1: θ1 ≠ θ2 ≠ θ3 Una variable cuantitativa y una variable politómica u ordinal Técnicas NO paramétricas El nivel de estudios influye en la felicidad de los sujetos. Parece que a mayor nivel de estudios, mayor felicidad.
  • 154.
  • 155. • Prueba de Wilcoxon ¿Existen diferencias entre la felicidad y la satisfacción con la vida personal de la población? • H0: θ1 = θ2 • H1: θ1 ≠ θ2 ¿¿?? Dos variables cuantitativas Existen diferencias significativas entre la felicidad y la satisfacción con la vida personal de los sujetos. Técnicas NO paramétricas
  • 156.
  • 157. • Prueba Chi cuadrado (c2) ¿Depende el uso de internet en los últimos 12 meses de los estudios que ha alcanzado el sujeto? • H0: Las variables son independientes • H1: Las variables no son independientes ¿¿?? Pareja de variables ordinales y/o cualitativas Las variables no son independientes, por lo que el empleo de internet depende del nivel de estudios Técnicas NO paramétricas
  • 158. BIBLIOGRAFÍA Etxeberría, J. y Tejedor, F. J. (2005). Análisis descriptivo de datos en educación. Madrid: La Muralla. Tejedor, F. J. y Etxeberría, J. (2006). Análisis Inferencial De Datos En Educación. Manuales de metodología de investigación educativa. Madrid: La Muralla. Welkowitz, J. (1981). Estadística aplicada a las ciencias de la educación. Madrid: Santillana.
  • 159.