Análisis de datos en Ciencias Sociales

Índice de la asignatura
• T1. Introducción a la investigación científica
• ¿Qué es investigar?
• Investigación educativa
• El proceso de la Investigación Científica
• T2. El proceso en investigaciones educativas
• Objetivos e hipótesis
• Diseños de investigación
• Tipos de variables
• Población y muestra: Técnicas de muestreo
• T3. Instrumentos de recogida de información
• Observación
• Técnicas de encuesta: entrevista y cuestionario (escalas de actitud y pruebas objetivas)
• Técnicas grupales
• T4. Análisis de datos en Ciencias Sociales (cuantitativo)
• Análisis descriptivo de datos
• Análisis inferencial de datos

Procesogeneraldeinvestigación
2º REVISIÓN BIBLIOGRÁFICA. FUENTES DOCUMENTALES
3º SELECCIÓN DEL MÉTODO Y DISEÑO DE INVESTIGACIÓN
FORMULACIÓN DE HIPÓTESIS
VARIABLES
1º PLANTEAMIENTO DEL PROBLEMA. SELECCIÓN DE UN TEMA A INVESTIGAR
SELECCIÓN DE LA MUESTRA
PLANIFICACIÓN DE LA OBTENCIÓN DE INFORMACIÓN Y ANÁLISIS DE DATOS
4º TÉCNICA DE RECOGIDA DE DATOS
5º TÉCNICA DE ANÁLISIS DE DATOS
6º CONCLUSIONES-REDACCIÓN DE INFORME

INSTRUMENTOS
VARIABLES
FIABILIDAD
Consistencia: La medida repetida en
las mismas condiciones devuelve
resultados iguales
VALIDEZ
medir realmente
aquello que se
pretende medir
Recogida de información

Tipos de Variables
DICOTÓMICAS
POLITÓMICAS
Sexo
Sí/no
Acierto/error
Comunidad autónoma
Estado civil
Color de ojos
Establecen orden o nivel
ORDINALES
Orden de llegada/alfabético/puntuaciones
Curso en la titulación
Bajo/medio/alto
DISCRETAS
CONTINUAS
Año de nacimiento
Número de objetos (libros, ordenadores,
…) o elementos (hermanos, …)
Peso
Estatura
Nº indivisibles (enteros)
Nº en una escala continua (decimales)
Establecen categorías
CUALITATIVAS
o
NOMINALES
Forman una escala
CUANTITATIVAS

Tipos de Variables
Número de créditos matriculados
¿Tienes carné de conducir?
Nota media en selectividad
Posición que ocupas entre tus hermanos
¿Sabes resolver una ecuación de primer grado?
Especialidad en el bachillerato
Tiempo de llegada a meta
Posición de llegada a meta
Motivación hacia el aprendizaje
Coeficiente intelectual
NOMINAL
DICOTÓMICA
NOMINAL POLITÓMICA
CUANTITATIVA
DISCRETA
CUANTITATIVA
CONTINUA
ORDINAL

Estadística
Descriptiva
Inferencial
ESTADÍSTICA
Variables
“Ciencia que nos ayuda a conocer la
realidad. Cómo es, cómo ha sido y
cómo será. Nos ayuda a recoger
datos, organizarlos y visualizar la
información que los mismos
aportan”(Etxeberria y Tejedor,
2005: 16)
Recoge, organiza, resume, describe y
presenta los datos correspondientes
a un conjunto de variables de una
muestra.
Generaliza los resultados
obtenidos en una muestra a la
población objeto de estudio.

Estadística
POBLACIÓN
N = 150 000
n = 150
MUESTRA
ESTADÍSTICA
DESCRIPTIVA
ESTADÍSTICA
INFERENCIAL

Estadística
Estimación, a partir de los estadísticos
obtenidos para la muestra, de los
parámetros de la población.
Cálculo de los estadísticos de
una variable, o un grupo de
variables, en una muestra.
DESCRIPTIVA INFERENCIAL

Una variable CUALITATIVA
De los 66000 jubilados existentes en la provincia de Salamanca
(N=66000), se obtiene una muestra de 1000 personas
(n=1000). De esta muestra, 450 son hombres y 550 mujeres.
TABLA DE FRECUENCIAS
Sexo Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Hombre 450
Mujer 550
Total 1000
p1= 0.45f2= 550

MODA
Sexo Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Hombre 450 0.45 45%
Mujer 550 0.55 55%
Total 1000 1 100%
Categoría o categorías que tienen una mayor
frecuencia absoluta (fi) en una variable
La moda en la variable sexo es ser mujer
Es el valor o valores que más se repite en la variable
En una variable pueden existir 2 o más modas (tantas como
puntuaciones)

Se ha obtenido una muestra de 200 jóvenes extremeños, de
los que 55 son de la provincia de Badajoz…completar tabla!
Provincia Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Total 1 100%
MODA??

Una variable ORDINAL
Se obtiene una muestra de 500 estudiantes universitarios (n=500),
de los cuales 80 están cursando primero, 200 segundo, 130 tercero
y 90 cuarto.
Curso Frecuencia (fi) Proporción (pi) Porcentaje (Pi)
Primero 80
Segundo 200
Tercero 130
Cuarto 90
Total
P3= 26%

Primero 80
Segundo 200
Tercero 130
Cuarto 90
Total 500
La moda en la variable ‘curso’ es cursar segundo
MODA

Percentil: Un percentil (Pk) es una puntuación de la variable
xi, que deja por debajo de sí al k% de la muestra o
población.
Decil (D):
P10=D1
P40=D4
Cuartil (Q):
P25=Q1
P50=Q2=Mdn
P75=Q3
PERCENTIL

Primero 80
Segundo 200
Tercero 130
Cuarto 90
Total 500
PERCENTIL
Fr. acumul. (fa) Pr. acumul. (pa)

Curso fi pi Pi
Primero 80 0.16 16%
Segundo 200 0.40 40%
Tercero 130 0.26 26%
Cuarto 90 0.18 18%
Total 500 1 100%
La mediana en la variable ‘curso’ es cursar segundo.
Los estudiantes de segundo dejan por debajo de sí al 50% de la muestra.
MEDIANA
Valor (xi) que ocupa la posición central en una
distribución (variable), esto es, el Percentil 50.
fa
80
280
410
500
Pa
16%
56%
82%
100%
Mdn=
Segundo
Q2=D5=P50=

MEDIANA
Medidas de tendencia central
Puntuación (xi) que ocupa la posición central
en una distribución (variable)
Valor central, que deja por debajo de sí al 50% de los sujetos
No tiene sentido calcular la mediana en variables cualitativas.
Equivale al percentil 50 (P50), decil 5 (D5) ó cuartil 2 (Q2)
La mediana es única, sólo puede existir una mediana.

Tendencia central
Dispersión
ESTADÍSTICA
DESCRIPTIVA
Cálculo de los estadísticos de
una variable, o un grupo de
variables, en una muestra.
Posición
Forma
- Media
- Mediana
- Moda
- Varianza
- Desviación típica
- Coeficiente de variación
- Percentiles
 Deciles
Cuartiles
- Asimetría
- Curtosis
Una variable CUANTITATIVA

7.3. Medidas de Posición
7.1. Medidas de Tendencia Central
7.4. Medidas de Forma
7.2. Medidas de Dispersión

Se mide el Cociente Intelectual (CI) de un grupo de 14 jóvenes en
riesgo de exclusión, obteniendo las siguientes puntuaciones.
110, 105, 86, 93, 123, 108, 112, 99, 100, 105, 99, 90, 117, 102
SIEMPRE
ordenar de menor a mayor
86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123

86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123
Tendencia central: MODA
La moda en la variable CI para esta muestra es de 99 y 105
En este caso tenemos una distribución bimodal.

Tendencia central: MODA
Si las puntuaciones son discretas, pueden estar resumidas en
una tabla. En este caso debo tener en cuenta el ni de cada celda.
Puntuación ni pi
1 6 0,02
2 15 0,05
3 13 0,04
4 23 0,08
5 56 0,19
6 75 0,25
7 60 0,20
8 42 0,14
9 8 0,03
10 2 0,01
TOTAL 300 1
La moda de la puntuación en la prueba
es 6 puntos.

86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123
Tendencia central: MEDIANA
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Si n es impar, el valor de la mediana coincidirá con la puntuación en
la variable del sujeto (n+1)/2
Si n es par, el valor de la mediana será el promedio entre las dos
puntuaciones intermedias.
La puntuación 103.5 es la que deja al 50% de los sujetos por debajo
en esta muestra.
???

Tendencia central: MEDIANA
Si las puntuaciones son discretas, pueden estar resumidas en una
tabla. En este caso debo calcular el na y el pa.
Puntuación ni
1 6
2 15
3 13
4 23
5 56
6 75
7 60
8 42
9 8
10 2
TOTAL 300
na pa
La mediana se encuentra en la
puntuación….

86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123
Tendencia central: MEDIA
Indica el valor promedio de todas las
puntuaciones (xi)
La media del CI de la muestra de 103.5 puntos

Tendencia central: MEDIA
Si las puntuaciones son discretas, pueden estar resumidas en
una tabla. En este caso debo tener en cuenta el ni de cada celda.
Puntuación ni pi
1 6 0,02
2 15 0,05
3 13 0,04
4 23 0,08
5 56 0,19
6 75 0,25
7 60 0,20
8 42 0,14
9 8 0,03
10 2 0,01
TOTAL 300 1
La media de la puntuación en la prueba es
de 5.82

Fernando Martínez Abad
Susana Olmos Migueláñez
Indica el valor promedio de todas las
puntuaciones (xi)
Se calcula en variables cuantitativas (en las cualitativas no tiene
sentido)
La media es única, sólo puede existir una media.
MEDIA
Propiedades
1. Si se suma una constante (k) a todas las xi, la media se
incrementa lo que vale k
2. Si se multiplica una constante (k) a todas las xi, la media se
multiplica por k
3. El sumatorio de las puntuaciones diferenciales es 0
4. Cálculo de la media ponderada

210
200
190
180
170
160
150
140
130
120
110
100
90
80
70
60
50
40
30
20
10
0
Una variable CUANTITATIVA: dispersión

Indica la media de las diferencias entre
las puntuaciones observadas (xi) y su
media al cuadrado
VARIANZA
Es la raíz cuadrada de la varianza
DESVIACIÓN TÍPICA
Son las medidas más importantes de dispersión
datos tablas
A mayor varianza o desv. típica, mayor dispersión en la variable

VARIANZA y DESVIACIÓN TÍPICA
CI= {86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123}
La varianza de la variable CI es de 96.82, y la desviación
típica de 9.84

VARIANZA y DESVIACIÓN TÍPICA
La varianza de las puntuaciones es de 3.26, y la
desviación típica de 1.81
Para puntuaciones son discretas, tener en cuenta el ni de cada celda.
Puntuación ni
1 6
2 15
3 13
4 23
5 56
6 75
7 60
8 42
9 8
10 2
TOTAL 300

Propiedades de la varianza y la desviación típica
1. Dado que es un número elevado al cuadrado, la varianza y la desviación típica siempre son
positivas
2. Si se suma una constante (k) a todas las xi, la varianza y la desviación típica no se alteran.
3. Si se multiplica una constante (k) a todas las xi, la desviación típica se ve multiplicada por k y la
varianza por k2

Medida para comparar la dispersión de
diferentes variables, que estén medidas con
escalas diferentes y/o con muestras distintas
La varianza y la desviación típica son medidas absolutas. Así, no se pueden
comparar distintas varianzas o desviaciones típicas
El coeficiente de variación es una medida relativa, por lo que es un estadístico
que sirve para comparar dispersión entre variables medidas con diferentes
escalas y/o con muestras distintas
COEFICIENTE DE VARIACIÓN (CV)

COEFICIENTE DE VARIACIÓN
Altura
175 cm
25 cm
60 cm
205 cm

Altura
132 cm
125 cm
91.75 cm

Ambas variables poseen la misma media en la variable altura, sin
embargo, la primera muestra es más dispersa, en concreto 4.17
veces más (75/18)

PERCENTILES (deciles y cuartiles)
Una variable CUANTITATIVA: posición
CI= {86, 90, 93, 99, 99, 100, 102, 105, 105, 108, 110, 112, 117, 123}
Calcular el Q1
P25
1 2 3 4 5 6 7 8 9 10 11 12 13 14
100 25
n=14 X X= 25*14/100= 3,5
La Q1 =99, es decir, hay al menos un 25% de sujetos
en la muestra que obtienen menos de 99 puntos.

PERCENTILES (deciles y cuartiles)
Una variable CUANTITATIVA: posición
Para puntuaciones son discretas, calcular pa.
Puntuación ni na
1 6
2 15
3 13
4 23
5 56
6 75
7 60
8 42
9 8
10 2
TOTAL 300
D8=…
pa

Estadística descriptiva

Una variable CUANTITATIVA: forma

Valor que indica el grado de simetría que tiene la
distribución de la variable X
ASIMETRÍA
Los valores del coeficiente de asimetría están entre -1 y 1
Si As<0, la distribución es asimétrica negativa
Si As>0, la distribución es asimétrica positiva
Si As=0, la distribución es simétrica

ASIMETRÍA
Asimétrica negativa Simétrica Asimétrica positiva

Valor que indica el grado de elevación que tiene la
distribución de la variable X
CURTOSIS
Si Curt<0, la distribución es platicúrtica
Si Curt>0, la distribución es leptocúrtica
Si Curt=0, la distribución es mesocúrtica

Medidas de forma
CURTOSIS
Leptocúrtica Mesocúrtica Platicúrtica

Una variable
Diagrama de barras (v. cualitativa/ordinal)
Diagrama de sectores (v. cualitativa)
Histograma y curva de densidad (v. cuantitativa)
Diagrama de cajas (v. ordinal/cuantitativa)
REPRESENTACIÓN GRÁFICA DE VARIABLES
Dos variables
Diagr. de barras conjuntas (v. cualitativas/ordinales)
Diagrama de dispersión (v. cuantitativas)

Diagrama de sectores (v. cualitativas)
 El diagrama de sectores se emplea principalmente en la
representación de variables cualitativas, aunque también es posible
representar variables ordinales y cuantitativas discretas.
 El tamaño de los sectores puede representar frecuencias absolutas
(ni) o porcentajes (Pi).
525
705
Sexo Hombre
Mujer
n=1230
42,7%
57,3%
Sexo Mujer
Hombre

Diagrama de barras (v. cualitat./ordinales)
 El diagrama de barras se emplea en la representación de variables
cualitativas, ordinales y cuantitativas discretas.
 La altura de las barras puede representar frecuencias absolutas (ni)
o porcentajes (Pi), y cada barra representa una de las categorías o
puntuaciones de la variable.
86
327
175
595
47
0
100
200
300
400
500
600
700
Profesores Familia Amigos Solo Otros
Fuente de información
n=1230
7%
27%
14%
48%
4%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Profesores Familia Amigos Solo Otros
Fuente de información

Diagrama de cajas (v. ordinales/cuantitativas)
 El diagrama de cajas se emplea en la representación de variables
continuas.
 Muestra la distribución de la variable en función del Q1, Q2 y Q3
P75=Q3
P25=Q1
P50=Q2=D5
Valor máximo
Valor mínimo
Valor atípico

Histograma y curva de densidad
 El histograma se emplea en la representación de variables
cuantitativas continuas. A diferencia del diagrama de barras, el
histograma presenta las barras unidas.
 La Curva de densidad puede formar un gráfico por separado o
acompañar al histograma en un gráfico conjunto.
 La altura de la curva representa la frecuencia de observaciones para
una puntuación xi determinada.
 El eje vertical (y) representa frecuencias absolutas (ni) o porcentajes
(Pi), y el eje horizontal la escala de la variable.

Histograma y curva de densidad

Diagrama de barras conjuntas (v. cualitat./ord.)
 El diagrama de dispersión se emplea en la representación de dos o
más variables cuantitativas continuas. Permite comparar la
distribución de dos variables, observando su relación.
 Se trata de la representación gráfica de una tabla de contingencia.
Bajo Medio Alto
España 60 35 5
Alemania 40 85 25
60
35
5
40
85
25
0
20
40
60
80
100
Bajo Medio Alto
España
Alemania

Diagrama de dispersión (v. cuantitativas)
 El diagrama de dispersión se emplea en la representación de dos o
más variables cuantitativas continuas. Permite comparar la
distribución de dos variables, observando su relación.
 El eje vertical representa las puntuaciones de la variable ‘y’ y el
vertical las de la variable ‘x’.
0
2
4
6
8
10
12
14
16
18
20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
(4, 9)
(9, 12)
X Y
9 12
10 12
5 7
13 18
8 7
2 5
4 9
3 5
9 15

Gráficos o diagramas engañosos
 El gráfico, en función de cómo se represente, puede estar
presentado de tal manera que dé lugar a interpretaciones erróneas.
 La escala en la que se presenta la información es clave.
GC GE
Pretest 6,43 6,25
Postest 6,53 6,55
6,2
6,25
6,3
6,35
6,4
6,45
6,5
6,55
6,6
Pretest Postest
GC
GE
0
2
4
6
8
10
Pretest Postest
GC
GE

Coeficiente de correlación
El coeficiente de correlación mide la relación entre dos
variables.
Indica el tipo de relación entre dos variables y la intensidad
de la relación.
TIPO DE RELACIÓN:
DIRECTA  Valores positivos
INVERSA  Valores negativos
NULA  Cero
INTENSIDAD DE LA RELACIÓN:
ALTA  Valores cercanos a 1 o -1
BAJA  Valores cercanos a 0

RELACIÓN DIRECTA
Tendencia de que a valores altos en la primera variable (X),
corresponden valores altos de la segunda (Y), y viceversa.
0
2
4
6
8
10
12
14
16
18
20
0 2 4 6 8 10 12 14

RELACIÓN INVERSA
Tendencia de que a valores altos en la primera variable (X),
corresponden valores bajos de la segunda (Y), y viceversa.
0
2
4
6
8
10
12
14
0 2 4 6 8 10 12 14

RELACIÓN NULA
No se observa ninguna tendencia lineal.
40
50
60
70
80
90
100
110
0 2 4 6 8 10 12 14

Bajo Medio Alto TOTAL
España
Alemania
TOTAL
Tabla de contingencia
La tabla de contingencia presenta la información conjunta
de dos variables cualitativas y/o ordinales.
Se obtiene una muestra de 250 familias, 150 alemanas y 100
españolas. Se mide el nivel de ingresos, y resulta que 60 familias
de las 100 que resultaron con ingresos bajos eran españolas, 120
familias tuvieron ingresos medios y 25 familias alemanas
declararon tener ingresos altos.

España 60 35 5 100
% España
Alemania 40 85 25 150
% Alemania
TOTAL 100 120 30 250
% TOTAL
El porcentaje por filas indica la proporción de personas que,
perteneciendo al grupo que indica la fila, cumplen la
condición de la columna respectiva.

Bajo % Bajo Medio % Medio Alto % Alto TOTAL % TOTAL
España 60 35 5 100
Alemania 40 85 25 150
TOTAL 100 120 30 250
El porcentaje por columnas indica la proporción de
personas que, perteneciendo al grupo que indica la
columna, cumplen la condición de la fila respectiva.

España 60 35 5 100
Alemania 40 85 25 150
TOTAL 100 120 30 250
El porcentaje total indica la proporción de personas que
representa la frecuencia de cada celda con respecto al total
de sujetos.

CUANTITATIVA ORDINAL
CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
CUANTITATIVA PEARSON SPEARMAN
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FICOEFICIENTE FI
Coeficiente de correlación en función del tipo
de variables

Coeficiente fi (Φ)
El coeficiente fi mide la relación entre dos variables
cualitativas dicotómicas.
Hombre Mujer
Aciertos a b
Errores c d
fi>0 indica mayores
proporciones en a y d
fi<0 indica mayores
proporciones en b y c

CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FI
Coeficiente de contingencia
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA

Coeficiente de contingencia (CC)
El coeficiente de contingencia mide la relación entre dos
variables cualitativas. ya sean dicotómicas o politómicas.
Casado Divorciado Viudo TOTAL FILAS
Con afectación
severa
35 (56%) 15 (24%) 12 (20%) 62 (100%)
Sin afectación severa
5 (10%) 30 (63%) 13 (27%) 48 (100%)
TOTAL COLUMNAS 40 45 25 n=110
- El coeficiente de contingencia tiene valores entre 0 y 1.
- Valores cercanos a 1 indican que los porcentajes por filas de
cada columna (o viceversa) son muy diferentes.
A mayores diferencias en %, mayor CC CC=0,438

Coeficiente de contingencia (CC)
Casado Divorciado Viudo TOTAL
Con afectación
severa
35 (56%) 15 (24%) 12 (20%) 62
Sin afectación
severa
5 (10%) 30 (63%) 13 (27%) 48
TOTAL 40 45 25 n=110
Casado Divorciado Viudo TOTAL
Con afectación
severa
25 (40%) 20 (33%) 17 (27%) 62
Sin afectación
severa
20 (42%) 15 (31%) 13 (27%) 48
TOTAL 45 35 30 n=110
¿Mayor o Menor?
CC=0,438

CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FI
de variables
PEARSON

DOS VARIABLES CUANTITATIVAS
El coeficiente de correlación de Pearson mide la relación
entre dos variables cuantitativas.
- Valores cercanos a 1 indican que a medida que aumenta una
variable, aumenta la otra (relación directa).
- Valores cercanos a -1 indican que a medida que aumenta una
variable disminuye la otra (relación inversa).
- Valores cercanos a 0 indican que no existe relación entre las dos
variables (relación nula).

CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FI
de variables
SPEARMAN
SPEARMAN

DOS VARIABLES ORDINALES
El coeficiente de correlación de Spearman mide la relación entre
dos variables ordinales o entre una ordinal y otra cuantitativa.
- Valores cercanos a 1 indican que a medida que aumenta una
variable, aumenta la otra (relación directa).
ESTUDIOS PADRE
ESTUDIOS
MADRE
Sin estudios Básico Secundario Universitario
Sin estudios 10 6 1 0
Básico 4 22 12 6
Secundario 0 8 40 20
Universitario 2 2 11 69
0
5
10
15
20
25
30
35
40
Pobre En vías Emergente Rico
Baja
Media
Alta
Muy alta

DOS VARIABLES ORDINALES
El coeficiente de correlación de Spearman mide la relación entre
dos variables ordinales o entre una ordinal y otra cuantitativa.
- Valores cercanos a -1 indican que a medida que aumenta una
variable disminuye la otra (relación inversa).
NIVEL SOCIO-ECONÓMICO PAÍS
NIVEL
CRIMINALIDAD
PAÍS
Baja 0 1 6 26
Media 4 8 30 4
Alta 10 12 8 2
Muy alta 35 9 0 1
0
5
10
15
20
25
30
35
40
Baja
Media
Alta
Muy alta

CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
BISERIAL
PUNTUAL
ORDINAL SPEARMAN
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
POLITÓMICA
COEFICIENTE DE
CONTINGENCIA
COEFICIENTE DE
CONTINGENCIA
CUALITATIVA
DICOTÓMICA
COEFICIENTE FI
BISERIAL
PUNTUAL
de variables

Correlación biserial-puntual (rbp)
El coeficiente de correlación biserial-puntual mide la
relación entre una variable cualitativa dicotómica y otra
variable cuantitativa.
- Valores positivos indican que los sujetos del grupo 1 tienen una
puntuación media más alta que los del grupo 0.
- Valores negativos indican que los sujetos del grupo 1 tienen una
puntuación media más baja que los del grupo 0.
- El coeficiente de correlación biserial-puntual adopta valores
entre -1 y 1.

Correlación biserial-puntual (rbp)
Se quiere comprobar si el sexo de los 12 jóvenes (14-16 años) que habitan una casa de
acogida tiene relación con sus habilidades sociales (medidas mediante la escala EHS
escolar. con puntuaciones de 1 a 100). Las puntuaciones son las que se muestran:
Sexo Punt. EHS
Hombre 25
Hombre 33
Hombre 70
Hombre 12
Hombre 50
Hombre 15
Hombre 26
Mujer 99
Mujer 85
Mujer 37
Mujer 49
Mujer 95
rbp ¿positivo o negativo?

Regresión lineal
La regresión es una técnica estadística empleada para
predecir los valores de una variable y (variable criterio o
dependiente) a partir de la una o más variables x (variables
predictoras o independientes).
Regresión lineal simple:
Sólo hay una variable predictora o independiente (x)
Regresión lineal múltiple:
Existen 2 o más var. predictoras o independientes (x)
La regresión lineal se puede aplicar sólo cuando las
variables dependientes son cuantitativas, y las
independientes cuantitativas y/o dicotómicas.

Regresión lineal simple
La regresión lineal consiste en el cálculo de la recta de
regresión, que es la recta que mejor se ajusta a la nube de
puntos del diagrama de dispersión.
“La recta de regresión será aquella que minimice el cuadrado de las distancias
entre los puntos y la recta. Por tanto, para averiguar la ecuación de la recta de
regresión, tenemos que calcular los valores a y b que hagan mínima la suma de
todas las d2, donde d representa la diferencia entre el punto y la recta d=y-
(a+bx)” (Etxeberría y Tejedor, 2005, p.216)

Ecuación de regresión simple
y’= Valores pronosticados en y para un valor concreto
en x
a = Ordenada en el origen
(punto de corte de la recta con el eje y)
b = Pendiente de la recta de regresión
ε = Error de la predicción
(diferencia entre el valor pronosticado y el real para
un sujeto)

Ecuación de regresión simple
0
2
4
6
8
10
12
14
16
18
20
0 2 4 6 8 10 12 14
ε=-4
(4, 2.4)
(9.1, 12)
No hay error!!

Recta de regresión simple
RECTA CRECIENTE: En este caso, a medida que aumenta el valor
de x, aumenta el de y. Así, la el valor de b (pendiente) es
positivo, al igual que el del coeficiente de correlación.
0
2
4
6
8
10
12
14
16
18
20
0 2 4 6 8 10 12 14
a = ?
b?

Recta de regresión
RECTA DECRECIENTE: A medida que aumenta el valor de x, el
valor de y disminuye. Así, el valor de b (pendiente) es negativo,
al igual que el del coeficiente de correlación.
0
2
4
6
8
10
12
14
0 2 4 6 8 10 12 14
a = ?
b ?

Ecuación de regresión múltiple
Mientras que en la regresión simple el modelo calcula 2
valores (parámetros), a y b, en la regresión múltiple se va
añadiendo un parámetro nuevo por cada variable nueva
incluida como predictora en el modelo.
𝒚′ = 𝒂 + 𝒃𝒙 𝟏 + 𝒄𝒙 𝟐 + 𝒅𝒙 𝟑 + ⋯ + 𝜺

Bondad de ajuste de la ecuación de regresión
Para medir la bondad de ajuste de la ecuación de regresión,
esto es, el error cometido al predecir los valores de y a
partir de un valor xi, se emplea el coeficiente de
determinación (R2).
El coeficiente de determinación tiene valores entre 0 y 1. Indica la
proporción o porcentaje de variabilidad explicada por el modelo, esto
es, la “proporción de los cambios de la variable criterio que son
explicados por la variable predictora” (Etxeberría y Tejedor, 2005, p.
223).
R2 = (rxy)2

Bondad de ajuste de la ecuación de regresión

Regresión simple
Act. Psicótica Empatía Comunicación Peso
2 10 12 80
9 5 6 56
8 6 10 95
3 9 15 67
1 13 18 85
9 5 6 76
11 4 3 69
3 9 12 105
7 3 5 101
13 2 5 96
8 5 7 51
6 4 9 48
1 9 8 68
2 8 7 82
Queremos predecir la actitud psicótica (variable dependiente ‘y’) a
partir de la empatía, las habilidades comunicativas y el peso
(variables independientes ‘x’) de un grupo de adolescentes:

Regresión simple
1. ¿Existe relación lineal entre las variables?
0
5
10
15
20
25
30
35
0 2 4 6 8
Empatía
Actitudpsicótica
0
5
10
15
20
25
30
35
0 2 4 6 8
Comunicación
Actitudpsicótica
0
5
10
15
20
25
30
35
0 2 4 6 8
Peso
Actitudpsicótica
rxy= -0.87 rxy= -0.71
rxy= -0.04

Regresión simple
2. Valores de los parámetros y ecuación de regresión
Act. Psicót. (Y) Empatía (X)
2 10
9 5
8 6
3 9
1 13
9 5
11 4
3 9
7 3
13 2
8 5
6 4
1 9
2 8
Y’ εi
rxy= -0.87
a= 13.17
b= -1.1 Y’ = 13.17 – 1.1 * X
Yi = 13.17 – 1.1 * Xi + εi

Regresión simple
2. Valores de los parámetros y ecuación de regresión
Y’
3,66
7,68
5
1,65
-0,36
7,68
9,69
3,66
8,35
8,35
7,01
5,67
6,34
7,01
εi
-1,66
1,32
3
1,35
1,36
1,32
1,31
-0,66
-1,35
4,65
0,99
0,33
-5,34
-5,01
Act. Psicót. (Y) Comunic. (X)
2 12
9 6
8 10
3 15
1 18
9 6
11 3
3 12
7 5
13 5
8 7
6 9
1 8
2 7
rxy= -0.71
a= 11. 7
b= -0.67 Y’ = 11.7 – 0.67 * X
Yi = 11. 7 – 0.67 * Xi + εi

Regresión simple
rxy= -0.87
3. Bondad de ajuste del modelo
R2= (-0,87)2=0.77  77%
Act. Psic. (Y) Empatía (X)
2 10
9 5
8 6
3 9
1 13
9 5
11 4
3 9
7 3
13 2
8 5
6 4
1 9
2 8
Y’
2,17
7,67
6,57
3,27
-1,13
7,67
8,77
3,27
9,87
10,97
7,67
8,77
3,27
4,37
εi
-0,17
1,33
1,43
-0,27
2,13
1,33
2,23
-0,27
-2,87
2,03
0,33
-2,77
-2,27
-2,37
S2
y= 14.35
S2
y’= 11.05
S2
ε= 3.30
S2
y = S2
y’ + S2
ε
14.35 = 11.05 + 3.30
R2= 0.77 = 11.05 / 14.35

Regresión simple y múltiple
rxy= -0.71
3. Bondad de ajuste del modelo
R2= (-0,71)2=0.51  51%
S2
y= 14.35
S2
y’= 7.28
S2
ε= 7.07
S2
y = S2
y’ + S2
ε
14.35 = 7.28 + 7.07
R2= 0.51 = 7.28 / 14.35
Y’
3,66
7,68
5
1,65
-0,36
7,68
9,69
3,66
8,35
8,35
7,01
5,67
6,34
7,01
εi
-1,66
1,32
3
1,35
1,36
1,32
1,31
-0,66
-1,35
4,65
0,99
0,33
-5,34
-5,01
Act. Psic. (Y) Comun. (X)
2 12
9 6
8 10
3 15
1 18
9 6
11 3
3 12
7 5
13 5
8 7
6 9
1 8
2 7

Regresión simple
El modelo de regresión explica el 77%
de la varianza total.
La empatía explica el 77% de la
variabilidad de la actitud psicótica.
Existe un 23% de variabilidad no
explicada en el modelo.

Regresión simple
Existe un 49% de varianza total de la
actitud psicótica que no explican las
habilidades de comunicación.

Regresión simple
Los kilogramos que pesa una
persona no ayudan en explicar su
actitud psicótica.

Regresión múltiple
Dado que la empatía y las habilidades en comunicación son
explicativas de las actitudes psicóticas, podemos plantear el
modelo de regresión múltiple:
En este caso, la solución de la ecuación de regresión con 2
variables predictoras es un plano en un espacio
tridimensional.

Act. Psicótica Empatía Comunicación
2 10 12
9 5 6
8 6 10
3 9 15
1 13 18
9 5 6
11 4 3
3 9 12
7 3 5
13 2 5
8 5 7
6 4 9
1 9 8
2 8 7
Actitud psicótica
Hab. comunicación
Empatía

¿Por qué sólo ha mejorado un 1% la bondad de ajuste al
incorporar las dos variables conjuntamente, si ambas tenían
un buen ajuste en el modelo de regresión simple?

¿Por qué sólo ha mejorado un 1% la bondad de ajuste al
incorporar las dos variables conjuntamente, si ambas tenían
un buen ajuste en el modelo de regresión simple?
Hab. comunicación
Empatía
rxy empatía-comunicac.
rxy = 0.845
Empatía y comunicación correlacionan de
manera alta, por lo que parece que son
variables que están explicando lo mismo.
Así, el nivel explicativo conjunto, con
respecto al individual, crece muy poco…

Puntuaciones individuales
Los estadísticos de tendencia central, de dispersión y de
forma nos aportan una visión general sobre el
comportamiento de una variable.
Sin embargo, en ocasiones, nos interesa conocer, más que el
comportamiento de las variables, el comportamiento de
sujetos u observaciones concretas en una o varias
variables. En este caso, los estadísticos descriptivos no nos
sirven para este fin.
La tipificación o estandarización de las variables es el
procedimiento empleado en estos casos

Tipificación o estandarización
Tipificar o estandarizar una variable es ajustarla a una
norma, es decir, modificar las puntuaciones directas (xi) de
manera que la variable creada (zi) tenga una media y una
desviación típica determinadas previamente.
Cuando se estandariza una variable se modifican los estadísticos de
tendencia central y de dispersión, pero NUNCA los de forma y posición.
xi di zi
Z(0, 1)

Medimos las habilidades sociales de un grupo de adolescentes
con problemas de comportamiento
ASERTIVIDAD
Una vez estudiado el comportamiento del grupo, nos interesa ver
qué habilidades sociales posee un joven en particular:
COMUNICACIÓNEMPATÍA
TIPIFICO (z)ASERTIVIDAD
EMPATÍA
COMUNICACIÓN
22
18
11.5
xi
ASERTIVIDAD
EMPATÍA
COMUNICACIÓN
zi

A partir de las puntuaciones zi, que tienen una distribución
Z(0, 1), podemos obtener cualquier distribución deseada
R(𝑅, 𝑆𝑟), en función de nuestros intereses.
Puntuaciones típicas derivadas
𝒓𝒊 = 𝑹 + (𝑺 𝒓 ∗ 𝒛𝒊)
𝑿 = 𝟏𝟎
𝑺 𝒙 = 𝟓 𝒛𝒊 =
𝟏𝟎 − 𝒙𝒊
𝟓
𝒎𝒊 = 𝟓 + (𝟏 ∗ 𝒛𝒊)
M(5, 1)
Z(0, 1) M(5, 1)

Utilidad de tipificar o estandarizar a puntuaciones zi:
Se obtiene una única escala métrica para todas las
variables, por lo que podemos comparar unos resultados
con otros con más objetividad y realismo que si
comparamos las puntuaciones directas. Podemos comparar
cualquier grupo de variables, sea cual sea su naturaleza.
Las puntuaciones que están por encima de la media son
positivas y las que están por debajo negativas, por lo que se
facilita la interpretación de las puntuaciones individuales.
Con las puntuaciones típicas se pueden localizar mejor los
resultados atípicos o extremos.

A partir de las puntuaciones zi, que tienen una distribución
Z(0, 1), podemos obtener cualquier distribución deseada, en
función de nuestros intereses.
Puntuaciones típicas derivadas
Z(0, 1) T(50, 15) S(100, 10)= 6
Sx = 2 xi di zi ti si
8
5
6
9
3
4
7

• POBLACIONES INABARCABLES
• Agresividad de jóvenes internados en centros de acogida
» Recursos limitados
» Excesivo numero de casos
» Réplicas de la investigación
ESTADÍSTICA INFERENCIAL
“Conjunto de técnicas para llegar a inducciones (o inferencias)
acerca de una población completa basándose en datos de una
muestra integrante de la misma”
(Welkowitz, Ewen & Cohen, 1981, p. 106)
La Investigación en Ciencias Sociales

Intervalos de confianza
Gracias a la inferencia estadística, partiendo de unas
condiciones específicas de las distribuciones de las variables,
podré afirmar que, partiendo de una muestra determinada y
con un error concreto, el valor de un parámetro poblacional se
encuentra dentro de un intervalo dado.

Suponiendo que la muestra es representativa y que la variable es normal
Intervalos de confianza
Error= 5%  Z0.95=1.96
Error= 5%  Z0.95=1.96
Error= 1%  Z0.99=2.58
Error= 1%  Z0.99=2.58
𝑰. 𝑪. → 𝜽 ± (𝒁 𝟏−𝜶 ∗ 𝑺 𝑿)
𝑺 𝑿 = 𝟏
𝑺 𝑿 = 𝟑
𝑺 𝑿 =
𝑺 𝒙
𝟐
𝒏 − 𝟏

La hipótesis estadística
La inferencia estadística se basa en la formulación de hipótesis acerca
de los parámetros, y consiste en contrastar si esa hipótesis es cierta o
falsa.
Error= 5%
Z0.95=1.96
¿Se puede afirmar, con un error del 5%, que la media poblacional
de esta variable es 7.5?
H0: µ = 7.5
H1: µ ≠ 7.5
¿Acepto o rechazo la H0?
𝑺 𝑿 = 𝟏

La inferencia estadística se basa en la formulación de hipótesis acerca
de los parámetros, y consiste en contrastar si esa hipótesis es cierta o
falsa.
Error= 1%
Z0.99=2.58
¿Y con un error del 1%, se puede afirmar que la media poblacional
es 7.5?
H0: µ = 7.5
H1: µ ≠ 7.5
¿Acepto o rechazo la H0?
𝑺 𝑿 = 𝟏

Se observa mejor este procedimiento de manera gráfica:
Error= 5%H0: µ = 7.5
H1: µ ≠ 7.5
8.04 11.96
7.5
Zona de
Aceptación de H0
Rechazo H0 Rechazo H0
¿ACEPTO O RECHAZO
H0?
𝑺 𝑿 = 𝟏

Se observa mejor este procedimiento de manera gráfica:
Error= 1%
7.42 12.58
7.5
Zona de
Aceptación de H0
Rechazo H0 Rechazo H0
H0: µ = 7.5
H1: µ ≠ 7.5
¿ACEPTO O RECHAZO
H0?
𝑺 𝑿 = 𝟏

¿Y si lo que quiero es comparar grupos? ¿Es la media de hombres y
mujeres igual en la variable X?:
Error= 5%
Zona de
Aceptación de H0
ZONA DE ACEPTACIÓN!!!
ACEPTO H0 No existen
diferencias significativas entre
hombres y mujeres
H0: µ1 = µ2
H1: µ1 ≠ µ2
8.08 15.9214.08 21.92
𝑺 𝑿 = 𝟐

• Hipótesis nula (H0): Conjetura que se pone a
prueba con el contraste. Se acepta o se rechaza.
• Hipótesis alternativa (H1): Es la hipótesis
complementaria (opuesta) a la H0.
• Región de rechazo (RR): Conjunto de valores
para los que se rechaza H0. Existe también, por
tanto una región de aceptación (RA).
• Nivel de significación o error tipo I (α):
Probabilidad de rechazar la H0 cuando esta es
verdadera (Normalmente 0,05 o del 5%).
La formulación de hipótesis

• Ej. 1: Sabemos que para el conjunto de la población de mujeres
maltratadas en España, la media obtenida en el “Test de
Depresión de Hamilton” es de 24 puntos. Hemos obtenido una
muestra de 50 mujeres que han sufrido violencia de género, y tras
aplicar el citado test, obtenemos que X = 20; SX = 1,5. ¿Podemos
afirmar a un nivel de significación del 5% que la media obtenida en
nuestros datos procede de la población?
» H0: µ = 24
» H1: µ ≠ 24
» Si p≥0,05  Acepto H0
» Si p<0,05  Rechazo H0
La formulación de hipótesis

• Sig (p.)> 0,05  Acepto Hipótesis nula (H0): La
hipótesis nula siempre es la de igualdad.
Interpretación de resultados en software estadístico
P<0,05
RH0
P>0,05
AH0
P>0,05
AH0
• Sig (p.)< 0,05  Rechazo Hipótesis nula (H0):
Existen diferencias significativas entre grupos.

• MUESTREO
– La muestra seleccionada debe ser representativa de la
población de la que procede.
• NORMALIDAD
– Las variables cuantitativas sobre las que se va a realizar la
inferencia deben ajustarse a la distribución normal.
• HOMOCEDASTICIDAD
– En el caso de que se contrasten varias variables cuantitativas,
estas deben poseer varianzas semejantes.
Condiciones para la inferencia

• Muestreo probabilístico (simple, sistemático,
por conglomerados, por estratos, etc.)
– Todas las muestras de la población tienen las mismas
probabilidades de ser seleccionadas.
• Tamaño de muestra
– Para asegurarme (con una probabilidad determinada) de que
los estadísticos de la muestra se acercan a los parámetros
poblacionales, deberé seleccionar un tamaño de muestra
mínimo:
Muestreo representativo

 La distribución normal N( , Sx) es una distribución
teórica que aparece con mucha frecuencia cuando en
ciencias sociales medimos una variable.
 Las características sociológicas, psicológicas, educativas,
etc. de las poblaciones estudiadas suelen ajustarse a la
distribución normal.
 En estos casos, a medida que aumenta el tamaño de la
muestra con el que se mide una variable, la distribución
de esa variable tenderá hacia las características de la
distribución normal
 Cuando una variable se ajusta a la distribución normal,
entonces Z(0, 1)  N(0, 1)
Distribución normal

Distribución normal
0.15% 2.25% 15.85% 50%
Simétrica
Mesocúrtica
As=0
Curt=0
84.15% 97.75% 99.85%
media
mediana
moda

• Distribución de la variable sobre la que se
aplica inferencia similar a la distribución de la
curva normal
– CURTOSIS MESOCÚRTICA (Curt=0)
– SIMETRÍA (As=0)  Media=Moda=Mediana
» Prueba de Kolmogorov-Smirnov
• H0: La variable se ajusta a la curva normal  p ≥ α
• H1: La variable no se ajusta a la curva normal  p < α
Normalidad de las variables

• Varianzas similares de las variables cuantitativas
sobre las que se contrastan parámetros
– Estudio de la dispersión de los datos (Diagrama de cajas)
» Prueba de Levene
• H0: Las variables tienen varianzas iguales  p ≥ α
• H1: Las variables no tienen varianzas iguales  p < α
Homocedasticidad de las variables

• En el caso del cumplimiento de la condición de
normalidad emplearemos técnicas paramétricas
(basadas en la distribución normal de las
variables).
• En el caso de que no se cumpla esta condición
emplearemos técnicas no paramétricas (basadas
en la mediana y no la media).
Condiciones para la inferencia

Contraste PARAMÉTRICO o NO PARAMÉTRICO
PARAMÉTRICA
ESTADÍSTICA
INFERENCIAL
Cálculo de los parámetros
de una población.
NO PARAMÉTRICA
- Prueba T para grupos independientes
- Prueba T para grupos relacionados
- ANOVA
- Prueba de independencia Chi cuadrado
- U de Mann-Whitney para 2 grupos
independientes
- W de Wilcoxon para 2 grupos relacionados
- H de Kruskal-Wallis para k grupos
independientes

CUALITATIVA
POLITÓMICA
CUALITATIVA
DICOTÓMICA
CUANTITATIVA
PRUEBA DE T
GRUPOS REL.
ANOVA ANOVA
PRUEBA DE T
GRUPOS INDEP.
W de WILCOXON
H de KRUSKAL-
WALLIS
H de KRUSKAL-
WALLIS
U de MANN-
WHITNEY
ORDINAL
CHI
CUADRADO
CHI CUADRADO CHI CUADRADO
CUALITATIVA
POLITÓMICA
CHI CUADRADO CHI CUADRADO
CUALITATIVA
DICOTÓMICA
CHI CUADRADO
Contraste PARAMÉTRICO o NO PARAMÉTRICO

Las distribuciones de las variables cuantitativas
estudiadas se ajustan a la distribución normal

Técnicas paramétricas
• Si se verifica la normalidad de las variables cuantitativas
(contraste de KOLMOGOROV-SMIRNOV), aplico técnicas
paramétricas:
H0: La distribución es normal
H1: La distribución no es normal
Acepto la H0 de que la distribución de la variable FELICIDAD
es normal, por lo que puedo aplicar técnicas paramétricas

• Diferencia de medias: Prueba t muestras independientes
¿Existen diferencias en la altura de la población en función del sexo?
• H0: µ1 = µ2
• H1: µ1 ≠ µ2
H0: µ1 = µ2
H1: µ1 ≠ µ2
¿¿??
Una variable cuantitativa y una
variable dicotómica
Existen diferencias significativas entre hombres y mujeres
en lo que respecta a la altura.

• Análisis de Varianza (ANOVA):
¿La comprensión lectora se ve afectada por el nivel sociocultural?
• H0: µ1 = µ2 = µ3
• H1: µ1 ≠ µ2 ≠ µ3
¿¿??
H0: µ1 = µ2 = µ3
H1: µ1 ≠ µ2 ≠ µ3
variable politómica u ordinal
Existen diferencias entre los grupos en comprensión lectora, por
lo que diferentes niveles socioculturales afectan a esta variable

• Diferencia de medias: Prueba t muestras relacionadas
¿Existen diferencias entre la felicidad y la satisfacción con la vida personal
de la población?
• H0: µ1 = µ2
• H1: µ1 ≠ µ2
¿¿??
Técnicas paramétricas Dos variables cuantitativas
Existen diferencias significativas entre la felicidad y la satisfacción
con la vida personal de los sujetos.

Las distribuciones de las variables cuantitativas
estudiadas NO se ajustan a la distribución normal y/o
no existe homocedasticidad entre las variables

Técnicas no paramétricas
• Si no existe normalidad en las variables cuantitativas
(contraste de KOLMOGOROV-SMIRNOV), aplico técnicas
no paramétricas:
H0: La distribución es normal
H1: La distribución no es normal
Rechazo la H0 de que la distribución de la variable FELICIDAD
no es normal, y NO puedo aplicar técnicas paramétricas

• Prueba U de Mann-Whitney
¿Existen diferencias en la felicidad de la población en función del sexo?
• H0: θ1 = θ2
• H1: θ1 ≠ θ2
¿¿??
variable dicotómica
Técnicas NO paramétricas
No existen diferencias significativas entre hombres y mujeres
en el nivel de felicidad declarado.

• Test de Kruskal-Wallis
¿La felicidad se ve afectada por los estudios del sujeto?
• H0: θ1 = θ2 = θ3
• H1: θ1 ≠ θ2 ≠ θ3
¿¿??
H0: θ1 = θ2 = θ3
H1: θ1 ≠ θ2 ≠ θ3
variable politómica u ordinal
El nivel de estudios influye en la felicidad de los sujetos.
Parece que a mayor nivel de estudios, mayor felicidad.

• Prueba de Wilcoxon
¿Existen diferencias entre la felicidad y la satisfacción con la vida personal
de la población?
• H0: θ1 = θ2
• H1: θ1 ≠ θ2
¿¿??
Dos variables cuantitativas
Existen diferencias significativas entre la felicidad y la satisfacción
con la vida personal de los sujetos.

• Prueba Chi cuadrado (c2)
¿Depende el uso de internet en los últimos 12 meses de los estudios que ha
alcanzado el sujeto?
• H0: Las variables son independientes
• H1: Las variables no son independientes
¿¿??
Pareja de variables ordinales
y/o cualitativas
Las variables no son independientes, por lo que el empleo de internet
depende del nivel de estudios

BIBLIOGRAFÍA
Etxeberría, J. y Tejedor, F. J. (2005). Análisis descriptivo de datos
en educación. Madrid: La Muralla.
Tejedor, F. J. y Etxeberría, J. (2006). Análisis Inferencial De Datos
En Educación. Manuales de metodología de investigación
educativa. Madrid: La Muralla.
Welkowitz, J. (1981). Estadística aplicada a las ciencias de la
educación. Madrid: Santillana.

Análisis de datos en Ciencias Sociales

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (20)

Similar a Análisis de datos en Ciencias Sociales

Similar a Análisis de datos en Ciencias Sociales (20)

Más de Universidad de Salamancca

Más de Universidad de Salamancca (10)

Último

Último (20)

Análisis de datos en Ciencias Sociales