2. Diagramas de Dispersión
Este diagrama es la representación gráfica de la
relación entre las variables. Para el caso de dos
variables, correlación simple, tenemos:
Lineal Positiva
5. Correlación Simple
El análisis de correlación es un grupo de
técnicas estadísticas que nos permiten
medir la intensidad de la relación que
puede existir entre dos variables, su
grado de relación y su sentido.
El objetivo es determinar qué tan intensa
es la relación y utilizamos para ello el
coeficiente de correlación.
7. Prueba de hipótesis acerca del parámetro (rho)
Saber si X e Y están correlacionados:
Ho : = 0
Hi : = 0
Estadístico de prueba es:
t n-2 = r n – 2
1 – r 2
8. Ejemplo 1
Mediciones de la presión sanguínea sistólica
(mmHg) mediante dos métodos en 25
pacientes con hipertensión esencial.
10. Prueba de hipótesis parámetro
Planteamiento:
Ho : = 0
Hi : = 0
Estadístico de prueba:
t n-2 = r n – 2
1 – r 2
11. tc = 0.95 * 25 – 2 = 14.41
1 – (0.95) 2
t n-2 t23 = 2.069
Conclusión: Rechazamos la Ho
Se puede afirmar que existe alta correlación
lineal (positiva) entre las variables, presión
sanguínea y respuesta al TRATAMIENTO.
12. Es adimensional
Sólo toma valores en [-1,1]
Las variables son incorreladas r = 0
Relación lineal perfecta entre dos variables r =+1 o r =-1
– Excluimos los casos de puntos alineados horiz. o verticalmente.
Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación
lineal.
– Siempre que no existan observaciones anómalas.
Propiedades de r
-1 +1
0
Relación
inversa
perfecta
Relación
directa
casi
perfecta
Variables
incorrelada
s
16. Preguntas frecuentes
¿Si r = 0 eso quiere decir que las variables son independientes?
– En la práctica, casi siempre sí, pero no tiene
por qué ser cierto en todos los casos.
– Lo contrario si es cierto: Independencia
implica incorrelación.
Me ha salido r =1’2 ¿la relación es “superlineal”[sic]?
– ¿Superqué? Eso es un error de cálculo. Siempre debe tomar un valor
entre -1 y +1.
¿A partir de qué valores se considera que hay “buena relación
lineal”?
– Es difícil dar un valor concreto (mirad los gráficos anteriores). Para
este curso digamos que si |r|>0,7 hay buena relación lineal y que si
|r|>0,4 hay cierta relación (por decir algo... la cosa es un poco más
complicada: observaciones anómalas,...)
17. Análisis de Regresión
Objetivo
Estudio de la relación funcional entre dos variables.
Establecer una relación cuantitativa entre dos o más
variables relacionadas.
Se trata de PREDECIR y/o EXPLICAR el valor de
una variable (v. Dependiente), dado el valor de otra(s)
variable(s) relacionada(s) (v. Independiente(s)).
Las variables X e Y deben ser de naturaleza
cuantitativa y de preferencia continua.
18. Regresión Lineal Simple
•Para resolver el problema tenemos que
AJUSTAR una línea entre los puntos
observados, a fin de usarla para predecir el
valor de Y (variable dependiente) a partir de
un valor conocido de X (variable
independiente).
•Para cada valor de X hay una subpoblación
de valores Y.
•Cada subpoblación de los valores de Y tiene
distribución normal.
19. Línea de Regresión
Como todos los puntos no están
exactamente sobre una línea recta, se
cometen errores en el ajuste.
21. La covarianza entre dos variables, Sxy, nos indica si la
posible relación entre dos variables es directa o inversa.
– Directa: Sxy >0
– Inversa: Sxy <0
– Incorreladas: Sxy =0
El signo de la covarianza nos dice si el aspecto de la nube
de puntos es creciente o no, pero no nos dice nada sobre
el grado de relación entre las variables.
Covarianza de dos variables X e Y
)
)(
(
1
y
y
x
x
n
S i
i
i
xy
22. Ejemplo 2
Una compañía farmacéutica conduce un estudio piloto
para evaluar la relación entre tres dosis en un nuevo
agente hipnótico y tiempo de sueño. Los resultados de
este estudio son presentados de la siguiente manera.
Tiempo de sueño
en horas:
Dosis (mM/Kg)
23. Diagrama de Dispersión
Según el diagrama de
dispersión, se espera
una una relación
positiva o directa
entre ambas
variables.
Modelo de regresión:
y = a + b x
25. Estimación de la Recta de Regresión
Por consiguiente el modelo de Regresión Estimado es:
9
9
26. Sujeto Presión Edad
A 128 43
B 120 48
C 135 56
D 143 61
E 141 67
F 152 70
Ejercicio
• Un investigador le interesa saber si existe una correlación
entre la edad de los adultos y su presión sanguínea,
particularmente la sistólica. Realice un diagrama de
dispersión, el modelo de regresión, calcule el coeficiente de
correlación y estime cual podría ser la presión para las
edades de 72 y 80 años.