VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
Clase 2 De Octubre 2009
1. Clase 2 de Octubre 2009-10-05
TEMA 4 Análisis de correlación y de regresión lineales
- Diagrama de dispersión: nos sirve para saber en cierto modo si hay relación
directa entre dos variable.
- .El siguiente paso para saber si existe relación directa entre dos variables es el
cálculo de la covarianza, que es una medida de grado en que dos variables
cuantitativas evolucionan paralelamente.
σ xy =
∑ (x 1 − µ x )( y i − µ y )
N
Esta medida tiene el problema de que las medidas en las que está
expresada son raras y además no está acotada, por ello debemos fijarnos
sólo en su signo.
Si el signo es positivo la relación es .creciente.
Si el signo es negativo la relación es decreciente.
- El siguiente paso es el cálculo de la correlación, que acota la covarianza.Esta
medida no tiene unidades( es una medida adimensional). Tiene el mismo
signo que la covarianza.
σ xy
ρ=
σ xσ y
Si el coeficiente de correlación vale –1 la relación será lineal perfecta e
inversa. (OJO que la pendiente no tiene por qué ser –1)
Si el coeficiente de correlación vale +1 la relación será lineal perfecta y
directa( OJO que la pendiente no tiene que ser +1)
Si toma el valor 0 no existe relación entre las variables, y en este caso la
pendiente será 0.
Los valores extremos( 0, -1, +1) son fácilmente interpretables, pero surge
la pregunta de ¿Cómo de grande debe ser el coeficiente para poder
2. afirmar que existe una relación lineal entre las dos variables? Depende
de:
1-de la situación explorativa o concluyente
2-del tipo de variables estudiadas.
- Análisis de regresión, es una herramienta que persigue ayudar en la
predicción de los valores de una variable cuantitativa.
Y= A+ BX
Y= variable dependiente
A= ordenada en el origen
B= pendiente(incremento de Y cuando crece X en 1 und)
X= variable independiente
y
A
x
- Recta de regresión: sobre el diagrama de dispersión vamos a trazar la recta
que “mejor” se ajusta a la nube de puntos.
La recta escogida será la que minimice la expresión:
N ^
∑ ( yi − y i ) 2
i =1
3. yi = valor real
^
y i = valor estimado = Axi + B
^ 2
( y i − y i ) = residuo, que siempre será positivo al estar elevado al cuadrado.