El documento habla sobre el análisis bivariado, que analiza la relación entre dos variables. Explica que existen tres métodos principales para realizar análisis bivariado: diagramas de dispersión, coeficientes de correlación, y regresión lineal simple. Además, define conceptos como covarianza y varianza, los cuales son importantes para medir la relación entre variables.
2. El término análisis bivariado se refiere al
análisis de dos variables. Puede recordar esto
porque el prefijo «bi» significa «dos».
El propósito del análisis bivariado es
comprender la relación entre dos variables.
Puede contrastar este tipo de análisis con los
siguientes:
Análisis univariante : el análisis de una
variable.
Análisis multivariado: el análisis de dos o
más variables.
ANÁLISIS
BIVARIADO
3. ANÁLISIS BIVARIADO
01
Nos ayuda a determinar en qué medida
es posible predecir el valor de una
variable en el caso en que conozcamos el
valor de otra variable.
Los datos bivariados tienen muchos usos
prácticos en la vida real. Por ejemplo, es
bastante útil poder predecir cuándo podría
ocurrir un evento natural. Una herramienta en
la caja de herramientas del estadístico es el
análisis de datos bivariados
4. MÉTODOS PARA REALIZAR ANÁLISIS
para realizar análisis
Diagrama
de
dispersión
Coeficiente
de
correlación
Regresión
lineal simple
TRES MÉTODOS
5. Herramientas de análisis
bivariado.
1. Diagramas de dispersión.
Nos permite visualizar la relación entre
dos variables colocando el valor de una
variable en el eje x y el valor de otra
variable en el eje y.
2. Coeficientes de correlación.
El más común es el coeficiente de Pearson, qué es
una medida de la asociación lineal entre dos
variables.Tiene un valor entre -1 y 1.
3. Regresión lineal simple.
Se elige una variable para que esta sea explicativa.
Y la otra para que sea una variable de respuesta.
6. DIAGRAMA DE DISPERSIÓN
Los datos se grafican como una
colección de puntos, cada uno con un
valor de una variable en el eje horizontal
x y el valor de la otra variable en el eje
vertical (y).
Consiste en un diagrama en
coordenadas cartesianas en donde se
despliegan los valores de dos variables
para un conjunto de datos.
En un Diagrama de Dispersión el patrón de puntos
puede asumir formas diversas, dependiendo de la
relación que exista entre las variables. Si el patrón de
puntos asume la forma de una línea recta, se dice
que existe una relación lineal entre las variables.
7. Ejemplo
Una heladería local realiza un seguimiento de la cantidad
de helado que venden en comparación con la temperatura
de ese día. Aquí están sus cifras de los últimos 12 días:
8. “La Covarianza es una especie de varianza entre dos variables”.
COVARIANZA MUESTRAL
La covarianza nos mide la covariación conjunta de dos variables: Si
es positiva nos dará la información de que a valores altos de una de
las variable hay una mayor tendencia a encontrar valores altos de la
otra variable y a valores bajos de una de las variables,
correspondientemente valores bajos.
9. PROPIEDADES DE COVARIANZA
1. La covarianza es el momento central de orden 1,1 de la distribución bidimensional.
2. Es invariante ante los cambios de origen en cualquiera de las dos variables.
3. Sin embargo depende de los cambios de unidad .
4. La expresión de cálculo de la covarianza es
si las observaciones están agregadas por frecuencias
si las observaciones no están agregadas por frecuencias
10. PROPIEDADES DE COVARIANZA
5. Si dos variables son independientes su covarianza es cero
6. La covarianza nos mide la covariación conjunta de dos variables:
Si es positiva nos dará la información de que a valores altos de una de las variable hay una mayor tendencia a
encontrar valores altos de la otra variable y a valores bajos de una de las variables
Si la covarianza es negativa, la covariación de ambas variables será en sentido inverso: a valores altos le
corresponderá bajos, y a valores bajos, altos.
Si la covarianza es cero no hay una covariación clara en ninguno de los dos sentidos.
11. ¿Qué indica la Covarianza?
1. La covarianza positiva >>
cuando uno variable crece la
otra variable también. Tienen
una relación directa.
2. La covarianza negativa >>
cuando una variable crece la
otra variable decrece. Tienen
una relación Inversa.
12. ● Si el signo de la covarianza es positivo, existe una relación lineal directa entre
las variables (a mayor valor observado de X, mayor valor de Y)
● Si el signo de la covarianza es negativo, existe una relación lineal inversa entre
las variables (a mayor valor observado de X, menor valor de Y)
SIGNOS DE LA COVARIANZA
MUESTRAL
13. Cuando hay relación positiva los sujetos tienden a estar a la
vez por encima o por debajo de la media en las dos variables
(los dos signos son + o son -) y el producto es más (+). Como
los productos son todos de signo positivo, su suma será
grande (se suma y no se resta) y positiva.
LA COVARIANZA MUESTRAL EN
RELACIÓN POSITIVA
14. Cuando hay relación negativa los sujetos tienden a
estar por encima de la media en una variable
(signo +) y por debajo de la media en la otra
(signo) y los productos tenderán a ser todos
negativos, su suma será grande y negativa.
LA COVARIANZA MUESTRAL EN
RELACIÓN NEGATIVA
15. Cuando no hay relación entre las dos variables, las dos
puntuaciones diferenciales tienden a ser unas veces del
mismo signo y otras de distinto signo: los productos serán
unas veces positivos y otras veces negativos: cuando los
sumamos la suma será muy pequeña o tiende a cero, porque
los sumandos se anulan mutuamente en la medida en que no
hay relación.
LA COVARIANZA MUESTRAL CON
AUSENCIA DE RELACIÓN
17. COEFICIENTES DE CORRELACIÓN
LINEAL MUESTRAL
Es una medida de regresión que
sirve para establecer una
relación lineal entre dos
variables. De esta manera, su
cálculo permite conocer con
exactitud el grado de dispersión
de los valores de una variable en
relación con una media para dicha
variable.
El CCL entonces permite que se
establezca una relación
cuantitativa de sentido lineal
entre dos variables.
La intensidad y dirección de esta
relación suele constatarse
gráficamente.
18. CARACTERÍSTICA DE EMPLEO
■ El CCL constituye uma medida
que cuantifica el valor de su
intensidade en función de la
relación lineal entre ambas
variables.
■ El empleo del CCL se emplea como
um índice que indica la
intensidade de esta relación
siempre que las variables sean
cuantitativas y continuas.
■ Correlación limitada que aporta
información referente a la relación
entre pares de atributos que se
miden de manera simultânea.
■ La fórmula empleada en este
análisis coteja la distancia pontual
entre los distintos valores em
relación com la media de la
variable independiente.
19. PROPIEDADES DE CCL
■ El coeficiente de correlación no
varía al hacerlo la escala de
medición.
■ Si el coeficiente de correlación
lineal toma valores cercanos a -1 la
correlación es fuerte e inversa.
■ El signo del coeficiente de
correlación es el mismo que el
de la covarianza.
■ Si el coeficiente de correlación lineal toma
valores cercanos a 1 la correlación es fuerte y
directa
■ El coeficiente de correlación lineal
es un número real comprendido
entre -1 y 1
Si el coeficiente de
correlación lineal toma
valores cercanos a 0, la
correlación es débil.
Si r= 1 ó r= -1, los puntos de
la nube están sobre la recta
creciente o decreciente.
21. La varianza es una proporción de la fluctuación o difusión de
una gran cantidad de información
Var(X) = Σ ( Xi – X )2 / N = Σ xi2 / N
donde:
N es el número de resultados en un conjunto de resultados…
X es la media de las puntuaciones N.
Xi es la puntuación bruta número uno en el conjunto de
puntuaciones…
xi es la puntuación de la desviación i en el conjunto de
puntuaciones
Var(X) es la variación de todas las puntuaciones del conjunto
Matriz de varianza-covariancia
PLAZA FABRICIO
22. La covarianza es una proporción del grado en que la comparación
de los componentes de dos arreglos de la información solicitada
se mueve de manera similar.
Cov(X, Y) = Σ ( Xi – X ) ( Yi – Y ) / N = Σ xiyi / N
donde
N es el número de puntuaciones en cada conjunto de datos
X es la media de las puntuaciones de N en el primer conjunto de datos
Xi es el puntaje bruto en el primer conjunto de puntajes…
xi es la puntuación de la desviación i en el primer conjunto de puntuaciones
Y es la media de las puntuaciones N en el segundo conjunto de datos
Yi es el puntaje bruto en el segundo conjunto de puntajes…
yi es la puntuación de desviación i en el segundo conjunto de puntuaciones
Cov(X, Y) es la covarianza de las puntuaciones correspondientes en los dos
conjuntos de datos
PLAZA FABRICIO
Matriz de varianza-covariancia
23. Por ejemplo, usted crea una matriz de varianzas-covarianzas para tres
variables X, Y y Z. En la siguiente tabla, las varianzas se muestran en negrita
a lo largo de la diagonal; las varianzas de X, Y y Z son 2.0, 3.4 y 0.82
respectivamente. La covarianza entre X y Y es -0.86.
Matriz de varianza-covariancia
PLAZA FABRICIO
24. Una matriz de correlación es una tabla que
muestra los coeficientes de correlación
entre conjuntos de variables.
El coeficiente de correlación más común
es el coeficiente de correlación de
Pearson, que compara dos variables de
intervalo o variables de razón.
ANÁLISIS
ESTADÍSTICO