1. Guía N° 3
ANÁLISIS BIVARIANTE
Curso Básico Universitario de
Estadística y Probabilidad
Universidad Nacional Experimental de Guayana
Ciudad Guayana- Venezuela
Zoraida Pérez Sánchez
zoraidaperezs@gmail.com
2. OBJETIVO:
Describir la posible relación entre dos variables:
Estadística Descriptiva
ANÁLISIS BIVARIANTE
DOS VARIABLES CUALITATIVAS
CUALITATIVA Y CUANTITATIVA
DOS VARIABLES CUANTITATIVAS
3. DOS VARIABLES CUALITATIVAS
Proyecto
de Carrera
Aprobados Reprobados Inscritos
231 460 691
33,43% 66,57% 100%
Fuente: Actas Oficiales de Evaluación Final
Resumen elaborado por: Zoraida Pérez S.
MATEMÁTICA I
Ingeniería
Informática
Ingeniería
Industrial
Administración y
Contaduría
RESUMEN ESTADISTICO
PERIODO LECTIVO 200403
AREA DE MATEMÁTICA
234
21274 138
95
62
150
172
245
Tablas de
Contingencia Diagrama de mosaico
0 30 60 90 120 150 180
N° Alumnos
ProyectodeCarrera
Relación Aprob/Reprob por Proyecto
Admin
Contad
Indust
Inform
Reprobado
Aprobado
Diagrama de
Barra
feb-16 3
4. Gráficos y tablas comparativas de grupos. Ejemplos:
Diagrama de
Caja y Bigote
ZoraidaPérezS.
4
Cualitativas con Cuantitativa feb-16
Diagrama
Columnas
5. Relación entre
variables
Utilizar Una
variable predictora
(x)
Para pronosticar la Variable que
nos interesa estudiar
(y)
Utilizar dos o más
variables predictoras
(x1 , x2, x3, ...., xi)
Para pronosticar la Variable que
nos interesa estudiar
(y)
Análisis de
Regresión–correlación
Simple
Análisis de
Regresión–correlación
Múltiple
feb-16
5
Relación entre variables cuantitativas
6. Generalmente, la variable que
queremos estudiar (y) no es tan
fácil de controlar directamente
(Ejemplo: demanda de un
producto, ventas, etc.)
Si sospechamos una posible
relación entre dos variables
(Ejemplo: controlando el
Precio de un producto,
podemos indirectamente incidir
en las Ventas)
Utilizamos un
Análisis de Regresión
para obtener un modelo
matemático que describa la
relación entre las dos variables
Utilizamos un
Análisis de Correlación
para saber qué tan fuerte es la
relación entre las dos variables
Utilizar Una variable predictora (x) para predecir otra variable (y)
feb-16 6
Análisis de Regresión y Correlación Simple
7. Diagrama de
Dispersión
para visualizar
la relación entre
las dos variables
--------
----
---------
----
Análisis de
Regresión
para obtener un
modelo matemático
que describa la
relación entre las
dos variables
Obtener Ecuación
de Estimación por
el método de
mínimos cuadrados
Análisis de
Correlación
para saber qué
tan fuerte es la
relación entre
las dos
variables
Obtener dos
indicadores
-Coef.Correlación (r)
-Coef. Determinación
(r2)
feb-16
7
Técnicas - Análisis Bivariante
BxAy ˆ
8. Y
VARIABLE
A PREDECIR
DÍA
Precio
Unitar.
Bs
(x)
VENTAS
Docenas
de Blusas
(y)
LUNES 18 6
MARTES 25 5
MIERC. 35 3
JUEVES 15 4
VIERNES 18 4
SABADO 23 3
DOMINGO 30 2feb-16
PRIMERO:
Recolectar
DATOS PAREADOS
(dos características de una
misma unidad de análisis)
Diagrama de Dispersión
Precio Unitario (en Bs.)
VENTAS(endocenas)
X
VARIABL
PREDICTOR
SEGUNDO:
Construir un
DIAGRAMA DE DISPERSIÓN,
el cual nos da información visual sobre
la relación entre:
0
1
2
3
4
5
6
7
0 10 20 30 40
Para realizar el Análisis Bivariante
9. feb-16
TERCERO:
Aplicamos el método de Mínimos Cuadrados para
encontrar la recta de mejor ajuste a la nube de puntos
Analíticamente se obtiene la Ecuación de Estimación
- Cálculos manuales
- Funciones estadísticas de la calculadora
- Funciones estadísticas de Excel
- Programas estadísticos (STATGRAPHICS, SPSS, MINITAB...)
xByA
donde:
22
)(xnx
yxnxy
B
BxAy ˆ
Análisis de Regresión
10. Cálculos Manuales feb-16
Día x y x2
xy y2
Lunes 18 6 324 108 36
Martes 25 5 625 125 25
Miércoles 35 3 1.225 105 9
Jueves 15 4 225 60 16
Viernes 18 4 324 72 16
Sábado 23 3 529 69 9
Domingo 30 2 900 60 4
Sumatorias 164 27 4.152 599 115
medias= 23,429 3,857
n= 7
pendiente de la rescta: B= -0,1084
Punto de corte con el eje "y" : A= 6,3967
Error Estándar de Estimación: Se= 1,040684
Coeficiente de Determinación: r2
= 0,3352
Coeficiente de Correlación: r= 0,578937
y=A+B.x
ó
ó
bxay ˆ
22
xnx
yxnxy
b
xbya
2
)ˆ( 2
n
yy
se
2
2
n
xybyay
se
2
2
2
)(
)ˆ(
1
yy
yy
r
22
2
2
yny
ynxybya
r
11. DATOS
feb-16
11
Con Hoja de Cálculo (Excel)
mes Gastos
Publicidad
[en Miles de Bs ]
Ventas
[en Miles Bs ]
Ene 200 560
Feb 125 410
Mar 300 630
Abr 250 840
May 330 930
Jun 535 1060
Jul 480 1110
Ago 350 850
Sep 240 700
Oct 180 760
Nov 390 745
Dic 160 610
y = 1,3591x + 366,15
R² = 0,7194
0
200
400
600
800
1000
1200
0 100 200 300 400 500 600
Ventas
12. En la calculadora....
Uso de la calculadora para realizar un análisis de Regresión Lineal
Modelo: CASIO fx82 MS o similar (seleccionador GRIS)
1. Seleccionar el modo de Regresión Lineal......MODE – REG—LIN
2. Limpiar la memoria estadistica................SHIFT– MODE– SCL
3. Introducir las parejas de datos................18 6 .........
4. Luego, de introducir la última pareja de datos: Busca los valores de :
A= punto de corte de la recta con el eja “y”
B= pendiente de la recta
r= coeficiente de correlación
5. Replay a la derecha hasta encontrar A , B, y r
, M+
feb-16 12
14. Visualización de Correlación
Programado por Erich Neuwirth
target value -0,6
empirical
(data) value -0,6122
-3
-2
-1
0
1
2
3
-3 -2 -1 0 1 2 3
Desplace la
barra para
cambiar la
correlación
Coeficiente de correlación ( r )
feb-16 14
15. Diagramas de Dispersión
No hay evidencia de que
x se relacione con yfeb-16 15
Visualizando los tipos de relación entre variables
17. Error Estándar de Estimación. Cómo se interpreta
Una forma de ver el error estándar de estimación es concebirlo como la herramienta estadística que podemos usar para
hacer un enunciado de probabilidad sobre el intervalo alrededor del valor estimado de Y gorrito, dentro del cual cae el valor
real de Y. Podemos ver por ejemplo , en la Figura 12-12, que podemos estar 95,5% seguros que el valor real de Y caerá
dentro de DOS ERRORES ESTANDAR del valor estimado de Y gorrito. Llamamos a estos intervalos , alrededor de la Y gorrito
(estimada) INTERVALOS DE PREDICCIÓN APROXIMADA
FUENTE: LEVIN-RUBIN (1996) ESTADISTICA PARA ADMINISTRADORES. Pag. 674feb-16 17
18. Restricciones y Limitaciones
Al hacer predicciones con base en la recta de mejor ajuste,es
necesario observar las siguientes restricciones
La ecuación debe
usarse solo para
hacer
estimaciones
sobre la población
de la cual se
extrajo la muestra
La ecuación debe
usarse solo
dentro del
dominio muestral
de la variable de
entrada (x)
Si la muestra fue
tomada en el año
2000, no espere
que los resultados
sean válidos para
el año 1950 o
para el año 2006
19. Advertencia
No se debe esperar que el valor estimado ocurra
exactamente. La interpretación es la siguiente:
“ygorrito 1” es el valor promedio de la cantidad de docenas
vendidas, sólo para las veces que mantuve el precio de
“X1” bolívares