S08 ad4001 ss

Sesión 8
Dos Poblaciones y
ANOVA
Estadística en las
organizaciones CD4001
Dr. Jorge Ramírez Medina

Análisis de Varianza
• Analysis of variance (ANOVA) . Es utilizado para probar la
media de dos o más poblaciones. La hipótesis nula, típicamente, es que
todas las medias son iguales.
• Esta técnica es una extensión de la prueba t de dos muestras.
• Adicional a conocer las diferencias entre las medias, puede ser de
interés conocer cuál media difiere.
• El análisis de varianza y covarianza se examinan diferencias en los
valores medios de la variable dependiente asociados con el efecto de las
variables controladas, después de tomar en cuenta la influencia de las
variables independientes no controladas

Dr Jorge Ramírez Medina
EGADE Business School

Tomemos un ejemplo
¿Cómo promocionar un
nuevo producto
(concentrado de
manzana)

• Convenience


Tomemos un ejemplo
Convnce

Weekly
sales


529
658
793
514
663
719
711
606
461
Weekly
529
sales
498
663
604
495
485
557
353
557
542
614

Quality

804
630
774
717
679
604
620
697
706
615
492
719
787
699
572
Weekly
523
sales
584
634
580
624

Price
672
531
443
596
602
502
659
689
675
512
691
733
698
776
561
572
469
581
679
532

Solución
H0: µ1 = µ2= µ3
H1: At least two means differ


Notación
Muestras independientes tomadas de k poblaciones (tratamientos).

1

Segunda observación,
Segunda muestra

Tamaño de la muestra

k

X11
x21
.
.
.
Xn1,1
n1

Primera observación,
Primera muestra

2
X12
x22
.
.
.
Xn2,2

X1k
x2k
.
.
.
Xnj,k

n2

nj

x1

Media de la muestra

x2

xj

X es la “variable de respuesta”. Los valores son llamados “observaciones”


Notación
En el contexto de este Problema:
Variable de respuesta: Las ventas semanales
Observaciones: valor de las venta real
Unidad de análisis: Las tres ciudades
Tratamiento :Criterio por el cual se clasifican las poblaciones (los
tratamientos). En este problemas el factor es la estrategia de
mercadotecnia.
Niveles de los tratamientos: Las diferentes estrategias de
mercadotecnia; Conveniencia, Precio, Calidad.



σx

x3

µ

x2

2

σ2
=
n

x1

Las medias de las muestras están “cercanas entre
sí”, porque sólo hay una distribución muestral cuando
H0 es verdadera


x3

µ3

µ2

x2

Las medias de las muestras provienen de distintas
distribuciones muestrales y no están tan cercanas
entre sí cuando H0 no verdadera

x1

µ1

Descomposición de
la variación
•

SSentre. Estimación de la variabilidad entre tratamientos, también se le
denota por SSx, esta es la variación en X relacionada a la variación en
las medias de cada muestra. Se le conoce como SCTR suma de los
cuadrados debido a los tratamientos.

•

SSdentro. variación dentro de cada una de las muestras, también
denotada como SSerror, es la variación en X debido a la variación
dentro de cada una de las muestras. Se le conoce como SCE, suma
de cuadrados debido al error

•

SSy. Es la variación total. Se le conoce como STC, suma de
cuadrados del total

STC = SCTR + SCE

El estadístico F
Hipótesis:
H0:  µ1 = µ2 = µ3 = .  .  . = µk
Ha:  No todas las medias de la
población son iguales
Estadístico de prueba:

Regla de rechazo:
             Rechazar H0 if F > Fα
Donde el valor de Fα esta basado en una
distribución F  con  k - 1 grados de libertad
en el numerador y  nT - 1 grados de libertad
en el denominador

Distribución de muestreo
de CMTR/CME

No rechazar H0

Rechazar H0

Fα
Valor Crítico

CMTR/CME

Acerca de los grados
de libertad
• Distribución χ2

s 2 ( n − 1)
σ2

•

Demostración de grados de libertad


Tabla ANOVA

s 2 ( n − 1)
σ2


Ejemplo; Estrés laboral
Sistema B

Sistema A

ITESM EGADE

Sistema C

ANOVA dos factores
ía
un d
de R
ma
epa
ra
so
rog
P
de

so
Cur

n
sema
0
de 1

as

tre
s

hor

Ingeniería
Cie
ncia
s
ón
i
ra c
t
inis
dm
A

as

Qué tipo
de relación
se examina?

Dependencia

Interdependencia

Cuántas son
las variables
a predecir?

Múltiples relaciones de
Variables dependientes e
independientes
Varias variables
dependientes en
una sola relación

Métrica

Correlación
canónica

Cuál es la escala
de medición de
la variable
dependiente?

Cuál es la escala
de medición de
la variable
dependiente?

SEM

Métrica

Una variable
dependientes en
una sola relación

No Métrica

Cuál es la escala
de medición de
la variable
predictora?
No Métrica
Análisis
Multivariado
de varianza
(Manova)

Correlación
canónica
con variables
dummy

Métrica

Regresión múltiple
Análisis Conjoint

No Métrica

Análisis discriminante
múltiple
Modelos de
probabilidad lineal
(logit Analysis)

Correlación canónica
Y1+Y2+Y3+…+Yn =
métrica, no métrica

X1+X2+X3+…+Xn

Manova
Y1+Y2+Y3+…+Yn =
métrica

X1+X2+X3+…+Xn
no métrica

Y1 =

Relación entre los
métodos de
dependencia
multivariados

métrica

X1+X2+X3+…+Xn
no métrica

Análisis discriminante múltiple
Y1=
no métrica (dicotómica)

X1+X2+X3+…+Xn
métrica

Análisis de regresión múltiple
Y1=
métrica

X1+X2+X3+…+Xn

Análisis Cojoint
Y1=

X1+X2+X3+…+Xn
no métrica

SEM
Y1 =
Y2 =
Ym =

X11+X12+X13+…+X1n
X21+X22+X23+…+X2n
Xm1+Xm2+Xm3+…+Xmn

Modelo de regresión
lineal simple
• Modelo de regresión lineal simple
y = β0 + β1x + ε
• Ecuación de regresión lineal simple
E(y) = β0 + β1x
• Ecuación estimada de regresión lineal simple
^
y = b0 + b1x


When ANOVA is the
Correct Test

Evaluación final


S08 ad4001 ss

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a S08 ad4001 ss

Similar a S08 ad4001 ss (20)

Más de Jorge Ramírez

Más de Jorge Ramírez (20)

S08 ad4001 ss

Notas del editor