2. Qué tipo
de relación
se examina?
Dependencia
Interdependencia
Cuántas son
las variables
a predecir?
Múltiples relaciones de
Variables dependientes e
independientes
Varias variables
dependientes en
una sola relación
Métrica
Correlación
canónica
Cuál es la escala
de medición de
la variable
dependiente?
Cuál es la escala
de medición de
la variable
dependiente?
SEM
Métrica
Una variable
dependientes en
una sola relación
No Métrica
Cuál es la escala
de medición de
la variable
predictora?
No Métrica
Análisis
Multivariado
de varianza
(Manova)
Correlación
canónica
con variables
dummy
Métrica
Regresión múltiple
Análisis Conjoint
No Métrica
Análisis discriminante
múltiple
Modelos de
probabilidad lineal
(logit Analysis)
3. Correlación canónica
Y1+Y2+Y3+…+Yn =
métrica, no métrica
X1+X2+X3+…+Xn
métrica, no métrica
Manova
Y1+Y2+Y3+…+Yn =
métrica
X1+X2+X3+…+Xn
no métrica
Análisis de Varianza
Y1 =
Relación entre los
métodos de
dependencia
multivariados
métrica
X1+X2+X3+…+Xn
no métrica
Análisis discriminante múltiple
Y1=
no métrica (dicotómica)
X1+X2+X3+…+Xn
métrica
Análisis de regresión múltiple
Y1=
métrica
X1+X2+X3+…+Xn
métrica, no métrica
Análisis Cojoint
Y1=
métrica, no métrica
X1+X2+X3+…+Xn
no métrica
SEM
Y1 =
Y2 =
Ym =
X11+X12+X13+…+X1n
X21+X22+X23+…+X2n
Xm1+Xm2+Xm3+…+Xmn
4. Modelo de regresión
lineal simple
• Modelo de regresión lineal simple
y = β0 + β1x + ε
• Ecuación de regresión lineal simple
E(y) = β0 + β1x
• Ecuación estimada de regresión lineal simple
^
y = b0 + b1x
Dr Jorge Ramírez Medina
EGADE Business School
5. Método de
mínimos cuadrados
Criterio de mínimos cuadrados
min ∑ (y i − y i ) 2
en donde:
yi = es el valor observado de la variable
dependiente para la ith observación
^
yi = es el valor estimado de la variable
dependiente para la ith observación
Dr Jorge Ramírez Medina
EGADE Business School
6. Calculando b 1 y b 0
Pendiente de Ecuación estimada de regresión lineal simple
Intercepto en y de la Ecuación estimada de regresión lineal
simple
Dr Jorge Ramírez Medina
EGADE Business School
8. SCE
Residual representa el error
Es lo que se minimiza con el criterio de Mínimos
cuadrados
SCE: Suma de cuadrados debido al error.
Medida de error al usar
Dr Jorge Ramírez Medina
EGADE Business School
9. STC
Asumamos que no tenemos información de xi,
entonces usaremos el promedio de las ventas.
El error correspondiente es STC (Suma
total de cuadrados)
Dr Jorge Ramírez Medina
EGADE Business School
10. SCE y STC
SCE: Que tanto se agrupan las
observaciones en torno a la recta
STC: Que tanto se agrupan las
observaciones en torno a la recta
P10
Dr Jorge Ramírez Medina
EGADE Business School
11. SCR
SCR: Suma de cuadrados debido a la
regresión
P10
Dr Jorge Ramírez Medina
EGADE Business School
12. ¿Qué tan bien se ajustan a
los datos la ecuación de
regresión?
• SSE
• SST
• SSR
∑( y
^
i
− yi )
∑ (^y − y )
∑( y
2
2
i
i
− y)
2
SST = SSR + SSE
2
2
^
^ 2
∑ ( yi − y ) = ∑ ( yi − y ) + ∑ ( yi − yi )
Dr Jorge Ramírez Medina
EGADE Business School
13. El Coeficiente de
determinación
Coefficient of Determination
where:
regression
error
Dr Jorge Ramírez Medina
EGADE Business School
r2 = SSR/SST
SST = total sum of squares
SSR = sum of squares due to
SSE = sum of squares due to
14. El coeficiente de
correlación
• Sample Correlation Coefficient
rxy = (sign of b1 ) Coefficient of Determinat ion
rxy = (sign of b1 ) r 2
ˆ
y = b0 + b1 x
where:
b1 = the slope of the estimated
regression equation
Dr Jorge Ramírez Medina
EGADE Business School
15. Ejemplo
• Sample Correlation Coefficient
rxy = (sign of b1 ) r 2
ˆ
y = 10 + 5 x
The sign of b1 in the equation
is “+”.
Dr Jorge Ramírez Medina
EGADE Business School
rxy = + .8772
rxy = +.9366
16. Análisis de residuos
• Residual for Observation i
^
^
yi – yi
• Standardized Residual for Observation i
^
yi − yi
^
syi − yi
Where
Dr Jorge Ramírez Medina
EGADE Business School
^
syi − yi = s 1 − hi
18. Diferencias y similitudes
ANOVA
Similarities
Number of
dependent
variables
Number of
independent
variables
Differences
Nature of the
dependent
variables
Nature of the
independent
variables
One
REGRESSION DISCRIMINANT/LOGIT
Pruebas de
One
diferencias One
Multiple
Multiple
Metric
Pruebas de
Metric asociación Categorical
Categorical Metric
Dr. Jorge Ramírez Medina
ITESM EGADE
Multiple
Pruebas de hipótesis
Metric
-- a dependent variable -- is generally predicted or explained by means of the other(s) -- independent variables and covariates. These are called dependence methods. Ejemplo: multiple regression and analysis of variance
Multiple regression analysis enables the researcher to predict the level of magnitude of a dependent variable based on the levels of more than one
independent variable.
Multiple discriminant analysis enables the researcher to predict group membership on the basis of two or more independent variables.
Conjoint analysis provides a basis to estimate the utility that consumers associate with different product features or attributes.
http://onlinestatbook.com/stat_sim/reg_by_eye/index.html
El truco es minimizar las desviaciones a la media => se usa……
=> se usa…… (recordar varianza) método de mínimos cuadrados
Figuar 14.5 en excel
Figuar 14.5 en excel
The regression relationship is very strong since 88% of the variation in number of cars sold can be explained by the linear relationship between the number of TV ads and the number of cars sold.
FORGET ABOUT Anova
CONCLUSION: THE TWO TECHNIQUES ARE VERY SIMILAR, WITH DISCRIMINANT ANALYSIS HAVING MANY POTENTIAL APPLICATIONS IN
MARKETING
A telecommunications provider has segmented its customer base by service usage patterns, categorizing the customers into four groups.
If demographic data can be used to predict group membership, you can customize offers for individual prospective customers.
Suppose information on current customers is contained in telco.sav. Use the Discriminant Analysis procedure to classify customers.
Análisis Discriminante. You have created a discriminant model that classifies customers into one of four predefined "service usage" groups, based on demographic information from each customer.