4. Dr. Jorge Ramírez Medina
Descomposición de la variación
• SSentre. Estimación de la variabilidad entre tratamientos, también se le
denota por SSx, esta es la variación en X relacionada a la variación en las
medias de cada muestra. Se le conoce como SCTR suma de los cuadrados
debido a los tratamientos.
• SSdentro. variación dentro de cada una de las muestras, también denotada
como SSerror, es la variación en X debido a la variación dentro de cada una
de las muestras. Se le conoce como SCE, suma de cuadrados debido al error
• SSy. Es la variación total. Se le conoce como STC, suma de cuadrados del
total
STC = SCTR + SCE
8. Dr. Jorge Ramírez Medina
Ejercicio en clase
Cata de Vinos
Sube en la plataforma el ejercicio
sobre la cata de vinos. Atiende las
instrucciones del profesor para
esta actividad
13. Dr. Jorge Ramírez Medina
Suposiciones del modelo
• E(e)=0
• Varianza de e, (que es 2) es la misma para todos los valores de x.
• Los valores de e son independientes.
• e es una variable distribuida normalmente
24. Dr. Jorge Ramírez Medina
Usando la prueba F
Fuente de
variación
Suma de
cuadrados
Grados
de
libertad
Cuadrado Medio F p-value
Regresión SCR 1 CMR=SCR/1 F=CMR/CME tablas
Error SCE n-2 CME=SCE/(n-2)
Total STC n-1
27. Dr. Jorge Ramírez Medina
Análisis de residuos
• Cuando se cumplen las hipótesis estructurales del modelo de
regresión lineal. se observa una nube de puntos en dirección
horizontal y con anchura constante (la media de cada error debería
ser cero y tener todas la misma varianza).
28. Dr. Jorge Ramírez Medina
Análisis de residuos
Si se viola la linealidad se observará una falta de linealidad también
en los residuos
29. Dr. Jorge Ramírez Medina
Análisis de residuos
Si se viola la homoscedasticidad, la anchura de la banda no será
constante
30. Dr. Jorge Ramírez Medina
Análisis de residuos
Una relación lineal entre los residuos y las predicciones puede
indicar que alguna variable no incluida en el modelo puede ser
significativa
31. Dr. Jorge Ramírez Medina
Ejemplo de RLS
¿Cuál es el país que más contribuye al bienestar de la humanidad?
Hablar de lo mala que es la CocaCola.
Satanizar
Buscar alumno en contra de Coca y preguntarle su evaluación del 1-10
Después: poner comercial de la Coca Cola
Mostrarles el caso Coca Cola Femsa – EGADE
Buscar alumno en favor de Coca y preguntarle su evaluación del 1-10
En resumen , la racionalidad del análisis de varianza se basa en el cálculo de dos estimaciones independientes de la varianza poblacional s2 común. Una estimación se basa en la variabilidad entre las medias de las muestras mismas(entre las muestras), y la otra en la variabilidad de los datos dentro de cada muestra. Si se comparan ambas, se podrá determinar si las medias de la población son iguales.
The total variation in Y, denoted by SSy, can be decomposed into two components:
SSy = SSbetween + SSwithin
where the subscripts between and within refer to the categories of X.
SSbetween is the variation in Y related to the variation in the means of the categories of X. For this reason, SSbetween is also denoted as SSx.
SSwithin is the variation in Y related to the variation within each category of X. SSwithin is not accounted for by X. Therefore it is referred to as SSerror.
Para presentar de manera adecuada los cálculos anteriores se usa una tabla conocida como ANOVA
(presentación depende del paquete estadístico usado)
HACER AQUÍ EL EJEMPLO DE LA PLANTA CON ANOVA USANDO EXCEL
Tres propuestas para reducir el estrés en el trabajo
Pero cada quién lo maneja a su modo
CME fuente de variación del grupo depende de las variaciones individuales de los empleados también
Quitar estas diferencias con diseño de bloque aleatorizado
Ejercicios en clase/Estrés
Un experimento factorial es un diseño experimental que permite obtener simultáneamente conclusiones de dos o más facotres.
El termino factorial se debe a que incluye todas las posibles combinaciones
Estudiantes de tres licenciaturas aplican un examen en donde hay tres apoyos
Suponga que se toma una muestra de dos estudiantes para cada una de las combinaciones de tratamientos (dos replicaciones)
De cada licenciatura se tomarán seis estudiantes
las hipótesis estructurales del modelo de regresión lineal
Si se rechaza Ho => b1 es diferente de cero
Por lo que aplica y=bo+b1x+e
X y Y están relacionadas linealmente
ECM= Error cuadrado medio. Estimación de S^2
Porcentaje de la variación en la variable dependiente que es explicada por la variable independiente.
En peso-altura. = .58 (peso explicado por la altura)
58% de la variación en peso es explicado por la altura el otro 42% es error.
CMR= Cuadrado Medio de la regresión
ECM = error cuadrado medio-> error estándar de estimación
Error típico = raíz(s^2)
Michael Green
The good country Index
Michael Green
The good country Index
1- Qué es estadística?
2- Qué son los datos cuantitativos y cualitativos
3- ¿Cuáles son los modelos estadísticos más simples?
4- ¿Qué es la varianza?
5- ¿Para qué sirve un diagrama de caja?
6- ¿Qué es un estadístico de prueba?
7- ¿Cuál es el objetivo de la estadística inferencial?
8- ¿Cuál es la fórmula de la distribución Poisson?
9- ¿Qué establece el teorema del límite central?
10- ¿Qué es estandarizar?
11- ¿Porqué nunca aceptamos la hipótesis nula?
12- en general una hipótesis prueba el valor de la media de una población y toma tres formas ¿cuáles son?
13- ¿Qué son las pruebas pareadas?
14- ¿cuál es la hipótesis que probamos con ANOVA?
15- ¿Cuál es el modelo de RLS?