Marzo 2011 Profesor: Carlos Rojas A. – MBA Consultor | Media Management
Una forma natural para comparar 2 grupos es un diagrama de caja de los datos para ambos grupos. Por ejemplo:
Medias Prueba  T  para una muestra Prueba  T  para dos muestras independientes Prueba  T  para dos muestras relacionadas.
Una vez que se han examinado los boxplots, podemos enfrentarnos a una comparación de dos medias. Al comparar dos medias el parámetro es la diferencia entre dos medias ,   1  –   2 .  La cantidad es nuestro mejor estimador de la diferencia entre ambas medias
Recordemos que para valores independientes la desviación estándar es: Así el error estándar es: Porque estamos trabajando con medias y estimando el error estándar de los datos usados, el modelo de muestreo es t-student
Supuesto de población normal : Condición de normalidad  ( revisar para ambas muestras ) Supuesto de grupos independientes :  los grupos que estamos comparando deben ser independientes uno del otro Supuesto de igualdad de varianzas: dependiendo del valor del calculo se trabaja con medias independientes o relacionadas
Entrega estadísticos descriptivos que pueden calcularse para los distintos grupos y sub grupos definidos para una o más variables independientes. Anova de un factor Proporción de la varianza explicada Hipótesis de linealidad
Esta prueba permite el contraste referido a una media poblacional Se hace necesario estimar la DS muestral Al trabajar con la DS muestral, obliga a usar t Esta tipificación en t, del estadístico  Ŷ  (media), es lo que se llama prueba t para una muestra
Su beneficio es conocer la probabilidad asociada a cada uno de los valores y que puede obtener de una muestra N. El verdadero valor  μ   S = desviación poblacional Para que el estadístico  T  se ajuste a  t Población normal A más de 20 o 30 casos
El nivel crítico indica la probabilidad de obtener una media  Ŷ  tan alejada de  μ  como la de hecho obtenida μ  es un valor propuesto en “Valor de Prueba” Si esa probabilidad es menor que 0,05, entonces se rechaza la hipótesis nula de que la media poblacional es el valor propuesto
Normalidad: las muestras con que se trabaja proceden de poblaciones normalmente distribuidas Homocedasticidad u homogeneidad de varianzas: todas esas poblaciones normales poseen la misma varianza
Spss entrega 2 pruebas de significación: Kolmogorov-Smirnov Shapiro-Wilk (= ó < que 50 obs.) Spss entrega 2 gráficos de normalidad: Q-Q Normal Q-Q Normal sin tendencia
Los estadísticos permiten contrastar la hipótesis nula de que los datos muestrales proceden de poblaciones normales: se rechaza la hipótesis nula de normalidad cuando el nivel crítico (.sig) es menor que el nivel de significancia establecido, (generalmente 0,05 o 5%)
Los estadísticos son muy sensibles a los puntos extremos, por lo que hay que acompañarlos de sus respectivas gráficas Spss entrega 2 gráficos de normalidad: Q-Q Normal Q-Q Normal sin tendencia Explorar > gráficos con pruebas de normalidad
Q-Q Normal: desviaciones de la línea diagonal indican desviaciones de la normalidad Q-Q Normal sin tendencia: si la muestra proviene de una población normal entonces los datos deben oscilar aleatoriamente en torno a la horizontal La presencia de patrones, indican desviaciones de la normalidad
Permite contrastar la hipótesis referida a las diferencias entre dos medias independientes Dos poblaciones normales  Muestras Independientes La prueba T permite contrastar la diferencia entre dos medias muestrales tipificadas
Se usan las medias muestrales para contrastar la hipótesis nula de que las medias poblacionales son iguales Se puede usar iguales varianzas o diferentes varianzas Prueba de Levene de Homogeneidad Entrega información para ambos casos
Normalidad: las muestras con que se trabaja proceden de poblaciones normalmente distribuidas Homocedasticidad u homogeneidad de varianzas: todas esas poblaciones normales poseen la misma varianza
Spss entrega la prueba de significación de Levene Spss entrega el gráficos de dispersión por nivel
La prueba de Levene contrasta la hipótesis que los grupos definidos por la variable factor proceden de poblaciones con la misma varianza Esta prueba consiste en hacer una análisis de varianza de un factor utilizando como variable dependiente la diferencia, en valor absoluto, entre cada puntuación individual y la media
Spss entrega la prueba de significación de Levene: El nivel crítico  asociado al estadístico de Levene permite contrastar la hipótesis de homogeneidad de las varianzas Si el valor crítico es menor que 0,05, se debe rechazar la hipótesis de homogeneidad
La prueba T para muestras relacionadas, permite contrastar la hipótesis referida a la diferencia entre dos medias relacionadas Se dispone de una población a la cual se le quiere medir: Dos variables diferentes La misma variable en dos momentos diferentes
Desde una perspectiva estadística es igual a “ prueba T para una muestra ” Ahora se tienen 2 muestras relacionadas o pares de puntuaciones
La hipótesis nula es que hay igualdad entre las medias de dos variables Al revisar la  sig ., entonces si es menor que 0,05 se rechaza la hipótesis nula de igualdad, por lo que habría diferencias significativas entre estas dos variable elegidas
El supuesto de independencia requiere especial preocupación Revisen los gráficos, busquen puntos extremos y distribuciones no normales diagramas de caja
Email:  [email_address] Blog:  economiaymedios.blogspot.com Twitter:  reds_cl Slideshare:  www.slideshare.net/reds_cl  LinkedIn:  http://cl.linkedin.com/in/carlosrojasa Skype: reds_cl Muchas Gracias Marzo 2011 Profesor: Carlos Rojas A. – MBA Consultor | Media Management

15 spss comparacion de medias

  • 1.
    Marzo 2011 Profesor:Carlos Rojas A. – MBA Consultor | Media Management
  • 2.
    Una forma naturalpara comparar 2 grupos es un diagrama de caja de los datos para ambos grupos. Por ejemplo:
  • 3.
    Medias Prueba T para una muestra Prueba T para dos muestras independientes Prueba T para dos muestras relacionadas.
  • 4.
    Una vez quese han examinado los boxplots, podemos enfrentarnos a una comparación de dos medias. Al comparar dos medias el parámetro es la diferencia entre dos medias ,  1 –  2 . La cantidad es nuestro mejor estimador de la diferencia entre ambas medias
  • 5.
    Recordemos que paravalores independientes la desviación estándar es: Así el error estándar es: Porque estamos trabajando con medias y estimando el error estándar de los datos usados, el modelo de muestreo es t-student
  • 6.
    Supuesto de poblaciónnormal : Condición de normalidad ( revisar para ambas muestras ) Supuesto de grupos independientes : los grupos que estamos comparando deben ser independientes uno del otro Supuesto de igualdad de varianzas: dependiendo del valor del calculo se trabaja con medias independientes o relacionadas
  • 7.
    Entrega estadísticos descriptivosque pueden calcularse para los distintos grupos y sub grupos definidos para una o más variables independientes. Anova de un factor Proporción de la varianza explicada Hipótesis de linealidad
  • 8.
    Esta prueba permiteel contraste referido a una media poblacional Se hace necesario estimar la DS muestral Al trabajar con la DS muestral, obliga a usar t Esta tipificación en t, del estadístico Ŷ (media), es lo que se llama prueba t para una muestra
  • 9.
    Su beneficio esconocer la probabilidad asociada a cada uno de los valores y que puede obtener de una muestra N. El verdadero valor μ S = desviación poblacional Para que el estadístico T se ajuste a t Población normal A más de 20 o 30 casos
  • 10.
    El nivel críticoindica la probabilidad de obtener una media Ŷ tan alejada de μ como la de hecho obtenida μ es un valor propuesto en “Valor de Prueba” Si esa probabilidad es menor que 0,05, entonces se rechaza la hipótesis nula de que la media poblacional es el valor propuesto
  • 11.
    Normalidad: las muestrascon que se trabaja proceden de poblaciones normalmente distribuidas Homocedasticidad u homogeneidad de varianzas: todas esas poblaciones normales poseen la misma varianza
  • 12.
    Spss entrega 2pruebas de significación: Kolmogorov-Smirnov Shapiro-Wilk (= ó < que 50 obs.) Spss entrega 2 gráficos de normalidad: Q-Q Normal Q-Q Normal sin tendencia
  • 13.
    Los estadísticos permitencontrastar la hipótesis nula de que los datos muestrales proceden de poblaciones normales: se rechaza la hipótesis nula de normalidad cuando el nivel crítico (.sig) es menor que el nivel de significancia establecido, (generalmente 0,05 o 5%)
  • 14.
    Los estadísticos sonmuy sensibles a los puntos extremos, por lo que hay que acompañarlos de sus respectivas gráficas Spss entrega 2 gráficos de normalidad: Q-Q Normal Q-Q Normal sin tendencia Explorar > gráficos con pruebas de normalidad
  • 15.
    Q-Q Normal: desviacionesde la línea diagonal indican desviaciones de la normalidad Q-Q Normal sin tendencia: si la muestra proviene de una población normal entonces los datos deben oscilar aleatoriamente en torno a la horizontal La presencia de patrones, indican desviaciones de la normalidad
  • 16.
    Permite contrastar lahipótesis referida a las diferencias entre dos medias independientes Dos poblaciones normales Muestras Independientes La prueba T permite contrastar la diferencia entre dos medias muestrales tipificadas
  • 17.
    Se usan lasmedias muestrales para contrastar la hipótesis nula de que las medias poblacionales son iguales Se puede usar iguales varianzas o diferentes varianzas Prueba de Levene de Homogeneidad Entrega información para ambos casos
  • 18.
    Normalidad: las muestrascon que se trabaja proceden de poblaciones normalmente distribuidas Homocedasticidad u homogeneidad de varianzas: todas esas poblaciones normales poseen la misma varianza
  • 19.
    Spss entrega laprueba de significación de Levene Spss entrega el gráficos de dispersión por nivel
  • 20.
    La prueba deLevene contrasta la hipótesis que los grupos definidos por la variable factor proceden de poblaciones con la misma varianza Esta prueba consiste en hacer una análisis de varianza de un factor utilizando como variable dependiente la diferencia, en valor absoluto, entre cada puntuación individual y la media
  • 21.
    Spss entrega laprueba de significación de Levene: El nivel crítico asociado al estadístico de Levene permite contrastar la hipótesis de homogeneidad de las varianzas Si el valor crítico es menor que 0,05, se debe rechazar la hipótesis de homogeneidad
  • 22.
    La prueba Tpara muestras relacionadas, permite contrastar la hipótesis referida a la diferencia entre dos medias relacionadas Se dispone de una población a la cual se le quiere medir: Dos variables diferentes La misma variable en dos momentos diferentes
  • 23.
    Desde una perspectivaestadística es igual a “ prueba T para una muestra ” Ahora se tienen 2 muestras relacionadas o pares de puntuaciones
  • 24.
    La hipótesis nulaes que hay igualdad entre las medias de dos variables Al revisar la sig ., entonces si es menor que 0,05 se rechaza la hipótesis nula de igualdad, por lo que habría diferencias significativas entre estas dos variable elegidas
  • 25.
    El supuesto deindependencia requiere especial preocupación Revisen los gráficos, busquen puntos extremos y distribuciones no normales diagramas de caja
  • 26.
    Email: [email_address]Blog: economiaymedios.blogspot.com Twitter: reds_cl Slideshare: www.slideshare.net/reds_cl LinkedIn: http://cl.linkedin.com/in/carlosrojasa Skype: reds_cl Muchas Gracias Marzo 2011 Profesor: Carlos Rojas A. – MBA Consultor | Media Management