Investigación de Mercado
Medidas de dispersión de datos
<ul><li>L as medidas de tendencia central no entregan información suficiente </li></ul><ul><li>N ecesitamos medidas de amp...
<ul><li>Hay medidas de dispersión absolutas,  </li></ul><ul><ul><li>la varianza, la desviación t i pica, la desviación med...
<ul><li>Cuando describimos una distribución de manera numérica, siempre informamos de la dispersión junto con el valor cen...
<ul><li>El   resumen de cinco-números   de una distribución es: la mediana, los cuartiles y los extremos (máximo y mínimo)...
<ul><li>Consiste en el punto medio, la primera cuartila (Q1), la tercera cuartila (Q3), el valor mínimo, y el valor máximo...
<ul><li>Un  boxplot  es una presentación gráfica del resumen de cinco-números </li></ul><ul><li>Los b oxplots  son particu...
<ul><li>El siguiente grupo de  boxplots compar a   la   efectividad   de  varios  contenedores de   café : </li></ul><ul><...
<ul><li>La suma de todas las desviaciones respecto al parámetro más utilizado, la media aritmética, es cero </li></ul><ul>...
<ul><li>La desviación típica, σ, se define como la raíz cuadrada de la varianza </li></ul>Medidas de dispersión: la desvia...
Medidas de dispersión: la desviación típica
<ul><li>Las medidas de forma caracterizan la forma de la gráfica de una distribución de datos estadísticos </li></ul><ul><...
Medidas de forma
<ul><li>Asimetría: </li></ul><ul><ul><li>Índice que expresa el grado de asimetría de la distribución </li></ul></ul><ul><u...
<ul><li>Se dice que una distribución de datos estadísticos es simétrica cuando la línea vertical que pasa por su media  </...
Medidas de forma: asimetrías
<ul><li>Curtosis: </li></ul><ul><ul><li>Índice que expresa el grado en que una distribución acumula casos en sus colas </l...
<ul><li>Se pretende medir cómo se reparten las frecuencias relativas de los datos entre el centro y los extremos, tomando ...
<ul><li>Percentiles: sólo para variables, al menos, ordinales </li></ul><ul><ul><li>No tiene sentido en nominales </li></u...
<ul><li>Dispersión (desviación típica, varianza, error típico): sólo para variables cuantitativas </li></ul><ul><li>Amplit...
<ul><li>Barras: cada barra es la frecuencia absoluta o porcentual </li></ul><ul><li>De sectores: circular, tamaño la frecu...
<ul><li>Tiene forma de campana. Los valores centrales son más probables de encontrar en el centro de la distribución </li>...
<ul><li>Son estimadores de tendencia central basados en la máxima verosimilitud (estimadores M) </li></ul><ul><ul><li>Hube...
<ul><li>Estadísticos: el grado de relación entre dos variables categóricas no puede ser establecido observando las frecuen...
<ul><li>Correlación de Pearson: asociación lineal entre variables de intervalo o razón </li></ul><ul><li>Correlación de Sp...
<ul><li>Coeficiente de Contingencia:  toma valores entre 0 y 1 </li></ul><ul><ul><li>Un coeficiente 0 indica independencia...
<ul><li>Con los datos ordinales tiene sentido hablar de dirección de la relación </li></ul><ul><ul><li>Gamma: oscila entre...
Muchas Gracias Email:  [email_address] Blog:  economiaymedios.blogspot.com Twitter:  reds_cl Slideshare:  www.slideshare.n...
Próxima SlideShare
Cargando en…5
×

Ece ua publi223 investigacion de mercado - pp unidad 04 - carlos rojas - primavera 2011 - 12

1.144 visualizaciones

Publicado el

Publicado en: Educación
0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
1.144
En SlideShare
0
De insertados
0
Número de insertados
3
Acciones
Compartido
0
Descargas
22
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

Ece ua publi223 investigacion de mercado - pp unidad 04 - carlos rojas - primavera 2011 - 12

  1. 3. Investigación de Mercado
  2. 4. Medidas de dispersión de datos
  3. 5. <ul><li>L as medidas de tendencia central no entregan información suficiente </li></ul><ul><li>N ecesitamos medidas de amplitud de la distribución </li></ul><ul><li>Indican en qué medida los datos se agrupan en torno a un valor central. </li></ul><ul><li>Muestran el grado de homogeneidad de los datos </li></ul>Medidas de dispersión
  4. 6. <ul><li>Hay medidas de dispersión absolutas, </li></ul><ul><ul><li>la varianza, la desviación t i pica, la desviación media o los recorridos </li></ul></ul><ul><li>Hay medidas de dispersión relativas, </li></ul><ul><ul><li>coeficiente de variación, el coeficiente de apertura o los recorridos relativos </li></ul></ul>Medidas de dispersión
  5. 7. <ul><li>Cuando describimos una distribución de manera numérica, siempre informamos de la dispersión junto con el valor central </li></ul><ul><li>El rango de los datos es la diferencia en los valores máximos y mínimos : </li></ul><ul><li>Rang o = max – min </li></ul><ul><li>Una desventaja de los rangos, es que un solo valor extremo puede crear rangos muy largos que no son representativos </li></ul>Medidas de dispersión: recorridos
  6. 8. <ul><li>El resumen de cinco-números de una distribución es: la mediana, los cuartiles y los extremos (máximo y mínimo) </li></ul><ul><li>ejemplo : </li></ul>El resumen de cinco números
  7. 9. <ul><li>Consiste en el punto medio, la primera cuartila (Q1), la tercera cuartila (Q3), el valor mínimo, y el valor máximo del grupo de datos </li></ul><ul><li>El resumen de cinco números del grupo de datos 2, 4, 5, 6, 6, 8, 9 es: </li></ul><ul><ul><li>Mínimo: 2 </li></ul></ul><ul><ul><li>Q1: 4 </li></ul></ul><ul><ul><li>Punto medio: 6 </li></ul></ul><ul><ul><li>Q3: 8 </li></ul></ul><ul><ul><li>Máximo 9 </li></ul></ul>El resumen de cinco números
  8. 10. <ul><li>Un boxplot es una presentación gráfica del resumen de cinco-números </li></ul><ul><li>Los b oxplots son particularmente útiles cuando se comparan grupos </li></ul>Boxplots, Turkeys box o diagrama de caja
  9. 11. <ul><li>El siguiente grupo de boxplots compar a la efectividad de varios contenedores de café : </li></ul><ul><li>¿Qué nos dice esta gráfica ? </li></ul>Comparando grupos con boxplots
  10. 12. <ul><li>La suma de todas las desviaciones respecto al parámetro más utilizado, la media aritmética, es cero </li></ul><ul><li>Si se desea una medida de la dispersión sin los inconvenientes para el cálculo que tienen las desviaciones medias, una solución es elevar al cuadrado tales desviaciones antes de calcular el promedio </li></ul>Medidas de dispersión: la varianza
  11. 13. <ul><li>La desviación típica, σ, se define como la raíz cuadrada de la varianza </li></ul>Medidas de dispersión: la desviación típica
  12. 14. Medidas de dispersión: la desviación típica
  13. 15. <ul><li>Las medidas de forma caracterizan la forma de la gráfica de una distribución de datos estadísticos </li></ul><ul><li>La mayoría de estos parámetros tiene un valor que suele compararse con la campana de Gauss </li></ul><ul><li>La gráfica de la distribución normal es una de las que con más frecuencia se ajusta a fenómenos reales </li></ul><ul><ul><li>caracteres morfológicos de individuos como la estatura </li></ul></ul><ul><ul><li>caracteres fisiológicos como el efecto de un fármaco </li></ul></ul><ul><ul><li>caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos </li></ul></ul><ul><ul><li>caracteres psicológicos como el cociente intelectual </li></ul></ul><ul><ul><li>nivel de ruido en telecomunicaciones </li></ul></ul>Medidas de forma
  14. 16. Medidas de forma
  15. 17. <ul><li>Asimetría: </li></ul><ul><ul><li>Índice que expresa el grado de asimetría de la distribución </li></ul></ul><ul><ul><li>Asimetría positiva: los valores extremos se encuentran por encima de la media </li></ul></ul><ul><ul><li>Asimetría negativa: los valores extremos se encuentran por debajo de la media </li></ul></ul><ul><ul><li>Los índices cercanos a cero indican simetría </li></ul></ul>Distribución
  16. 18. <ul><li>Se dice que una distribución de datos estadísticos es simétrica cuando la línea vertical que pasa por su media </li></ul><ul><ul><li>Divide a su representación gráfica en dos partes simétricas </li></ul></ul><ul><ul><li>Los valores equidistantes de la media, a uno u otro lado, presentan la misma frecuencia </li></ul></ul><ul><li>En las distribuciones simétricas los parámetros media, mediana y moda coinciden </li></ul><ul><li>Si una distribución presenta cierta asimetría, de un tipo o de otro, los parámetros se sitúan como muestra el siguiente gráfico: </li></ul>Medidas de forma: asimetrías
  17. 19. Medidas de forma: asimetrías
  18. 20. <ul><li>Curtosis: </li></ul><ul><ul><li>Índice que expresa el grado en que una distribución acumula casos en sus colas </li></ul></ul><ul><ul><li>Positiva indica que en las colas de la distribución hay acumulados más casos que en una distribución normal </li></ul></ul><ul><ul><li>Los índices cercanos a cero, indican una semejanza con la distribución normal </li></ul></ul>Distribución
  19. 21. <ul><li>Se pretende medir cómo se reparten las frecuencias relativas de los datos entre el centro y los extremos, tomando como comparación la campana de Gauss </li></ul>Medidas de forma: curtosis
  20. 22. <ul><li>Percentiles: sólo para variables, al menos, ordinales </li></ul><ul><ul><li>No tiene sentido en nominales </li></ul></ul><ul><li>Media: sólo variables cuantitativas </li></ul><ul><li>Mediana: típicamente ordinal </li></ul><ul><li>Moda: para todo tipo de variables </li></ul>¿Cuándo utilizar cada estadístico?
  21. 23. <ul><li>Dispersión (desviación típica, varianza, error típico): sólo para variables cuantitativas </li></ul><ul><li>Amplitud o rango: todas la variables, excepto nominales </li></ul><ul><li>Asimetría y Curtosis: sólo para variables cuantitativas </li></ul>¿Cuándo utilizar cada estadístico?
  22. 24. <ul><li>Barras: cada barra es la frecuencia absoluta o porcentual </li></ul><ul><li>De sectores: circular, tamaño la frecuencia absoluta o porcentual </li></ul><ul><li>Histogramas: sólo para formato numérico </li></ul><ul><li>Con curva normal: curva normal superpuesta </li></ul>Tipos de gráficos
  23. 25. <ul><li>Tiene forma de campana. Los valores centrales son más probables de encontrar en el centro de la distribución </li></ul><ul><li>Es simétrica respecto de su valor central </li></ul><ul><li>Media=Mediana=Moda </li></ul><ul><li>Es asintótica respecto de las abscisas </li></ul><ul><li>Los puntos de inflexión se encuentran a una desviación típica de la media </li></ul><ul><li>Cualquier combinación lineal de variables se distribuyen según el modelo normal </li></ul>Curva normal
  24. 26. <ul><li>Son estimadores de tendencia central basados en la máxima verosimilitud (estimadores M) </li></ul><ul><ul><li>Huber, Andrew, Hamptel y Turkey </li></ul></ul><ul><li>Los estimadores M son una media ponderada de las distancias al centro </li></ul><ul><li>Los estimadores M son menos sensibles a la presencia de otros extremos </li></ul><ul><li>Cuando la distribución es asimétrica, estimadores M. </li></ul>Estimadores robustos centrales
  25. 27. <ul><li>Estadísticos: el grado de relación entre dos variables categóricas no puede ser establecido observando las frecuencias en la tabla </li></ul><ul><li>Para determinar si dos variables se encuentran relacionadas se deben utilizar medidas de asociación </li></ul><ul><ul><li>Chi cuadrado </li></ul></ul><ul><ul><li>Fischer </li></ul></ul>Variables categóricas: tablas de contingencia
  26. 28. <ul><li>Correlación de Pearson: asociación lineal entre variables de intervalo o razón </li></ul><ul><li>Correlación de Spearman: asociación lineal entre variables ordinales </li></ul><ul><ul><li>Ambos coeficientes poco útiles en la tabla de contingencia típica </li></ul></ul>Correlaciones categóricas
  27. 29. <ul><li>Coeficiente de Contingencia: toma valores entre 0 y 1 </li></ul><ul><ul><li>Un coeficiente 0 indica independencia mientras que 1 asociación perfecta </li></ul></ul><ul><li>Phi y V de Cramer: adopta valores entre 0 y 1, igual a Pearson </li></ul>Datos ordinales
  28. 30. <ul><li>Con los datos ordinales tiene sentido hablar de dirección de la relación </li></ul><ul><ul><li>Gamma: oscila entre –1 y 1, cuando gamma=0, independientes </li></ul></ul><ul><ul><li>D de Somer </li></ul></ul><ul><ul><li>Tau-b de Kendall </li></ul></ul><ul><ul><li>Tau-c de Kendall </li></ul></ul>Datos ordinales
  29. 31. Muchas Gracias Email: [email_address] Blog: economiaymedios.blogspot.com Twitter: reds_cl Slideshare: www.slideshare.net/reds_cl LinkedIn: http://cl.linkedin.com/in/carlosrojasa Skype: reds_cl

×