2. Visualización de Data Histogramas y Distribuciones de Frecuencia Gráficas Comunes y “Data Plots” “Box and WhiskerPlots”
3. Histogramas y Distribuciones de Frecuencia La siguiente data muestra el número de botellas plásticas que utilizan diferentes estudiantes durante una semana: 6, 4, 7, 7, 8, 5, 3, 6, 8, 6, 5, 7, 7, 5, 2, 6, 1, 3, 5, 4, 7, 4, 6, 7, 6, 6, 7, 5, 4, 6, 5, 3 1
4. Histogramas y Distribuciones de Frecuencia La siguiente tabla muestra los países que consumen la mayor cantidad de agua por persona.
8. Histogramas y Distribuciones de Frecuencia Un histograma de frecuencia realativa es un histograma que en lugar de colocar en el eje de x las frecuencias utilizamos el porciento total de la data presente en ese “bin”
9. Histogramas y Distribuciones de Frecuencia Un polígono de frecuencia es similar a un histograma, pero en lugar de utilizar “bins”, un polígono es creado dibujando las frecuencias y conectando esos puntos con segmentos. Para poder crear un polígono de frecuencia primero debemos encontrar los puntos medios de cada clasificación.
13. Histogramas y Distribuciones de Frecuencia Los tres aspectos más importantes al comenzar a describir data son Forma, Centro y Esparcimiento. Regresemos al ejemplo de las botellas plásticas, podemos notar lo siguiente: La data está esparcida desde 0 hasta 9 (rango) Hay una gran concentración de estudiantes en las regiones 5, 6 y 7 (el centro se encuentra en esa área)
14. Histogramas y Distribuciones de Frecuencia En muchos conjuntos de data podremos encontrar que tiene una gran concentración de data que parece como una montaña. La data que tiene esta forma se le denomina típicamente como forma de campana.
15. Histogramas y Distribuciones de Frecuencia La forma de campana usualmente se parece a una de las siguientes tres imágenes. En estadísticas, se refiere a estas gráficas como curvas de densidad.
16. Histogramas y Distribuciones de Frecuencia La característica más importante de esta curva de densidad es la simetría. Esta gráfica es simétrica y en forma de campana.
17. Histogramas y Distribuciones de Frecuencia Esta gráfica tiene forma de campana, pero el centro de la data está concentrado en el lado izquierdo de la distribución. El lado derecho de la data esta esparcida en un área más ancha. Esta gráfica es torcida a la derecha (“skewedright”)
21. Histogramas y Distribuciones de Frecuencia Un histograma de frecuencias relativas, sería la misma gráfica, solamente utilizando las frecuencias relativas.
23. Histogramas y Distribuciones de Frecuencia Polígono de Frecuencia Acumulativa Se grafica similar al polígono de frecuencia, con la diferencia de que los puntos se colocan en el lado derecho de cada “bin” .
24. Histogramas y Distribuciones de Frecuencia Polígono de Frecuencia Acumulativa A este tipo de gráfica se lo conoce como Gráfica de Ojiva
25. Gráficas Comunes y Diagramas de Data Variables Categóricas: Gráficas de Barra y Gráficas Circulares
26. Gráficas Comunes y Diagramas de Data Gráfica de Barra No es un histograma. Las barras están separadas. La data es categórica. Se pueden cambiar de lugar las barras y la información sigue siendo la misma.
29. Gráficas Comunes y Diagramas de Data Variables Numéricas: Diagrama de Puntos Se utiliza para representar variable numérica. Múltiples puntos con el mismo valor son colocados unos encima de los otros utilizando espacios iguales.
32. Gráficas Comunes y Diagramas de Data Variables Numéricas: Diagramas de Tallo y Hoja En un diagrama de tallo y hoja, cada valor de la data es representados por dos dígitos: el tallo y la hoja.
33. Gráficas Comunes y Diagramas de Data Variables Numéricas: Diagramas de Tallo y Hoja En un diagrama de tallo y hoja, cada valor de la data es representados por dos dígitos: el tallo y la hoja.
34. Gráficas Comunes y Diagramas de Data Diagramas de Tallo “Back-to-Back” Este tipo de diagrama es útil para comparar dos distribuciones.
37. Gráficas Comunes y Diagramas de Data Data Bivariada: “Scatterplots” y Diagramas de Línea Bivariada significa dos variables. El propósito de examinar data bivariada es usualmente mostrar algún tipo de relación o asociación entre dos variables.
39. Gráficas Comunes y Diagramas de Data Colocaremos está data de la siguiente forma: Los % de papel reciclado en el eje horizontal y los % de vidrio en el eje vertical. Luego graficamos un punto que represente el % de reciclaje de cada país para los dos materiales. Esta serie de puntos se le conoce como un scatterplot.
44. Gráficas Comunes y Diagramas de Data Diagramas de Línea Explanatory Variable La variable independiente Response Variable La variable dependiente Un diagrama de línea es un “scatterplot” en el cual conectamos observaciones cronológicas sucesivas con segmentos para darnos más información sobre como cambia la data en un periodo de tiempo.
47. Gráficas Comunes y Diagramas de Data Scatterplots y Diagrama de Línea en la Calculadora Gráfica
48. Gráficas Comunes y Diagramas de Data Scatterplots y Diagrama de Línea en la Calculadora Gráfica
49. Gráficas Comunes y Diagramas de Data Scatterplots y Diagrama de Línea en la Calculadora Gráfica
50. Box-and-WhiskerPlots El resumen de los cinco números Es una descripción numérica del conjunto de data que comprende las siguientes medidas ( en orden): Valor mínimo Cuartillo inferior Mediana Cuartillo superior Valor máximo
51. Box-and-WhiskerPlots La siguiente tabla muestra la capacidad de reserva de los mayores recursos de agua en Arizona (1998). Determina el resumen de los cinco números. {3, 33, 55, 89, 98}
53. Box-and-WhiskerPlots Outliers en Box-and-WhiskerPlots Los siguientes datos son los porcientos para los lagos y reservas de California (se han omitido los nombres de las mismas) 80, 83, 77, 95, 85, 74, 34, 68, 90, 82, 75 Crea un box plot en tu calculadora gráfica.