El documento habla sobre la visualización de datos. Explica que la visualización de datos es un componente vital en el análisis de datos para resumir grandes cantidades de información a través de gráficos. También describe varios tipos de gráficos como histograma, gráficos de barras y circulares, y gráficos de cajas y bigotes. Finalmente, presenta algunos principios básicos para la creación de visualizaciones de datos efectivas.
2. Visualización de datos
• La visualización de datos es el componente vital en el análisis de datos
• Con ella se puede resumir grandes cantidades de información a través de
un gráfico
• Existen muchos tipos de gráficos, cada uno para casos de uso
específicos.
• Uno de los procesos en el análisis de datos es escoger el gráfico
adecuado para representar los datos y la información que desea entregar.
Fuente: How to Choose the Right Data Visualization
3. Visualización de datos
• ¿Qué deseo representar?
• Mostrar los cambios en tiempo
• Mostrar una parte de todos los datos
• Representar flujos y procesos
• Ver como se distribuyen los datos
• Comparar valores entre grupos
• Observar valores entre variable
• Representar datos geográficos
Fuente: How to Choose the Right Data Visualization
4. Visualización de datos
• ¿Qué datos tengo?, ¿Como son mis datos?, ¿Cuantas variables voy a
graficar?
• El tipo de gráfico que se va a utilizar dependerá del tipo de datos que
usted tenga.
• Categórico
• Numerico
• Combinación de ambos
6. A continuación se presentarán
algunos de los principales gráficos
que estudiaremos en este curso
7. Tipos de Gráficos
• Histograma
• Representación grafica de una
variable en forma de barras donde
la superficie de cada barra es
proporcional a la frecuencia de los
valores representados sirven para
obtener una vista general o
panorama de la distribución de la
población o de la muestra respecto
a una característica cuantitativa y
continua(Ej: Longitud y peso)
8. • Gráficos de barra:
• Representa graficamente un conjunto de datos o valores formado por
barras rectangulares de longitudes proporcionales a los valores
representados son usados para comparar cantidades de valores en
diferentes momentos, también productos.
• Es una forma de resumir un conjunto de datos por categoría muestra los
datos utilizando varias barras de la misma anchura cada una de las
cuales representa una categoría concreta
Tipos de Gráficos
10. • Gráficos Circular:
• También llamado gráfico de torta, es
utilizado para representar magnitudes en
frecuencias o porcentajes.
• Un circulo se divide en sectores y cada
sector representa el porcentaje de cada
dato respecto al total de datos
• El largo de arco (i.e. area) de cada
sector es proporcional a la cantidad que
representa.
Distribución de colores de bolsitas de M&M(chocolate de leche)
Tipos de Gráficos
12. • Gráfico de cajas y bigotes o Box Plot:
• Es un método estandarizado para representar gráficamente una serie de
datos numéricos a través de sus cuartiles, el diagrama de caja muestra a
simple vista la mediana y los cuartiles de los datos.
• Representación visual que describe varias características importantes al
mismo tiempo, tales como la dispersión y la simetría
Tipos de Gráficos
13. Los gráficos de cajas y bigotes pueden dividirse en dos secciones.
La caja corresponde a la sección central y representa a la mayoría de
los datos.
Al centro está expresada la mediana (o p50) con una línea horizontal.
El límite superior de la caja es el p75 y el inferior el p25, lo que
corresponde al rango intercuartil.
Los bigotes en cambio muestran la variabilidad fuera de la caja, pero
dentro de un límite que corresponde a 1,5 veces el recorrido
intercuartil (diferencia entre el p75 y p25).
Si existen valores más allá de esta frontera, éstos se dibujan como
puntos externos al bigote y reciben el nombre de valores extremos
o outliers (Figura 1).
Tipos de Gráficos
14. • Gráficos Poligonal: Representa la frecuencia de los datos a lo largo del
tiempo. Se usa un eje para el tiempo y otro para los datos, se ponen
puntos en la intersección de los ejes para representar cada dato y se unen
los puntos para formar un polígono con el eje horizontal
Tipos de Gráficos
16. Principios básicos de la visualización
• Use gráficos simples: mostrar lo que queremos lo más
directo posible.
• Si tiene pocos datos prefiera una tabla.
• Por muy bonito que puede ser un gráfico, la misma
información se puede entregar con alguna tabla de
números en forma bastante más sencilla o rápida.
Datos de
pobreza
Número de
personas
Porcentaje de
personas
Pobres 3.530.889 20,7%
No pobres 13.529.811 79,3%
Y por supuesto con la
información correcta!!
18. Principios básicos de la visualización
• Evite ordenar por nombre
• Facilita la comparación de los datos
ordenándolos en base a los valores
de la variable. Casi nunca se
ordenan por nombre.
• Los colores permiten resaltar lo que
uno quiera, pero al mismo tiempo
es un distractor, en caso de no ser
necesario, es mejor no usar colores
distintos.
19. Principios básicos de la visualización
• Muestre toda la información posible
• Para poder detectar un patrón, toda la
información debe estar visible.
20. • Resalte el Objetivo
• Resalta lo que quieres mostrar en
el gráfico, si quieres mostrar una
serie en particular colorea solo esa
serie.
Principios básicos de la visualización
21. • Evite leyendas
• No uses leyendas en caso de no
ser necesarias. Intenta usar
etiquetas dentro de los gráficos, si
es posible.
Principios básicos de la visualización
22. Principios básicos de la visualización
• Evite distracciones
• Disminuye toda la información que pueda
distraer en forma significativa del gráfico
que se observa.
23. Principios básicos de la visualización
• Facilite la comparación
• Los elementos más cercanos son más
fáciles de comparar entre sí, evita que
exista una gran distancia entre los
elementos a comparar.
24. Principios básicos de la visualización
• Evite cálculos
• Evita que la persona tenga que realizar
cálculos en el gráfico, muestra
directamente lo que quieras resaltar.
Observe la diferencia imports - exports
25. Principios básicos de la visualización
• Incluya el valor 0 (gráfico de barras)
• La inclusión del valor 0 puede ser
discutible, pero en un gráfico de barras
tiene que ser incluido o puede llevar a
confusión.
26. Principios básicos de la visualización
• ¡Usted no lo haga!
A continuación se proporcionan una serie de malos gráficos
inclusive con errores….veámoslos!!