2. TABLEAU PUBLIC
Ante la explosión de datos en la sociedad de la
información, es necesario contar con herramientas que
sinteticen y faciliten la interpretación de estos. Las
herramientas de visualización de datos permiten
presentar de forma dinámica y panorámica datos
estadísticos de múltiples temas, tanto para el
entendimiento de la situación corriente, como para la
toma de decisiones.
3. TABLEAU PUBLIC
Este curso proveerá los recursos para que los
estudiantes cuenten con las destrezas básicas de
análisis de datos. Se llevarán a cabo adiestramientos y
ejercicios prácticos para que los estudiantes completen
el montaje adecuado de los datos analizados en tablas,
gráficos y sus respectivos dashboard en el programa
Tableau Public.
4. THE GREAT HACK
Personal data has surpassed oil as the world’s
most valuable asset, and warns viewers that
companies and governments are hacking into
way more than computers.
Brittany Kaiser,
Former business development director for
Cambridge Analytica
5. EL VALOR DE LOS DATOS
• A NEW commodity spawns a lucrative, fast-
growing industry, prompting antitrust
regulators to step in to restrain those who
control its flow. A century ago, the resource in
question was oil. Now similar concerns are
being raised by the giants that deal in data, the
oil of the digital era. These titans—Alphabet
(Google’s parent company), Amazon, Apple,
Facebook and Microsoft—look unstoppable.
They are the five most valuable listed firms in
the world. Their profits are surging: they
collectively racked up over $25bn in net profit
in the first quarter of 2017. Amazon captures
half of all dollars spent online in America.
Google and Facebook accounted for almost all
the revenue growth in digital advertising in
America last year.
6. OBJETIVOS
Al concluir los talleres el participante tendrá las destrezas básicas para
el manejo del software Tableau Public. Para ello:
1. Se familiarizará con los análisis de estadísticas descriptivas
2. Conocerá fuentes de información estadística para los ejercicios de
visualización de datos, su contextualización o complementación
de sus bases de datos.
3. Realizará la apertura de cuenta e instalación del software Tableau
Public
4. Preparará los conjuntos de datos secundarios para su utilización
con el software Tableau Public
7. OBJETIVOS
(continuación)
5. Generará tablas y distintas operaciones básicas para análisis de datos
6. Preparará gráficos dinámicos para facilitar la interpretación, análisis,
presentación y manejo de los datos
7. Creará mapas coropléticos para facilitar la interpretación, análisis,
presentación y manejo de los datos
8. Organizará paneles y otras composiciones para la presentación integral
de conjuntos de datos
9. Generará composiciones de imágenes o fotografías para enriquecer los
recursos de presentación e interacción con los datos.
8. META
Al concluir el taller de hoy el participante tendrá las
destrezas básicas para la creación de tablas en el software
Tableau Public. Para ello:
•Conocer distintos repositorios de datos
•Conocer los componentes y manipulación del interfaz
•Preparar, cargar y manejar los datos
•Generar tabulaciones
•Publicar tabulaciones
9. ANÁLISIS Y VISUALIZACIÓN DE DATOS
¿Cuál es la diferencia entre análisis de datos y
visualización de datos?
10.
11. PRINCIPIOS EN LA COMUNICACIÓN DE DATOS
1. Definir el objetivo
2. Usar los datos adecuados
3. Identificar los recursos adecuados de visualización
4. Tomar en cuenta consideraciones estéticas
5. Seleccionar medios y canales adecuados
6. Verificar los resultados
Fuente: Ben Jones (2014).
12. PRINCIPIOS EN LA COMUNICACIÓN DE DATOS
Fuente: Ben Jones (2014).
13. PRINCIPIOS EN LA COMUNICACIÓN DE DATOS
Fuente: Ben Jones (2014).
15. ¿QUE SON LOS DATOS ABIERTOS?
•Los datos abiertos son datos que pueden ser
utilizados, reutilizados y redistribuidos libremente por
cualquier persona, y que se encuentran sujetos,
cuando más, al requerimiento de atribución y de
compartirse de la misma manera en que aparecen.
16. LOS DATOS ABIERTOS
Global Open Data Index - Open Knowledge
Foundation
• Plantean que el conocimiento abierto puede
empoderar a todos, permitiendo que las personas
trabajen juntas para enfrentar los desafíos locales y
globales, comprender nuestro mundo, exponer la
ineficiencia, desafiar la desigualdad y hacer que los
gobiernos y las empresas rindan cuentas.
17. En mayo de 2013, Barack
Obama emitió una orden
ejecutiva que estableció la
Política de Datos Abiertos
junto con un memorando de
la Oficina de Administración y
Presupuesto que respaldaba
esa política.
LOS DATOS ABIERTOS
18. En Puerto Rico el Instituto de Estadísticas
promovió desde su inauguración (2009) la
apertura en la divulgación de los datos
gubernamentales por las plataformas
digitales.
LOS DATOS ABIERTOS
19. En 2019 se aprueba la "ley de Datos
Abiertos", con planteamientos por
sectores de la prensa sobre la
burocratización en el proceso de solicitud
y entrega de datos solicitados por la
prensa al gobierno.
LOS DATOS ABIERTOS
21. FUENTES PUBLICAS DE DATOS
• Banco Mundial https://datacatalog.worldbank.org
• Naciones Unidas http://data.un.org/
• UNESCO Institute for Statistics http://uis.unesco.org/
• Gobierno de Estados Unidos https://www.data.gov/
& https://catalog.data.gov
• Censo Federal https://www.census.gov/data.html
• Abre Puerto Rico https://www.abrepr.org/
• Instituto de Estadísticas de Puerto Rico
https://estadisticas.pr/, https://indicadores.pr, https://censo.estadisticas.pr,
datos.estadisticas.pr/
22. FUENTES MIXTAS DE DATOS
• Google Dataset Search https://toolbox.google.com/datasetsearch |
https://www.google.com/publicdata/directory
• Inter-university Consortium for Political and Social Research > https://www.icpsr.umich.edu |
https://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/22680
• Harvard Dataverse https://dataverse.harvard.edu
• GapMinder https://www.gapminder.org/data/
• Pew Research Center https://www.pewresearch.org/download-datasets/
26. EL ABC DE
LAS ESTADISTICAS
1. Estadísticas: una definición general
2. Medidas de tendencia central
3. Medidas de dispersión
4. Principios de probabilidades
5. Mejores prácticas en la presentación de datos
27. Estadísticas:
una definición general
Estadísticas
• “Ciencia que recoge, organiza, presenta, analiza e
interpreta datos con el fin de propiciar la toma de
decisiones más eficaz”. “Es una rama de las Matemáticas
Aplicadas que brinda métodos y procedimientos para
organizar y evaluar una investigación científica con el fin
de tomar decisiones más confiables, cuando prevalecen
condiciones de incertidumbre”.
(Vega 2009, 2)
28. Estadísticas:
una definición general
Estadísticas
• “Es una rama de las Matemáticas Aplicadas que brinda
métodos y procedimientos para organizar y evaluar una
investigación científica con el fin de tomar decisiones más
confiables, cuando prevalecen condiciones de
incertidumbre”.
(Vega 2009, 2)
29. Estadísticas:
una definición general
Estadísticas
• Estadística Descriptiva: Métodos para organizar, resumir y
presentar datos de manera informativa.
• Estadística Inferencial: Métodos para determinar una
propiedad de una población con base en la información de
un muestra.
(Vega 2009, 2)
30. Estadísticas:
una definición general
• Medidas de tendencia central
• Media
• Mediana
• Moda
• Medidas de dispersión
• Rango o Amplitud
• Varianza
• Desviación estándar
• Coeficiente de variabilidad
• Desviación intercuartílica
31. Medidas de tendencia central
Media aritmética:
• La media de un conjunto de datos se
encuentra si se suman todos y se divide la
suma entre el número de datos.
• Es la tendencia central más común
• Se denota por “x barra” cuando se trata
de una muestra.
• Se denota como la media de una
población completa mediante la letra
griega “my”.
32. Medidas de tendencia central
Media aritmética:
• La media de un conjunto de datos se
encuentra si se suman todos y se divide la
suma entre el número de datos.
• Es la tendencia central más común
• Se denota por “x barra” cuando se trata
de una muestra.
• Se denota como la media de una
población completa mediante la letra
griega “my”.
33. Medidas de tendencia central
Mediana:
•Es el valor central de un conjunto
de observaciones cuando los
datos están ordenados.
Me
34. Medidas de tendencia central
Mediana:
•La mediana depende esencialmente del número n de
observaciones y no de la magnitud de los valores
involucrados.
•Apropiada para resumir series que contienen
observaciones extremas.
35. Medidas de tendencia central
Moda:
•Dado un conjunto de datos, la
moda muestral es el valor que se
repite con mayor frecuencia.
Mo
36. Medidas de dispersión
• Rango o Amplitud: Rango =
observación mayor –
observación menor
• Desviación intercuartílica: la
diferencia entre el tercer y el
primer cuartil de una
distribución.
• Desviación estándar
37. Principios de probabilidades
•Probabilidad de un evento: La frecuencia relativa con
la que puede esperarse la ocurrencia de dicho evento.
•La probabilidad de un evento puede obtenerse en tres
formas diferentes: 1) empíricamente y 2) teóricamente
38. Principios de probabilidades
• El valor asignado a la probabilidad del evento A como resultado de la
experimentación puede encontrarse mediante la fórmula:
(Johnson & Kuby, 2012, 172-173)
39. Principios de probabilidades
• El método teórico para obtener la probabilidad de un evento
usa un espacio muestral.
• Un espacio muestral es una lista de todos los posibles
resultados del experimento a considerar (que se denota con
la letra S mayúscula).
40. Principios de probabilidades
• Cuando se usa este método, el espacio muestral debe
contener puntos muestrales igualmente probables.
• Por ejemplo, el espacio muestral para lanzamientos de un
dado es S = {1, 2, 3, 4, 5, 6}.
41. Principios de probabilidades
•¿Qué ocurre cuando hay más de un dado?
•¿Qué ocurre cuando hay más de un lanzamiento?
•Combinaciones (dentro de los mismos valores; no
se repiten)
•Permutaciones (es importante el orden)
44. CARGA DE CONJUNTO DE DATOS
•En este interfaz se podrá
extraer los conjuntos de
datos o shapefiles a utilizar
en nuestras visualizaciones.
45. TABLEAU USER INTERFACE
1. Data: conjunto de datos que nutre la plataforma
2. Dimensions: Campos para agrupar o categorizar
los datos
3. Measures: Valores para visualización. Permiten
realizar operaciones.
4. Pages: Permite organizar (en secuencias)
elementos de los campos
5. Filters: Permite filtrar elementos de los campos
6. Marks: Elementos para la representación textual
o gráfica
7. Columns & Rows: Modo en que se arreglan las
variables
8. Show Me: Muestra visualizaciones disponibles.
9. Save: Recuerda grabar constantemente tu
trabajo.
46. REFERENCIAS
• Boslaugh, S., & Watters, P. (2008). Statistics in a Nutshell. A Desktop Quick
Reference. Sebastopol, CA: O’Reilly Media.
• Comisión Económica para Europa (2009). Cómo hacer comprensibles los datos.
Parte 1. Una guía para escribir sobre números. Ginebra: Naciones Unidas.
• Johnson, R., Kuby, P. (2012) Estadística elemental (11ª edición). México, D.F.:
Cengage Learning.
• Jones, B. (2014) Communicating Data with Tableau. Sebastopol, CA: O’Reilly.
• Rodríguez, I. (2017). Aspectos a considerar al presentar e interpretar datos. San
Juan, PR: Instituto de Estadísticas.