7. El periodismo se reinventa,
pero no tanto
El mapa de John Snow (1854)
8. Ganó el Premio Pulitzer por una investigación hecha
con una base de datos, cuando el método todavía se
llamaba “Computer Assisted Research”. Demostró,
gracias a un análisis de bases de datos, que existía
discriminación en la forma en la que se otorgaban
los créditos hipotecarios en los Estados Unidos: un
blanco con bajos ingresos tenía más posibilidad de
obtenerlo que un negro con ingresos medios.
Bill Dedman (1989)
9. El periodismo se reinventa,
pero no tanto
Aportantes trucho de Cambiemos (Juan Amorin)
10. Los periodistas utilizan datos en sus artículos desde que
existe la profesión
la computación en el siglo XX creó oportunidades para la
integración de datos a las investigaciones
En el siglo XXI una revolución en la conectividad está
conduciendo a los medios hacia nuevos horizontes
11. La digitalización de la información y la conectividad
posibilitaron la apertura de pilas de datos que pocos
años atrás se amontonaban en enormes ficheros
12. BIG DATA/OPEN DATA
Los grandes datos ya no se encuentran sólo
en manos de las empresas y
administraciones. Pueden llegar al ciudadano,
pero la captura y análisis de estos datos es
algo muy complejo. El estudio de los datos
depende de programas informáticos capaces
de procesar y relacionar datos no
estructurados, unos obtenidos a través de
PDFs y otros mediante tablas Excel.
(TAPIA,2008)
13.
14.
15. • Si los datos existen
• Si están actualizados
• Si tienen licencia abierta
• Si son gratuitos y están disponibles públicamente
• Si están digitalizados y disponibles en línea
Datos abiertos
16. Acceso a la información pública como derecho
La información que produce, obtiene, clasifica y almacena el
Estado es producida, obtenida, clasificada y almacenada con
recursos que provienen de los impuestos que pagan los
ciudadanos. Ningún actor estatal puede entonces negar el
acceso a la información o a documentos que le pertenecen a
las personas.
Relatoría Especial para la Libertad de Expresión de la
Organización de Estados Americanos
17. Índice Global de Datos Abiertos
Según Open Data Barometer, Argentina ocupa
el lugar 36 en el mundo en lo que a datos abiertos
18. Datos abiertos en Argentina
Según el Índice de datos abiertos en ciudades de Argentina,
Buenos Aires, Córdoba y Río Segundo son las ciudades que
cumplen con el 100% de los estándares de datos abiertos
en Argentina
19. Fuentes de datos en línea:
Organismos internacionales
Boletines oficiales
Ministerios
Universidades y organismos estatales
Organizaciones no gubernamentales
INDEC nacional y provinciales
Empresas públicas
Empresas privadas
Podemos monitorear sus sitios web, rastrear sus documentos
con búsquedas avanzadas o formalizar pedidos de información
específicos.
20. Predicciones de Alexander Howard (2014)
Los datos se volverán un recurso aún más estratégico para los
medios.
Surgirán mejores herramientas que democratizarán
capacidades para el manejo de datos.
Las aplicaciones de noticias se impondrán explosivamente
como el modo primordial en que la gente consuma periodismo
de datos.
21. El periodismo de datos combina (Howard, 2014):
Visualizaciones para presentarlos
La búsqueda y el tratamiento de datos como una fuente a ser
recogida y validada
La aplicación de estadísticas para interrogar esos datos
22. La pirámide invertida del
Periodismo de datos
https://onlinejournalismblog.com/tag/open-journalism/
(Paul Bradshaw)
23. COMPILAR
“El periodismo de datos empieza en una de dos formas: o tienes una pregunta que necesita data o
tienes un dataset que necesita ser interrogado. De cualquier forma, la compilación de información
es lo que lo define como un acto de periodismo de datos y puede tener varias formas:
Provista directamente por una organización
Encontrada usando técnicas de búsqueda avanzada para surcar en las
profundidades de sitios web de gobiernos
Al hacer scraping de bases de datos escondidas online usando herramientas
como OutWit Hub y Scraperwiki
Convertir documentos en algo que pueda ser analizado usando herramientas
como DocumentCloud
Tomando información de APIs
Recolectando data vos mismo a través de observación, encuestas, formularios
online o crowdsourcing
24. LIMPIAR
Tener información es sólo el comienzo. Estar confiado en las historias escondidas adentro significa poder
confiar en la calidad de la data, y eso significa limpiarla. Limpiar en general tiene 2 formas: remover el
error humano y convertir la data en un formato que es consistente con otra data que estés usando.
Hay formas simples de limpiar la data en Excel o Google Docs como buscar y
reemplazar, clasificando para encontrar entradas inusualmente altas o bajas o
vacías, y usando filtros para que sólo se muestren entradas duplicadas.
25. CONTEXTO
Como cualquier fuente, la información no puede ser siempre confiable. Viene con sus propias historias,
prejuicios y objetivos. Así como con cualquier fuente, necesitas hacerle preguntas: quien la recolectó, cuando,
y por qué motivos. ¿Cómo fue recolectada? (la metodología). También necesitarás entender la jerga como
códigos que representan categorías, clasificaciones o ubicaciones y terminología de especialistas.
Todo lo anterior probablemente te lleve a compilar más información. Por ejemplo, conocer
el número de crímenes en una ciudad es interesante, pero sólo se vuelve relevante cuando
lo contextualizas junto con la población, número de policías, niveles de los crímenes haces
5 años, percepción del crimen, niveles de desempleo y demás. El alfabetismo estadístico es
una obligación acá. Tener una pregunta clara en el comienzo de todo el proceso, por cierto,
ayuda a asegurar que no pierdas el foco en este punto, o pierdas un ángulo interesante.
26. COMBINAR
Las buenas historias se pueden encontrar en un sólo dataset, pero a menudo necesitarás combinar
dos juntos. Después de todo, si te dan a elegir entre una noticia con una sola fuente y una noticia
con múltiples fuentes, ¿cuál preferirías?
La combinación clásica es el mashup de mapas: tomar un dataset y combinarlo con data de
mapas para proveer una visualización instantánea de cómo algo está distribuido en el espacio.
Esto es tan común (más que nada gracias a que la Google Maps API fue una de las primeras
APIs útiles para periodismo) casi se ha convertido en un cliché. Pero igual, los clichés son
muchas veces (sino siempre) efectivos.
27. COMUNICAR
En periodismo de datos, lo obvio para hacer en este punto es visualizar los resultados: en un
mapa, cuadro, infografía o animación. Pero acá hay mucho más a considerar: desde la clásica
narrativa, las aplicaciones de noticias, casos de estudio y personalización.