SlideShare una empresa de Scribd logo
1 de 24
Webinario
Introducción al Periodismo
         de Datos

                                 Por Sandra Crucianelli
                Knight International Journalism Fellow
                                          www.icfj.org
                                  scrucianelli@icfj.org
                                        @spcrucianelli
¿Qué hay de nuevo?
Fines del siglo XIX
Periodismo Investigativo
“Todo periodista debería saber la
   importancia del número 384”
PAC: Periodismo Asistido por
                   Computadora
      Introduce el uso de hojas de cálculo, como
       herramienta para procesar datos
II.    Detección y cruce de variables
III.   Cálculo de medidas de tendencia central (media, media
       ponderada, moda)
IV.    Cálculo de medidas de proporción (razón, porcentaje, tasa,
       Índice)
V.     Cálculo de medidas de dispersión (desviación, varianza)
VI.    Conclusiones: Detección de patrones de comportamiento
Hoja de cálculo
¿Periodismo de Datos?
   Casi todo se expresa con números
   En el mundo digital, tenemos capacidad para acceder a grandes
    cantidades de datos (Big Data)

   Nuevas Herramientas de Búsqueda
   Nuevas Herramientas de Extracción
   Nuevas Herramientas de Análisis
   Nuevas Herramientas de Visualización

   Visión Científica: el periodista de datos reporta sus métodos, y
    muestra documentos de modo que otros podrían replicar el
    proceso y llegar a la misma conclusión

   http://www.documentcloud.org/home
Del PAC al PAH
    Periodismo asistido por Hackers
 http://www.meetup.com/HacksHackersBA/

El programador se incorpora al equipo
           periodístico
Dos Pirámides
http://onlinejournalismblog.com/
1) Salarios de 667.000 empleados públicos
2) Crearon una aplicación incorporando un buscador de sueldos por
nombre, oficina gubernamental, año, categoría.
3) Socializaron la información

http://www.texastribune.org/library/data/government-employee-salaries/
Propublica
Blogs de Datos
Blog de Datos   Nacion Data
Condiciones de Borde

   Ley de Acceso
   Datos abiertos
   Formatos adecuados
   Herramientas digitales
   Creatividad… y mucho esfuerzo



   Resultado: sociedades mejor informadas
¿Qué es un dato abierto?
   Formato reutilizable
   Word, Excel, CVS
   Archivos con opción de descarga
   Gráficos con códigos de inserción
   Tablas dinámicas

 Caso Uruguay:
http://www.mef.gub.uy/indicadores.php
 Caso España:

http://www.datosabiertos.jcyl.es/
¿No si tenemos datos?
   Ejercicio: Google

   Búsqueda avanzada
   Opción por defecto
   Por dominio, formatos y/o fechas
   Búsquedas geolocalizadas
   Lectura de URLs
   El Académico
   Bases de Datos interactivas
   Monitoreo de redes sociales
Ver no es lo mismo que acceder
 ¿Cómo extraer datos cuando no están accesibles?
Scraping de Datos
   Programas informáticos o técnicas de programación
   cuya finalidad es la de extraer datos (“raspar”) para:
2. Obtener datos estructurados (De PDF a Excel)
3. Leer datos de imágenes fotográficas para convertirlos
   en textos o tablas (OCR: Reconocimiento Óptico de
   Caracteres)
Secuencia:
n Recoger (Ruby: lenguaje de programación)
n Procesar (Google Refine: para limpiar y organizar los
   datos)
n Almacenar (Panda Project: repositorio para compartir
   bases de datos)
Minería de Datos: detecta patrones
  sobre un gran conjunto de datos
Proceso

   Relaciones entre variables
   Cualitativas – Cuantitativas
   Jerarquía entre los datos
   Proporciones (3 de cada 10)
   Frecuencias (veces que un mismo dato se
    repite o combinaciones de datos que se
    repiten)
   Datos abstractos      Datos inteligentes
Recuperación de Datos
 Ejercicios:
http://tinyurl.com/ejerciciosDATA
Google Refine
http://code.google.com/p/google-refine/
Visualización de Datos
Links por Categoría
 Ejemplos Periodismo de Datos:
http://tinyurl.com/ejemplosDataJour
 Datos Oficiales:

http://tinyurl.com/LinksGovAr
 Recursos Extracción de datos:

http://tinyurl.com/ExtraccionData
 Recursos Visualización de Datos:

http://tinyurl.com/LinksDataViz
 Aplicaciones Basadas en Datos

http://tinyurl.com/AplicacionesDatos
Muchas Gracias…


         Sandra Crucianelli
                Junio, 2012
       scrucianelli@icfj.org
             @spcrucianelli
               www.icfj.org

Más contenido relacionado

La actualidad más candente

Motores de busqueda
Motores de busquedaMotores de busqueda
Motores de busqueda
nathunava
 
Trabajo final motores de búsqueda tema 3
Trabajo final motores de búsqueda tema 3Trabajo final motores de búsqueda tema 3
Trabajo final motores de búsqueda tema 3
Universidad Yacambu
 
Tics unir sesión 2-b
Tics unir   sesión 2-bTics unir   sesión 2-b
Tics unir sesión 2-b
martinindico
 

La actualidad más candente (11)

LA NACIÓN Data
LA NACIÓN DataLA NACIÓN Data
LA NACIÓN Data
 
Motores de busqueda
Motores de busquedaMotores de busqueda
Motores de busqueda
 
Motores de busqueda
Motores de busquedaMotores de busqueda
Motores de busqueda
 
Motores de búsqueda
Motores de búsquedaMotores de búsqueda
Motores de búsqueda
 
Webquest: Etapas del proceso de búsqueda
Webquest: Etapas del proceso de búsquedaWebquest: Etapas del proceso de búsqueda
Webquest: Etapas del proceso de búsqueda
 
Busqueda de informacion en la red
Busqueda de informacion en la redBusqueda de informacion en la red
Busqueda de informacion en la red
 
Trabajo final motores de búsqueda tema 3
Trabajo final motores de búsqueda tema 3Trabajo final motores de búsqueda tema 3
Trabajo final motores de búsqueda tema 3
 
Tics unir sesión 2-b
Tics unir   sesión 2-bTics unir   sesión 2-b
Tics unir sesión 2-b
 
Jessica y marcela
Jessica y marcelaJessica y marcela
Jessica y marcela
 
Buscadores y Metabuscadores
Buscadores y MetabuscadoresBuscadores y Metabuscadores
Buscadores y Metabuscadores
 
Bing - Recuperación de información
Bing - Recuperación de informaciónBing - Recuperación de información
Bing - Recuperación de información
 

Destacado

Periodismo de Datos: Matemática Básica
Periodismo de Datos: Matemática BásicaPeriodismo de Datos: Matemática Básica
Periodismo de Datos: Matemática Básica
Sandra Crucianelli
 
Interactive Portfolio
Interactive PortfolioInteractive Portfolio
Interactive Portfolio
reyamaya
 
유럽책마을강의
유럽책마을강의유럽책마을강의
유럽책마을강의
숨 문화
 
Doug K Res 2012 PPT
Doug K Res 2012 PPTDoug K Res 2012 PPT
Doug K Res 2012 PPT
dougkeevers
 

Destacado (15)

Periodismo de Datos: Matemática Básica
Periodismo de Datos: Matemática BásicaPeriodismo de Datos: Matemática Básica
Periodismo de Datos: Matemática Básica
 
Herramientas Digitales de Seguridad para Periodistas de Datos
Herramientas Digitales de Seguridad para Periodistas de Datos Herramientas Digitales de Seguridad para Periodistas de Datos
Herramientas Digitales de Seguridad para Periodistas de Datos
 
Reunião nº 02 – Preparação do plano de actividades - dia 13-07-2016
Reunião nº 02 – Preparação do plano de actividades - dia 13-07-2016Reunião nº 02 – Preparação do plano de actividades - dia 13-07-2016
Reunião nº 02 – Preparação do plano de actividades - dia 13-07-2016
 
Netautomata1
Netautomata1Netautomata1
Netautomata1
 
Trabajo de campo elvis velasco
Trabajo de campo elvis velascoTrabajo de campo elvis velasco
Trabajo de campo elvis velasco
 
TECNOLOGIA EDUCATIVA
TECNOLOGIA EDUCATIVATECNOLOGIA EDUCATIVA
TECNOLOGIA EDUCATIVA
 
Reunião nº33 - Trabalho e Companheirismo - dia 10-02-2016
Reunião nº33 - Trabalho e Companheirismo - dia 10-02-2016Reunião nº33 - Trabalho e Companheirismo - dia 10-02-2016
Reunião nº33 - Trabalho e Companheirismo - dia 10-02-2016
 
Interactive Portfolio
Interactive PortfolioInteractive Portfolio
Interactive Portfolio
 
Twitteralsleer netwerk-zonderfilmpjes2-140211080521-phpapp01
Twitteralsleer netwerk-zonderfilmpjes2-140211080521-phpapp01Twitteralsleer netwerk-zonderfilmpjes2-140211080521-phpapp01
Twitteralsleer netwerk-zonderfilmpjes2-140211080521-phpapp01
 
Sessão.am.n.º17 22.06.16
Sessão.am.n.º17 22.06.16Sessão.am.n.º17 22.06.16
Sessão.am.n.º17 22.06.16
 
유럽책마을강의
유럽책마을강의유럽책마을강의
유럽책마을강의
 
Animali - Trasporto e soccorso di animali in stato di necessità
Animali - Trasporto e soccorso di animali in stato di necessitàAnimali - Trasporto e soccorso di animali in stato di necessità
Animali - Trasporto e soccorso di animali in stato di necessità
 
Psol UDL: hype of blijver?
Psol UDL: hype of blijver?Psol UDL: hype of blijver?
Psol UDL: hype of blijver?
 
Reunião nº42 – “Saúde Vocal” - dia 13-04-2016
Reunião nº42 – “Saúde Vocal” - dia 13-04-2016Reunião nº42 – “Saúde Vocal” - dia 13-04-2016
Reunião nº42 – “Saúde Vocal” - dia 13-04-2016
 
Doug K Res 2012 PPT
Doug K Res 2012 PPTDoug K Res 2012 PPT
Doug K Res 2012 PPT
 

Similar a Webinario sobre Periodismo de Datos

Herramientas Digitales
Herramientas DigitalesHerramientas Digitales
Herramientas Digitales
Karen Vanessa
 
Herramientas Digitales
Herramientas DigitalesHerramientas Digitales
Herramientas Digitales
Karen Vanessa
 

Similar a Webinario sobre Periodismo de Datos (20)

Open Data, Big Data y auge del Periodismo de Datos online. Sistemas de repres...
Open Data, Big Data y auge del Periodismo de Datos online. Sistemas de repres...Open Data, Big Data y auge del Periodismo de Datos online. Sistemas de repres...
Open Data, Big Data y auge del Periodismo de Datos online. Sistemas de repres...
 
Cómo crear tu plan de gestión de datos de investigación
Cómo crear tu plan de gestión de datos de investigaciónCómo crear tu plan de gestión de datos de investigación
Cómo crear tu plan de gestión de datos de investigación
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
La geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big dataLa geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big data
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Casos big data
Casos big dataCasos big data
Casos big data
 
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
 
Propuesta nuclear de protocolo de análisis: Interactividad en cibermedios
Propuesta nuclear de protocolo de análisis: Interactividad en cibermediosPropuesta nuclear de protocolo de análisis: Interactividad en cibermedios
Propuesta nuclear de protocolo de análisis: Interactividad en cibermedios
 
Ciencia de datos - CIO Update 2016
Ciencia de datos - CIO Update 2016Ciencia de datos - CIO Update 2016
Ciencia de datos - CIO Update 2016
 
Qué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdfQué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdf
 
Datos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de LorcaDatos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de Lorca
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Big Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y TendenciasBig Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y Tendencias
 
Herramientas Digitales
Herramientas DigitalesHerramientas Digitales
Herramientas Digitales
 
Herramientas digitales para la cobertura periodística del desarrollo sostenible
Herramientas digitales para la cobertura periodística del desarrollo sostenibleHerramientas digitales para la cobertura periodística del desarrollo sostenible
Herramientas digitales para la cobertura periodística del desarrollo sostenible
 
Herramientas Digitales
Herramientas DigitalesHerramientas Digitales
Herramientas Digitales
 
Conociendo big data
Conociendo big dataConociendo big data
Conociendo big data
 
Clase 4 tecno i- periodismo 2015
Clase 4  tecno i- periodismo 2015Clase 4  tecno i- periodismo 2015
Clase 4 tecno i- periodismo 2015
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 

Más de Sandra Crucianelli

Más de Sandra Crucianelli (15)

Herramientas digitales para Periodistas 2018
Herramientas digitales para Periodistas 2018Herramientas digitales para Periodistas 2018
Herramientas digitales para Periodistas 2018
 
Manejo de situaciones de Acoso y Violencia en Redes Sociales
Manejo de situaciones de Acoso y Violencia en Redes SocialesManejo de situaciones de Acoso y Violencia en Redes Sociales
Manejo de situaciones de Acoso y Violencia en Redes Sociales
 
La marca personal del periodista, en Twitter
La marca personal del periodista, en Twitter La marca personal del periodista, en Twitter
La marca personal del periodista, en Twitter
 
La marca personal del periodista, en Facebook
La marca personal del periodista, en FacebookLa marca personal del periodista, en Facebook
La marca personal del periodista, en Facebook
 
Introducción al Uso de Redes Sociales y Marca Personal
Introducción al Uso de Redes Sociales y Marca Personal Introducción al Uso de Redes Sociales y Marca Personal
Introducción al Uso de Redes Sociales y Marca Personal
 
Del Periodismo de Investigación al Periodismo de Base de Datos
Del Periodismo de Investigación al Periodismo de Base de DatosDel Periodismo de Investigación al Periodismo de Base de Datos
Del Periodismo de Investigación al Periodismo de Base de Datos
 
Bases de Datos. Caso México
Bases de Datos. Caso MéxicoBases de Datos. Caso México
Bases de Datos. Caso México
 
Searching Argentina: Recuperación Web de Datos Oficiales
Searching Argentina: Recuperación Web de Datos Oficiales Searching Argentina: Recuperación Web de Datos Oficiales
Searching Argentina: Recuperación Web de Datos Oficiales
 
Cómo promover periodismo de datos (versión español)
Cómo promover periodismo de datos (versión español)Cómo promover periodismo de datos (versión español)
Cómo promover periodismo de datos (versión español)
 
How to promote dj
How to promote djHow to promote dj
How to promote dj
 
Estadística inferencial
Estadística inferencialEstadística inferencial
Estadística inferencial
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Deep Web searching
Deep Web searchingDeep Web searching
Deep Web searching
 
Data Teams, Media Party
Data Teams, Media PartyData Teams, Media Party
Data Teams, Media Party
 
Líneas de tiempo hackaton abril 2012
Líneas de tiempo hackaton abril 2012Líneas de tiempo hackaton abril 2012
Líneas de tiempo hackaton abril 2012
 

Último

5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
MiNeyi1
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
JonathanCovena1
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
UPTAIDELTACHIRA
 
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
MiNeyi1
 

Último (20)

ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJOACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonables
 
Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdf
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 

Webinario sobre Periodismo de Datos

  • 1. Webinario Introducción al Periodismo de Datos Por Sandra Crucianelli Knight International Journalism Fellow www.icfj.org scrucianelli@icfj.org @spcrucianelli
  • 2. ¿Qué hay de nuevo?
  • 3. Fines del siglo XIX Periodismo Investigativo
  • 4. “Todo periodista debería saber la importancia del número 384”
  • 5. PAC: Periodismo Asistido por Computadora  Introduce el uso de hojas de cálculo, como herramienta para procesar datos II. Detección y cruce de variables III. Cálculo de medidas de tendencia central (media, media ponderada, moda) IV. Cálculo de medidas de proporción (razón, porcentaje, tasa, Índice) V. Cálculo de medidas de dispersión (desviación, varianza) VI. Conclusiones: Detección de patrones de comportamiento
  • 7. ¿Periodismo de Datos?  Casi todo se expresa con números  En el mundo digital, tenemos capacidad para acceder a grandes cantidades de datos (Big Data)  Nuevas Herramientas de Búsqueda  Nuevas Herramientas de Extracción  Nuevas Herramientas de Análisis  Nuevas Herramientas de Visualización  Visión Científica: el periodista de datos reporta sus métodos, y muestra documentos de modo que otros podrían replicar el proceso y llegar a la misma conclusión  http://www.documentcloud.org/home
  • 8. Del PAC al PAH Periodismo asistido por Hackers http://www.meetup.com/HacksHackersBA/ El programador se incorpora al equipo periodístico
  • 10. 1) Salarios de 667.000 empleados públicos 2) Crearon una aplicación incorporando un buscador de sueldos por nombre, oficina gubernamental, año, categoría. 3) Socializaron la información http://www.texastribune.org/library/data/government-employee-salaries/
  • 12. Blogs de Datos Blog de Datos Nacion Data
  • 13. Condiciones de Borde  Ley de Acceso  Datos abiertos  Formatos adecuados  Herramientas digitales  Creatividad… y mucho esfuerzo  Resultado: sociedades mejor informadas
  • 14. ¿Qué es un dato abierto?  Formato reutilizable  Word, Excel, CVS  Archivos con opción de descarga  Gráficos con códigos de inserción  Tablas dinámicas  Caso Uruguay: http://www.mef.gub.uy/indicadores.php  Caso España: http://www.datosabiertos.jcyl.es/
  • 15. ¿No si tenemos datos?  Ejercicio: Google  Búsqueda avanzada  Opción por defecto  Por dominio, formatos y/o fechas  Búsquedas geolocalizadas  Lectura de URLs  El Académico  Bases de Datos interactivas  Monitoreo de redes sociales
  • 16. Ver no es lo mismo que acceder ¿Cómo extraer datos cuando no están accesibles?
  • 17. Scraping de Datos Programas informáticos o técnicas de programación cuya finalidad es la de extraer datos (“raspar”) para: 2. Obtener datos estructurados (De PDF a Excel) 3. Leer datos de imágenes fotográficas para convertirlos en textos o tablas (OCR: Reconocimiento Óptico de Caracteres) Secuencia: n Recoger (Ruby: lenguaje de programación) n Procesar (Google Refine: para limpiar y organizar los datos) n Almacenar (Panda Project: repositorio para compartir bases de datos)
  • 18. Minería de Datos: detecta patrones sobre un gran conjunto de datos
  • 19. Proceso  Relaciones entre variables  Cualitativas – Cuantitativas  Jerarquía entre los datos  Proporciones (3 de cada 10)  Frecuencias (veces que un mismo dato se repite o combinaciones de datos que se repiten)  Datos abstractos Datos inteligentes
  • 20. Recuperación de Datos  Ejercicios: http://tinyurl.com/ejerciciosDATA
  • 23. Links por Categoría  Ejemplos Periodismo de Datos: http://tinyurl.com/ejemplosDataJour  Datos Oficiales: http://tinyurl.com/LinksGovAr  Recursos Extracción de datos: http://tinyurl.com/ExtraccionData  Recursos Visualización de Datos: http://tinyurl.com/LinksDataViz  Aplicaciones Basadas en Datos http://tinyurl.com/AplicacionesDatos
  • 24. Muchas Gracias… Sandra Crucianelli Junio, 2012 scrucianelli@icfj.org @spcrucianelli www.icfj.org