SlideShare una empresa de Scribd logo
1 de 20
Periodismo de datos.
JPD14 Almería
Introducción al periodismo de datos.
Renato L. Ramirez
renatolrr@gmail.com
@renatolrr
www.osl.ugr.es
Introducción.
● ¿Qué es el periodismo de datos?
● Por qué debieran usar datos los periodistas
● ¿Por qué es importante el periodismo de datos?
● La ley de crecimiento exponencial de Price.
● La ley de Zuckerberg
Obtener datos
● Una guía para trabajos de campo de 5
minutos
● Su Derecho a la Información
● El Wobbing* funciona. ¡Úselo!
● Obtener datos de la red
● La red como fuente de datos
● Herramientas web
Entender los datos
● Aprenda a manejar datos con 3 pasos simples
● Consejos para trabajar con cifras en las
noticias
● Pasos básicos para trabajar con datos
Difundir datos
● Presentar datos al público
● Cómo crear una aplicación de noticias
● El uso de visualizaciones para narrar historias
● Cuadros diferentes dicen cosas diferentes
● Selección de herramientas "Hágalo Ud.
mismo" para hacer sus propias
visualizaciones de datos.
Concepto de scraping
● Scarping
Definición según Wikipedia: “Web Scraping es
una técnica utilizada mediante programas de
software para extraer información de sitios
web”
Buenas costumbres en scraping.
● Definir previamente lo que se busca.
Planificar.
● Copiar web.
● Conocimientos previos de programación.
● Conservar fuentes.
● Guardar los datos utilizando estándares.
Aspectos legales
● “no estarán autorizadas la extracción y/o
reutilización repetidas o sistemáticas de
partes no sustanciales del contenido de una
base de datos que supongan actos contrarios
a una explotación normal de dicha base o que
causen un perjuicio injustificado a los
intereses legítimos del fabricante”.
Artículo 133 del Real Decreto Legislativo 1/1996, de 12 de abril, por el que se aprueba el Texto Refundido de la Ley de Propiedad Intele
Aspectos legales
● “no estarán autorizadas la extracción y/o
reutilización repetidas o sistemáticas de
partes no sustanciales del contenido de una
base de datos que supongan actos contrarios
a una explotación normal de dicha base o que
causen un perjuicio injustificado a los
intereses legítimos del fabricante”.
Artículo 133 del Real Decreto Legislativo 1/1996, de 12 de abril, por el que se aprueba el Texto Refundido de la Ley de Propiedad Intele
Otros aspectos
● Agencia Española de Protección de Datos.
● Otra legislación.
Planificar
● Open project
● Redmine
● Github
● Firebug
● HTML Regex Data Extractor
● Programación en Perl
● Programación avanzada en python
● Desarrollo de software colaborativo con Git
Copia web
● HTTrack
Descarga:http://www.httrack.com/page/2/en/index.html
Manual:http://www.httrack.com/html/fcguide.html
httrack "http://lujoyglamour.net/" -O "/tmp/www.all.net"
"+*.all.net/*" -v
Scrapy
● Scraping Web Pages with Scrapy - YouTube
Alternativas a Scrapy
● Mozenda
● Scraper Wiki
● DEiXTo
● Nokogiri
● http://search.cpan.org/~miyagawa/Web-Scraper-0.37/lib/Web/Scraper.pm
● http://teusje.wordpress.com/2010/05/02/web-scraping-with-perl/
● http://blogs.perl.org/users/stas/2013/01/web-scraping-with-
modern-perl-part-1.html
Libros
● Python for Data Analysis: Data Wrangling with Pandas, NumPy, and Ipython
● Head First Data Analysis: A Learner's Guide to Big Numbers, Statistics, and Good
● The Data Journalism Handbook
Datos
Para que?
● Narrar
● Estudiar
● Aprender
Zapatillas y la Mae.
Ejemplo:
● The Baltimore Sun
Herramientas datos
● LibreOffice
● Google refine
● Tesseract
● Fusion tables
● R
Ejercicio práctico.
Elecciones parlamento europeo, municipios
de la provincia de Almería.
Pasos
● Método científico. (la araña).
● Búsqueda
● Tratamiento.
● Presentación.
To be continued...
Todas las herramientas presentadas son software libre.

Más contenido relacionado

Similar a Periodismo de datos

Utilidad datosperiodismo
Utilidad datosperiodismoUtilidad datosperiodismo
Utilidad datosperiodismoGabriela Rodrig
 
Anexo periodismo de datos
Anexo periodismo de datosAnexo periodismo de datos
Anexo periodismo de datosRenato Ramirez
 
Bloque Legislacion RISP
Bloque Legislacion RISPBloque Legislacion RISP
Bloque Legislacion RISPRuth Del Campo
 
Aspectos legales fundamentales en el uso del Big Data
Aspectos legales fundamentales en el uso del Big DataAspectos legales fundamentales en el uso del Big Data
Aspectos legales fundamentales en el uso del Big DataDataCentric PDM
 
La Protección de Datos en España / Lourdes Hernández Crespo (AGPD)
La Protección de Datos en España / Lourdes Hernández Crespo (AGPD)La Protección de Datos en España / Lourdes Hernández Crespo (AGPD)
La Protección de Datos en España / Lourdes Hernández Crespo (AGPD)EUROsociAL II
 
Diapos de protección jurídica del software y el derecho de
Diapos de protección jurídica del software y el derecho deDiapos de protección jurídica del software y el derecho de
Diapos de protección jurídica del software y el derecho deHectorchg
 
Ruth Gonzalez & Miguel Hernández - Lo que un stalker puede saber de ti, los r...
Ruth Gonzalez & Miguel Hernández - Lo que un stalker puede saber de ti, los r...Ruth Gonzalez & Miguel Hernández - Lo que un stalker puede saber de ti, los r...
Ruth Gonzalez & Miguel Hernández - Lo que un stalker puede saber de ti, los r...RootedCON
 
Cómo conseguir un Gobierno Abierto
Cómo conseguir un Gobierno AbiertoCómo conseguir un Gobierno Abierto
Cómo conseguir un Gobierno AbiertoOpenKratio
 
Ecommerce junts-figueres-2012
Ecommerce junts-figueres-2012Ecommerce junts-figueres-2012
Ecommerce junts-figueres-2012AlterEgo Web
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
Charla introductoria a la GDPR
Charla introductoria a la GDPRCharla introductoria a la GDPR
Charla introductoria a la GDPRFernando Ferrari
 
Abelardo Ibáñez - VP Internacional Weborama
Abelardo Ibáñez - VP Internacional WeboramaAbelardo Ibáñez - VP Internacional Weborama
Abelardo Ibáñez - VP Internacional WeboramaArena Media España
 
Diapositiva Informatica forense JDBC
Diapositiva Informatica forense JDBCDiapositiva Informatica forense JDBC
Diapositiva Informatica forense JDBCJudaba
 
Proteccion datos personales_y_programas_de_computador_pdf998718825
Proteccion datos personales_y_programas_de_computador_pdf998718825Proteccion datos personales_y_programas_de_computador_pdf998718825
Proteccion datos personales_y_programas_de_computador_pdf998718825Yurany Martinez S
 
Aspectos legales del cloud computing ISSA Chile
Aspectos legales del cloud computing ISSA ChileAspectos legales del cloud computing ISSA Chile
Aspectos legales del cloud computing ISSA ChileManuel Leiva
 
Presentacion SIRIV
Presentacion SIRIVPresentacion SIRIV
Presentacion SIRIVJorge Aranda
 
Taller de datos - Data Toolbox #OSR6 #14wkRebiun
Taller de datos - Data Toolbox #OSR6  #14wkRebiunTaller de datos - Data Toolbox #OSR6  #14wkRebiun
Taller de datos - Data Toolbox #OSR6 #14wkRebiunLuis Martinez-Uribe
 
Posicionamiento Web y Optimización en Buscadores
Posicionamiento Web y Optimización en BuscadoresPosicionamiento Web y Optimización en Buscadores
Posicionamiento Web y Optimización en BuscadoresJomicast
 

Similar a Periodismo de datos (20)

Utilidad datosperiodismo
Utilidad datosperiodismoUtilidad datosperiodismo
Utilidad datosperiodismo
 
Jornada Aspectos Juridicos APPs
Jornada Aspectos Juridicos APPsJornada Aspectos Juridicos APPs
Jornada Aspectos Juridicos APPs
 
Anexo periodismo de datos
Anexo periodismo de datosAnexo periodismo de datos
Anexo periodismo de datos
 
Bloque Legislacion RISP
Bloque Legislacion RISPBloque Legislacion RISP
Bloque Legislacion RISP
 
Aspectos legales fundamentales en el uso del Big Data
Aspectos legales fundamentales en el uso del Big DataAspectos legales fundamentales en el uso del Big Data
Aspectos legales fundamentales en el uso del Big Data
 
La Protección de Datos en España / Lourdes Hernández Crespo (AGPD)
La Protección de Datos en España / Lourdes Hernández Crespo (AGPD)La Protección de Datos en España / Lourdes Hernández Crespo (AGPD)
La Protección de Datos en España / Lourdes Hernández Crespo (AGPD)
 
Diapos de protección jurídica del software y el derecho de
Diapos de protección jurídica del software y el derecho deDiapos de protección jurídica del software y el derecho de
Diapos de protección jurídica del software y el derecho de
 
Ruth Gonzalez & Miguel Hernández - Lo que un stalker puede saber de ti, los r...
Ruth Gonzalez & Miguel Hernández - Lo que un stalker puede saber de ti, los r...Ruth Gonzalez & Miguel Hernández - Lo que un stalker puede saber de ti, los r...
Ruth Gonzalez & Miguel Hernández - Lo que un stalker puede saber de ti, los r...
 
Cómo conseguir un Gobierno Abierto
Cómo conseguir un Gobierno AbiertoCómo conseguir un Gobierno Abierto
Cómo conseguir un Gobierno Abierto
 
Ecommerce junts-figueres-2012
Ecommerce junts-figueres-2012Ecommerce junts-figueres-2012
Ecommerce junts-figueres-2012
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Charla introductoria a la GDPR
Charla introductoria a la GDPRCharla introductoria a la GDPR
Charla introductoria a la GDPR
 
Abelardo Ibáñez - VP Internacional Weborama
Abelardo Ibáñez - VP Internacional WeboramaAbelardo Ibáñez - VP Internacional Weborama
Abelardo Ibáñez - VP Internacional Weborama
 
Diapositiva Informatica forense JDBC
Diapositiva Informatica forense JDBCDiapositiva Informatica forense JDBC
Diapositiva Informatica forense JDBC
 
Proteccion datos personales_y_programas_de_computador_pdf998718825
Proteccion datos personales_y_programas_de_computador_pdf998718825Proteccion datos personales_y_programas_de_computador_pdf998718825
Proteccion datos personales_y_programas_de_computador_pdf998718825
 
Aspectos legales del cloud computing ISSA Chile
Aspectos legales del cloud computing ISSA ChileAspectos legales del cloud computing ISSA Chile
Aspectos legales del cloud computing ISSA Chile
 
Presentacion SIRIV
Presentacion SIRIVPresentacion SIRIV
Presentacion SIRIV
 
Taller de datos - Data Toolbox #OSR6 #14wkRebiun
Taller de datos - Data Toolbox #OSR6  #14wkRebiunTaller de datos - Data Toolbox #OSR6  #14wkRebiun
Taller de datos - Data Toolbox #OSR6 #14wkRebiun
 
Seguridad básica
Seguridad básicaSeguridad básica
Seguridad básica
 
Posicionamiento Web y Optimización en Buscadores
Posicionamiento Web y Optimización en BuscadoresPosicionamiento Web y Optimización en Buscadores
Posicionamiento Web y Optimización en Buscadores
 

Más de Renato Ramirez

Pequeña Introducción a las Expresiones Regulares
Pequeña Introducción a las Expresiones RegularesPequeña Introducción a las Expresiones Regulares
Pequeña Introducción a las Expresiones RegularesRenato Ramirez
 
Perl6 regexes workshop perl granada
Perl6 regexes workshop perl granadaPerl6 regexes workshop perl granada
Perl6 regexes workshop perl granadaRenato Ramirez
 

Más de Renato Ramirez (8)

Sun position perl6
Sun position perl6Sun position perl6
Sun position perl6
 
Pequeña Introducción a las Expresiones Regulares
Pequeña Introducción a las Expresiones RegularesPequeña Introducción a las Expresiones Regulares
Pequeña Introducción a las Expresiones Regulares
 
Django (pincelada)
Django (pincelada)Django (pincelada)
Django (pincelada)
 
Aprendiendo latex
Aprendiendo latexAprendiendo latex
Aprendiendo latex
 
Introducción a Perl
Introducción a PerlIntroducción a Perl
Introducción a Perl
 
Odd2015 scraping
Odd2015 scrapingOdd2015 scraping
Odd2015 scraping
 
Perl6 regexes workshop perl granada
Perl6 regexes workshop perl granadaPerl6 regexes workshop perl granada
Perl6 regexes workshop perl granada
 
Go y software libre
Go y software libreGo y software libre
Go y software libre
 

Periodismo de datos

  • 1. Periodismo de datos. JPD14 Almería Introducción al periodismo de datos. Renato L. Ramirez renatolrr@gmail.com @renatolrr www.osl.ugr.es
  • 2. Introducción. ● ¿Qué es el periodismo de datos? ● Por qué debieran usar datos los periodistas ● ¿Por qué es importante el periodismo de datos? ● La ley de crecimiento exponencial de Price. ● La ley de Zuckerberg
  • 3. Obtener datos ● Una guía para trabajos de campo de 5 minutos ● Su Derecho a la Información ● El Wobbing* funciona. ¡Úselo! ● Obtener datos de la red ● La red como fuente de datos ● Herramientas web
  • 4. Entender los datos ● Aprenda a manejar datos con 3 pasos simples ● Consejos para trabajar con cifras en las noticias ● Pasos básicos para trabajar con datos
  • 5. Difundir datos ● Presentar datos al público ● Cómo crear una aplicación de noticias ● El uso de visualizaciones para narrar historias ● Cuadros diferentes dicen cosas diferentes ● Selección de herramientas "Hágalo Ud. mismo" para hacer sus propias visualizaciones de datos.
  • 6. Concepto de scraping ● Scarping Definición según Wikipedia: “Web Scraping es una técnica utilizada mediante programas de software para extraer información de sitios web”
  • 7. Buenas costumbres en scraping. ● Definir previamente lo que se busca. Planificar. ● Copiar web. ● Conocimientos previos de programación. ● Conservar fuentes. ● Guardar los datos utilizando estándares.
  • 8. Aspectos legales ● “no estarán autorizadas la extracción y/o reutilización repetidas o sistemáticas de partes no sustanciales del contenido de una base de datos que supongan actos contrarios a una explotación normal de dicha base o que causen un perjuicio injustificado a los intereses legítimos del fabricante”. Artículo 133 del Real Decreto Legislativo 1/1996, de 12 de abril, por el que se aprueba el Texto Refundido de la Ley de Propiedad Intele
  • 9. Aspectos legales ● “no estarán autorizadas la extracción y/o reutilización repetidas o sistemáticas de partes no sustanciales del contenido de una base de datos que supongan actos contrarios a una explotación normal de dicha base o que causen un perjuicio injustificado a los intereses legítimos del fabricante”. Artículo 133 del Real Decreto Legislativo 1/1996, de 12 de abril, por el que se aprueba el Texto Refundido de la Ley de Propiedad Intele
  • 10. Otros aspectos ● Agencia Española de Protección de Datos. ● Otra legislación.
  • 11. Planificar ● Open project ● Redmine ● Github ● Firebug ● HTML Regex Data Extractor ● Programación en Perl ● Programación avanzada en python ● Desarrollo de software colaborativo con Git
  • 13. Scrapy ● Scraping Web Pages with Scrapy - YouTube
  • 14. Alternativas a Scrapy ● Mozenda ● Scraper Wiki ● DEiXTo ● Nokogiri ● http://search.cpan.org/~miyagawa/Web-Scraper-0.37/lib/Web/Scraper.pm ● http://teusje.wordpress.com/2010/05/02/web-scraping-with-perl/ ● http://blogs.perl.org/users/stas/2013/01/web-scraping-with- modern-perl-part-1.html
  • 15. Libros ● Python for Data Analysis: Data Wrangling with Pandas, NumPy, and Ipython ● Head First Data Analysis: A Learner's Guide to Big Numbers, Statistics, and Good ● The Data Journalism Handbook
  • 16. Datos Para que? ● Narrar ● Estudiar ● Aprender Zapatillas y la Mae. Ejemplo: ● The Baltimore Sun
  • 17. Herramientas datos ● LibreOffice ● Google refine ● Tesseract ● Fusion tables ● R
  • 18. Ejercicio práctico. Elecciones parlamento europeo, municipios de la provincia de Almería.
  • 19. Pasos ● Método científico. (la araña). ● Búsqueda ● Tratamiento. ● Presentación.
  • 20. To be continued... Todas las herramientas presentadas son software libre.