1. Periodismo de datos.
JPD14 Almería
Introducción al periodismo de datos.
Renato L. Ramirez
renatolrr@gmail.com
@renatolrr
www.osl.ugr.es
2. Introducción.
● ¿Qué es el periodismo de datos?
● Por qué debieran usar datos los periodistas
● ¿Por qué es importante el periodismo de datos?
● La ley de crecimiento exponencial de Price.
● La ley de Zuckerberg
3. Obtener datos
● Una guía para trabajos de campo de 5
minutos
● Su Derecho a la Información
● El Wobbing* funciona. ¡Úselo!
● Obtener datos de la red
● La red como fuente de datos
● Herramientas web
4. Entender los datos
● Aprenda a manejar datos con 3 pasos simples
● Consejos para trabajar con cifras en las
noticias
● Pasos básicos para trabajar con datos
5. Difundir datos
● Presentar datos al público
● Cómo crear una aplicación de noticias
● El uso de visualizaciones para narrar historias
● Cuadros diferentes dicen cosas diferentes
● Selección de herramientas "Hágalo Ud.
mismo" para hacer sus propias
visualizaciones de datos.
6. Concepto de scraping
● Scarping
Definición según Wikipedia: “Web Scraping es
una técnica utilizada mediante programas de
software para extraer información de sitios
web”
7. Buenas costumbres en scraping.
● Definir previamente lo que se busca.
Planificar.
● Copiar web.
● Conocimientos previos de programación.
● Conservar fuentes.
● Guardar los datos utilizando estándares.
8. Aspectos legales
● “no estarán autorizadas la extracción y/o
reutilización repetidas o sistemáticas de
partes no sustanciales del contenido de una
base de datos que supongan actos contrarios
a una explotación normal de dicha base o que
causen un perjuicio injustificado a los
intereses legítimos del fabricante”.
Artículo 133 del Real Decreto Legislativo 1/1996, de 12 de abril, por el que se aprueba el Texto Refundido de la Ley de Propiedad Intele
9. Aspectos legales
● “no estarán autorizadas la extracción y/o
reutilización repetidas o sistemáticas de
partes no sustanciales del contenido de una
base de datos que supongan actos contrarios
a una explotación normal de dicha base o que
causen un perjuicio injustificado a los
intereses legítimos del fabricante”.
Artículo 133 del Real Decreto Legislativo 1/1996, de 12 de abril, por el que se aprueba el Texto Refundido de la Ley de Propiedad Intele
11. Planificar
● Open project
● Redmine
● Github
● Firebug
● HTML Regex Data Extractor
● Programación en Perl
● Programación avanzada en python
● Desarrollo de software colaborativo con Git
14. Alternativas a Scrapy
● Mozenda
● Scraper Wiki
● DEiXTo
● Nokogiri
● http://search.cpan.org/~miyagawa/Web-Scraper-0.37/lib/Web/Scraper.pm
● http://teusje.wordpress.com/2010/05/02/web-scraping-with-perl/
● http://blogs.perl.org/users/stas/2013/01/web-scraping-with-
modern-perl-part-1.html
15. Libros
● Python for Data Analysis: Data Wrangling with Pandas, NumPy, and Ipython
● Head First Data Analysis: A Learner's Guide to Big Numbers, Statistics, and Good
● The Data Journalism Handbook