2. Hacks/Hackers
Exploran tecnologías para filtrar y visualizar información. Se trata de empoderar
profesionales y entusiastas para que utilicen los últimos avances al servicio de
encontrar y contar historias.
En la era de la sobrecarga de información, todo este trabajo se ha vuelto aún más
crucial. Hacks/Hackers tiene como objetivo ayudar a los miembros a encontrar
inspiración y pensar en nuevas direcciones, acercando posibles colaboradores
para los distintos proyectos y fomentando nuevas asociaciones.
Periodistas - Desarrolladores - Diseñadores
9. Acceso a la información pública
El 17 de Octubre de 2008 el Parlamento uruguayo aprobó
la ley de Acceso a la Información que regula el derecho de
las personas a acceder a información en manos del
Estado.
10. Extraer datos - Scraping
Scraping Básico:
http://www.free-ocr.com/
http://www.onlineocr.net/
http://www.newocr.com/
11. Extraer datos - Scraping
Scraping:
Outwit - http://www.outwit.com/
Tabula - http://tabula.nerdpower.org/
Import Io - https://import.io/
Scraper Wiki - https://scraperwiki.com/
Scraper - Extensión de Google
OutWit - Extensión de Mozilla
12. Ejemplo práctico de Scraping
Ejemplo de extracción de datos con Hojas de Cálculo de Google
1. Ir a https://drive.google.com
2. Acceder o crear un usuario
3. Presionar el botón crear y elegir Hoja de cálculo
4. Crear fórmula para insertar datos de una web:
5. tipear en la hoja de calculo “=IMPORTHTML”:
Allí hay que completar tres secciones:
- URL: de la página, entre comillas, que se va a analizar, incluido el protocolo (p. ej., http://).
- Consulta: Puede tener los valores lista “list” o tabla “table” y debe ir entre comillas.
- Índice: que empieza en 1, que identifica la tabla o lista que se debe ofrecer, según se indica en
el código fuente HTML.
13. Ejemplos a extraer
Ranking de las 250 mejores películas según IMDB
http://www.imdb.com/chart/top?ref_=nv_ch_250_4
Proyecto financiados por la ANII
http://www.anii.org.uy/web/?q=vistaproyectos
Promedio de precios por cadena
http://www.precios.uy/images/sipc/analisisdeprecios/reportes/quincenal/2014/Setiembre/cadenas.p
df
15. Manejo de hoja de cálculo
- Congelar - Freeze
- Buscar y reemplazar
- Formato de celdas
- Cambiar orden de datos - Ascendente y descendente
- Múltiples variables
17. Fusionar y retocar tablas
http://openrefine.org/
http://www.shpescape.com/
https://support.google.com/fusiontables/answer/2571232
18. Manejando Google Refine
1. Obtener una base de datos a utilizar
2. Abrir Google Refine
3. Crear un proyecto
4. Importar una base de datos
5. Elegir codificación UTF-8 para idioma español
6. Debe estar separado por ; (por defecto)
7. Elegir nombre del proyecto a crear
19. Manejando Google Refine
Editando la tabla
1. Cambiar valores: Ejemplo: value.replace(“X”,”Z”), esto cambiará todas las X de la columna por
Z.
2. Cambiar a mayúsculas, minúsculas, o mayúscula-minúscula: seleccionamos la flecha azul
del encabezado de la columna, seleccionamos editar celdas (edit cells) y luego
transformaciones comunes.
3. Quitar los espacios en blanco tanto delante como detrás del texto: editar celdas,
transformaciones comunes, “Trim leading and trailing whitespace”.
4. Evitar palabras duplicadas con errores o escritos diferentes: seleccionar editar celda,
“cluster and edit”
5. Si hay un error podemos volver a alguno de los pasos anteriores seleccionando la columna de
la izquierda “undo/redo”
20. Manejando Google Refine
Editando la tabla
https://developers.google.com/maps/documentation/geocoding/
http://maps.googleapis.com/maps/api/geocode
21. Tutoriales y recursos
Manuales
Manual de Periodismo de Datos (The Data Jounalism Handbook)
http://interactivos.lanacion.com.ar/manual-data/
Manual de Periodismo de Datos Iberoamericano
http://manual.periodismodedatos.org/
Cursos
http://es.schoolofdata.org/cursos/ (español)
http://schoolofdata.org/courses/ (ingles)
http://datadrivenjournalism.net/resources (ingles)
http://www.peteraldhous.com/resources.html
22. Tutoriales y recursos
Tutoriales
Google Refine
http://medialab-prado.es/article/limpiando_datos_google_refine
http://blogs.lanacion.com.ar/data/datos-abiertos/como-usar-google-refine-para-trabajar-una-base-d
e-datos/
http://nochesdemedia.com/2014/02/03/tutoriales-que-te-facilitaran-el-uso-de-open-refine/
http://josepvalles.com/chuleta-guia-tutorial-open-refine-google-refine/