SlideShare una empresa de Scribd logo
1 de 42
Descargar para leer sin conexión
Datos / Formatos
Impresos y manuscritos
Texto (txt, doc, odt, etc.)
Datos / Formatos
HTML, XML
Datos / Formatos
CSV, TSV, ods, xls, xlsx, etc.
Datos / Formatos
• pdf
• txt, odf, doc,
• CSV, TSV, *SV
• xls, xlsx, ods
• Html, xml
• Jpeg, png, tiff
• gis
• db
• Json
• geojson, osm, kml
Datos / Formatos
Datos
Obtención
• Recolección directa (encuestas, drones,
sensores, GPS, etc.)
• Copia de un dispositivo a otro
• Escaneo/OCR de documentos impresos
• Descarga de internet
• Consulta de API
• Filtraciones empresariales/institucionales
• Extracción automátizada (scraping)
• Solicitud via ley de libertad de información
Programas
Programas / Criterios de selección
Programas para
trabajo con datos
Propietarios Libres / Código abierto
Herramientas web
no instalables Instalables /Desktop
Dependen de conexión
a internet para funcionar No dependen de
conexión a internet
Programas
• Tabula
• Calc
• Open Refine
• Neo4j
• SQLite Manager
• IPython/Jupyter
• RStudio
• Overview
• Osmtogeojson
• Geojason.io
• Mapbox
• Orge
• Turf.js
• Qgis
Tabula
“Tabula es una herramienta para liberar tablas
de datos atrapadas dentro de archivos PDF”
“Siempre será libre y de código abierto”
Tomado de “Acerca de Tabula” (en instalación del progama)
Tabula
• CSV
• TSV
• JSON
• ZIP (de CSV)
• SCRIPT (Markup)
Tabula
• CSV
• TSV
• JSON
• ZIP (de CSV)
• SCRIPT (Markup)
PDF basado en texto
(no funciona con archivos
basados en imágenes)
Tabula
SO: Mac, Windows y Linux
Ej. medios de prensa que la usan
• ProPublica
• The Times of London
• Foreign Policy
• La Nación (Argentina)
• St. Paul (MN) Pioneer Press
Tabula
SO: Mac, Windows y Linux
Proyecto en Github:
https://github.com/tabulapdf/tabula
Creada por:
Manuel Aristarán, Mike Tigas, Jeremy B. Merrill
Con apoyo de:
ProPublica,
La Nación DATA,
Knight-Mozilla OpenNews,
The New York Times
Knight Foundation
Tabula
(Demostración)
Calc
Calc
Bifurcado de OpenOffice en 2010
Sistemas: Linux, OS X, Windows, FreeBSD
Licencia: MPL
Calc
Capacidad: 1M x 1024 celdas
(vs Excel 1M (1.048.576 x 16384)
Calc
(Demostración)
Open Refine
Usos:
- Limpieza de conjuntos de datos
- Conversión de un formato a otro
- Obtención de datos de sitios web
- Enriquecimiento de conjuntos de datos
con más datos obtenidos de Freebase
Open Refine
Originalmente desarrollado por Metaweb
Technologies, Inc. como "Freebase
Gridworks" – libre desde enero 2010
Google Refine en julio 2010
OpenRefine en octubre de 2012
Open Refine
Open Refine
TSV, CSV, *SV,
Excel (.xls, .xlsx),
JSON,
XML,
RDF as XML,
Google Data documents
Otros formatos
disponibles mediante
extensiones
Formatos de entrada:
Open Refine
Formatos de salida:
Open Refine
(Demostración)
Neo4j
Sistema de gestión de bases de datos gráficas
Neo Technology, Inc. (EE.UU.-Suecia)
v 1.0 lanzada en febrero de 2010
V 2.0 lanzada en diciembre de 2013
Neo4j
Neo4j
Licencias:
• Versión de comunidad - GNU General
Public License (GPL) v3.
• Módulos adicionales – backup online –
Affero General Public License (AGPL) v3.
• Comercial
Neo4j
Tomado de Graph Databases: New opportunities for connected data,
de Ian Robinson, Jim Webber, y Emil Eifrem. O´Reilly Media, Inc. 2015
Neo4j
Tomado de Graph Databases: New opportunities for connected data,
de Ian Robinson, Jim Webber, y Emil Eifrem. O´Reilly Media, Inc. 2015
Neo4j
Neo4j
(emil:Person {name:'Emil'})
<-[:KNOWS]-(jim:Person {name:'Jim'})
-[:KNOWS]->(ian:Person {name:'Ian'})
-[:KNOWS]->(emil)
Tomado de Graph Databases: New opportunities for connected data,
de Ian Robinson, Jim Webber, y Emil Eifrem. O´Reilly Media, Inc. 2015
Neo4j
(Demostración)
Overview
Herramienta para minería de textos
Desarrollada con apoyo de AP dirigida a
periodistas
Overview
Overview
RStudio
Entorno de desarrollo integrado (IDE) para R
R es un lenguaje de programación para cálculo estadístico y
creación de gráficos
Disponible para Windows, Mac, Linux
RStudio
RStudio
(Demostración)
Jupyter Notebooks
Herramienta que permite utilizar código, texto,
expresiones matemáticas, gráficos, e imágenes
Interacción vía navegador
(Demostración)
Jupyter Notebooks

Más contenido relacionado

Similar a Herramientas libres para periodismo de datos

Ricoh and Autostore
Ricoh and AutostoreRicoh and Autostore
Ricoh and Autostore
NSI LA
 
Estandares abiertos ODF
Estandares abiertos ODF Estandares abiertos ODF
Estandares abiertos ODF
Luis E Vasquez
 
APIs Nativas: Almacenamiento de Datos y NFC
APIs Nativas: Almacenamiento de Datos y NFCAPIs Nativas: Almacenamiento de Datos y NFC
APIs Nativas: Almacenamiento de Datos y NFC
Joel Ortíz
 
Computacion tarea 3
Computacion tarea 3Computacion tarea 3
Computacion tarea 3
AKMFA
 
Software libre para la integración de información en la Universidad de Cádiz
Software libre para la integración de información en la Universidad de CádizSoftware libre para la integración de información en la Universidad de Cádiz
Software libre para la integración de información en la Universidad de Cádiz
Antonio García-Domínguez
 

Similar a Herramientas libres para periodismo de datos (20)

Ricoh and Autostore
Ricoh and AutostoreRicoh and Autostore
Ricoh and Autostore
 
Uso de aplicaciones_power_point
Uso de aplicaciones_power_pointUso de aplicaciones_power_point
Uso de aplicaciones_power_point
 
Gestión de documentos Office desde nuestras apps .NET con Open XML SDK
Gestión de documentos Office desde nuestras apps .NET con Open XML SDKGestión de documentos Office desde nuestras apps .NET con Open XML SDK
Gestión de documentos Office desde nuestras apps .NET con Open XML SDK
 
Zenoss.pptx
Zenoss.pptxZenoss.pptx
Zenoss.pptx
 
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
 
MetaShield Protector & FOCA 2.0
MetaShield Protector & FOCA 2.0MetaShield Protector & FOCA 2.0
MetaShield Protector & FOCA 2.0
 
Uso de aplicaciones_impress
Uso de aplicaciones_impressUso de aplicaciones_impress
Uso de aplicaciones_impress
 
Estandares abiertos ODF
Estandares abiertos ODF Estandares abiertos ODF
Estandares abiertos ODF
 
SMBD 2011
SMBD 2011SMBD 2011
SMBD 2011
 
SMBD 2011
SMBD 2011SMBD 2011
SMBD 2011
 
APIs Nativas: Almacenamiento de Datos y NFC
APIs Nativas: Almacenamiento de Datos y NFCAPIs Nativas: Almacenamiento de Datos y NFC
APIs Nativas: Almacenamiento de Datos y NFC
 
VI Foro Evidencias Electrónicas en la Investigación Policial. Análisis forens...
VI Foro Evidencias Electrónicas en la Investigación Policial. Análisis forens...VI Foro Evidencias Electrónicas en la Investigación Policial. Análisis forens...
VI Foro Evidencias Electrónicas en la Investigación Policial. Análisis forens...
 
Office 365 LLeve su empresa un Maximo Nivel
Office 365 LLeve su empresa un Maximo NivelOffice 365 LLeve su empresa un Maximo Nivel
Office 365 LLeve su empresa un Maximo Nivel
 
Presentacion Proyecto Herramienta de Documentalista
Presentacion Proyecto Herramienta de DocumentalistaPresentacion Proyecto Herramienta de Documentalista
Presentacion Proyecto Herramienta de Documentalista
 
Presentacionh HDD Herramienta de Documentalista
Presentacionh HDD Herramienta de DocumentalistaPresentacionh HDD Herramienta de Documentalista
Presentacionh HDD Herramienta de Documentalista
 
Gestion del conocimiento
Gestion del conocimientoGestion del conocimiento
Gestion del conocimiento
 
Gestion del conocimiento
Gestion del conocimientoGestion del conocimiento
Gestion del conocimiento
 
Computacion tarea 3
Computacion tarea 3Computacion tarea 3
Computacion tarea 3
 
Software libre para la integración de información en la Universidad de Cádiz
Software libre para la integración de información en la Universidad de CádizSoftware libre para la integración de información en la Universidad de Cádiz
Software libre para la integración de información en la Universidad de Cádiz
 
01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf01 Introduccion a Big Data y Hadoop.pdf
01 Introduccion a Big Data y Hadoop.pdf
 

Último

La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
analiticaydatos
 
Proyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónProyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigación
EduCE2
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
matiasccoyllomarca
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
JuanmanuelYapitamani
 
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
FeliGamarra1
 

Último (20)

Seguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahSeguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoah
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
 
Estudio sobre tenencia de animales domésticos en Madrid 2019-2023
Estudio sobre tenencia de animales domésticos en Madrid 2019-2023Estudio sobre tenencia de animales domésticos en Madrid 2019-2023
Estudio sobre tenencia de animales domésticos en Madrid 2019-2023
 
Estudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEstudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de Ipsos
 
Ideas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechileIdeas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechile
 
Posición global del PIB per cápita Israelí (1948-2024).pdf
Posición global  del PIB per cápita  Israelí  (1948-2024).pdfPosición global  del PIB per cápita  Israelí  (1948-2024).pdf
Posición global del PIB per cápita Israelí (1948-2024).pdf
 
Diapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especificoDiapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especifico
 
CARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia PatrimonioCARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia Patrimonio
 
Proyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónProyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigación
 
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Países con  mayores líneas de trenes de alta velocidad  (2021).pdfPaíses con  mayores líneas de trenes de alta velocidad  (2021).pdf
Países con mayores líneas de trenes de alta velocidad (2021).pdf
 
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
 
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERALCUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
CUENCA MADRE DE DIOS-BOLIVIA INFORMACIÓN GENERAL
 
Pobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfPobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdf
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
 
Análisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdfAnálisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdf
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
 
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
 
Análisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y PerúAnálisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y Perú
 
principios pedagógicos del modelo agazian
principios pedagógicos  del modelo agazianprincipios pedagógicos  del modelo agazian
principios pedagógicos del modelo agazian
 
Paisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaPaisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historia
 

Herramientas libres para periodismo de datos