Clase 4 tecno i- periodismo 2015

TECNOLOGÍA DE LATECNOLOGÍA DE LA
COMUNICACIÓN I
Lic. en Periodismo
Periodismo Universitario
FCH-UNSL (Año 2015)

CLASE IV
“PERIODISMO DE BASE DE DATOS:
BÚSQUEDA, EXTRACCIÓN,
PROCESAMIENTO Y VISUALIZACIÓNPROCESAMIENTO Y VISUALIZACIÓN
DE GRANDES VOLÚMENES DE
INFORMACIÓN”
CREATIVE COMMONS RECONOCIMIENTO-NOCOMERCIAL-
COMPARTIRIGUAL 3.0 UNPORTED LICENSE

¿QUÉ ES EL PERIODISMO DE BASE DE
DATOS (PBD)?
Es una manera de crear o complementar noticias haciendo uso de los datos
existentes en la WWW.
Incluye el PI (periodismo de investigación) para revelar una verdad social
desconocida; el PP (periodismo de precisión) cuando aplica métodos de la
investigación social, el PA (periodismo analítico) porque analiza una realidad
compleja para lograr la comprensión del público y el PAC (periodismo asistido porcompleja para lograr la comprensión del público y el PAC (periodismo asistido por
computadora) para el análisis estadístico de los datos.

EJEMPLOS DE NOTICIAS CON PBD
ARTÍCULOS BASADOS EN DATOS
Se desarrollan en base a información ya existente en la red. Son artículos de corta a
mediana extensión (http://www.lanacion.com.ar/1484852-los-millones-de-la-ape-
como-se-repartio-en-2011-la-caja-que-era-de-moyano)

ARTÍCULOS BASADOS EN DATOS

Al igual que en el
caso anterior se
basan en
información ya
existente en la red.
VISUALIZACIONES INTERACTIVAS
La diferencia
radica en las
noticias, en las que
un título o
descripción basta.
(http://www.lanacio
n.com.ar/1546303-
los-bienes-de-los-
funcionarios-en-la-
primera-news-
application-de-la-
nscion)

VISUALIZACIONES INTERACTIVAS

Son recopilados por los propios periodistas debido a la ausencia de acceso
abierto por parte de las organizaciones
(http://data.lanacion.com.ar/dashboards/5068/inflacion-y-precios)
CONJUNTO DE DATOS ABIERTOS

Son desarrolladas por periodistas y programadores
(http://gastopublicobahiense.org). Permiten agrupar y analizar variables
mediante diversos parámetros..
APLICACIONES DE NOTICIAS

APLICACIONES DE NOTICIAS

Publican la información en blogs
(http://soloopendata.blogspot.com.ar/)
BLOGS DE DATOS

Se encuentran dentro de una sección de un medio digital
(http://www.lanacion.com.ar/data)
CANALES DE DATOS

OPERACIONES QUE IMPLICA
EL PBD
•BÚSQUEDA•BÚSQUEDA
•EXTRACCIÓN
•PROCESAMIENTO y
•VISUALIZACIÓN de la
información…

OPERACIONES DEL PBD
BÚSQUEDA DE DATOS:
Puede ser realizada…
-mediante buscadores de la Web Invisible (Google Búsqueda Avanzada, Google
Scholar, Scielo, Wayback Machine, Socialmention, Twitterfall, etc.)

OPERACIONES DEL PBD
BÚSQUEDA DE DATOS:
Puede ser realizada…
-mediante buscadores internos de sitios web que almacenan bases de datos
(por ej. del sitio del Boletín Oficial del Gobierno de la Provincia de San Luis, del
Ministerio de Educación de San Luis, etc.)

OPERACIONES DEL PBD
EXTRACCIÓN o SCRAPING DE
DATOS:
Cuando los datos no son abiertos, es decir, no permiten la descarga y/o
copias de la información (por ej. se encuentran en un formato .pdf y no
.xls o .csv) se puede hacer uso de herramientas que nos permitan
acceder a los datos abiertos, antes de tener que producirla de forma
manual.
Las herramientas que se utilizan son:
- OCR
- ZAMZAR
- NITRO PDF,
- TABULA, etc.

EXTRACCIÓN MEDIANTE OCR
OPERACIONES DEL PBD
Posibilita
extraer
texto detexto de
una
imagen
…

EXTRACCIÓN MEDIANTE OCR
OPERACIONES DEL PBD
Puede utilizarse para extraer el texto de la primera página de un
documento y en la actualidad se está perfeccionando para convertir
hasta las primeras 10 páginas de un documento.

Permite extraer el
contenido textual y
gráfico de un
documento y el envío
de la conversión se
EXTRACCIÓN MEDIANTE ZAMZAR
OPERACIONES DEL PBD
de la conversión se
realiza por email.
Actualmente es uno
de los sitios en línea
gratuito cuyo proceso
de conversión
funciona.

EXTRACCIÓN MEDIANTE NITRO PDF
OPERACIONES DEL PBD
Funciona de modo similar a ZAMZAR, pero es gratuito durante un
período de prueba. Al finalizar el mismo, se debe comprar el software
para continuar su uso. Es muy completo y funciona muy bien.

Permite extraer textos
y gráficos, a través de
un programa gratuito
que se instala en la
computadora y realiza
el proceso de
EXTRACCIÓN MEDIANTE TABULA
OPERACIONES DEL PBD
el proceso de
extracción por partes.
Su uso es
independiente de la
conexión a Internet y
garantiza su
durabilidad en el
tiempo.

Implica la creación y/o procesamiento de los datos
a través de diversas herramientas:
PROCESAMIENTO
OPERACIONES DEL PBD
a través de diversas herramientas:
-Google Drive (gratuita y de rápido acceso)
-Socrata, Document Cloud y Junar (son de código
abierto o pagas, especializadas, profesionales, y
exigen condiciones antes de permitir el uso del
servicio).

PROCESAMIENTO CON DOCUMENT CLOUD
OPERACIONES DEL PBD
Es de código abierto y puede ser utilizada por periodistas u otro
usuario que realice PBD. Exige muestra de informes y permisos
para ser contribuyente. Tarda al menos dos semanas para la
otorgación de una cuenta.

PROCESAMIENTO CON SOCRATA Y JUNAR
OPERACIONES DEL PBD
Son utilizadas por importantes medios de comunicación del mundo que
abogan por el acceso abierto a los datos. Permiten la descarga de una
versión de demostración antes de decidirse pagar por el servicio. Son
muy completas, potentes y poseen ayuda y soporte en línea.

PROCESAMIENTO CON GOOGLE DRIVE
OPERACIONES DEL PBD
Es la aplicación que utilizaremos porque posibilita que el periodista
pueda, a través de una hoja de cálculo, administrar gran cantidad de
datos de forma gratuita y operar con ellos mediante diversos tipos de
fórmulas. Además, es de rápido acceso y permite la integración con
aplicaciones en línea que permiten su visualización de forma gráfica.

Requiere del análisis profundo de los datos para decidir no solo qué formulas usar,
sino también en qué casos hacerlo
(https://docs.google.com/spreadsheet/ccc?key=0AgX1zNUFm5hcdEVPNjY0cUpWV
GVQYl9jQ2pNQlUwc0E&usp=drive_web#gid=7)
PROCESAMIENTO EN GOOGLE DRIVE
OPERACIONES DEL PBD

Con los datos de una planilla pueden efectuarse diversos cálculos. Los más
comunes son:
A B C
1 2010 2011
2 Ecuador 372,163 409,125
3 El Salvador 2,918 3,574
4 Guatemala 1,738 1,959
MAX
Permite obtener el mayor valor de
un conjunto de datos.
OPERACIONES DEL PBD
4 Guatemala 1,738 1,959
5 Honduras 10,252 14,651
6 Nicaragua 4,415 6,246
7 Panamá 1,172 1,291
8 Paraguay 30,212 38,154
9 Perú 136,919 141,44
10
República
Dominicana 84,721 90,278
MÁXIMO VALOR 372,163 409,125
MÍNIMO VALOR
PROMEDIO
En su sintaxis pide que se coloque
el primer y último valor del rango de
datos separado por el símbolo “:”
=MAX (B2:B10)
=MAX (C2:C10)

A B C
1 2010 2011
2 Ecuador 372,163 409,125
4 Guatemala 1,738 1,959
MIN
Permite obtener el mínimo valor de
En su sintaxis pide que se coloque
OPERACIONES DEL PBD
4 Guatemala 1,738 1,959
5 Honduras 10,252 14,651
6 Nicaragua 4,415 6,246
7 Panamá 1,172 1,291
8 Paraguay 30,212 38,154
9 Perú 136,919 141,44
10
República
MÁXIMO VALOR 372,163 409,125
MÍNIMO VALOR 1,172 1,291
PROMEDIO
el primer y último valor del rango de
datos separado por el símbolo “:”
=MIN (B2:B10)
=MIN (C2:C10)

A B C
1 2010 2011
2 Ecuador 372,163 409,125
4 Guatemala 1,738 1,959
5 Honduras 10,252 14,651
PROMEDIO
Permite obtener el valor
promedio de un conjunto de
datos.
En su sintaxis pide que se
coloque el primer y último
OPERACIONES DEL PBD
5 Honduras 10,252 14,651
6 Nicaragua 4,415 6,246
7 Panamá 1,172 1,291
8 Paraguay 30,212 38,154
9 Perú 136,919 141,44
10
República
MÁXIMO VALOR 372,163 409,125
MÍNIMO VALOR 1,172 1,291
PROMEDIO 71,6122222 78,5242222
coloque el primer y último
valor del rango de datos
separado por el símbolo “:”
=AVERAGE (B2:B10)
=AVERAGE (C2:C10)

EXISTEN OTRAS FORMULAS QUE PODEMOS
APLICAR, ENTRE ELLAS:
OPERACIONES DEL PBD
APLICAR, ENTRE ELLAS:
- Mode (Moda): devuelve el valor que más se
repite dentro de un conjunto de datos.
- Median: devuelve el valor que deja el mismo
número de datos antes y después que él.
- Varianza: devuelve la dispersión entre datos,
etc.

Para el procesamiento de datos numéricos
en general existen además numerosas
PROCESAMIENTO
OPERACIONES DEL PBD
en general existen además numerosas
herramientas en línea, entre ellas:
- Calculadoras virtuales (comunes,
científicas, de porcentaje, etc.)
- Conversores de unidades (de área,
volumen, longitud, etc.)

PROCESAMIENTO CON CALCULADORAS
VIRTUALES
OPERACIONES DEL PBD

PROCESAMIENTO CON CONVERSORES
DE UNIDADES
OPERACIONES DEL PBD

Implica representar los datos en una
VISUALIZACIÓN
OPERACIONES DEL PBD
Implica representar los datos en una
forma gráfica que facilite su interpretación
por parte de los lectores.
Aquí se utilizan herramientas como
Tableau Public, Datawrapper y
Google Fusion Tables.

VISUALIZACIÓN CON TABLEU PUBLIC
OPERACIONES DEL PBD
Es complejo en su manejo porque requiere de un minucioso y
controlado proceso a la hora de subir los conjuntos de datos y
obtener su visualización. Su uso es gratuito.

VISUALIZACIÓN CON TABLEU PUBLIC
OPERACIONES DEL PBD
Otorga un código en Java Script que permite su inserción dentro de
un sitio web. Es importante tener instalado en la PC la última
versión de Java para que Tableu Public funcione adecuadamente.

VISUALIZACIÓN CON DATA WRAPPER
OPERACIONES DEL PBD
Es más sencillo y posee menores restricciones. Requiere registro al
igual que Tableau Public y brinda código de programación para su
inserción en sitios web.

VISUALIZACIÓN CON DATA WRAPPER
OPERACIONES DEL PBD
Al igual que en Tableau Public las planillas pueden ser generadas
en el mismo sitio o bien importadas en formato .xls o .csv
(estándares para los grandes volúmenes de datos).

VISUALIZACIÓN CON GOOGLE FUSION TABLES
OPERACIONES DEL PBD
Es la aplicación que utilizaremos pues aunque se encuentra aún en
fase de experimentación y no posee un proceso de trabajo sencillo,
es gratuita y permite la interacción con otras aplicaciones de Google,
como las planillas de cálculo creadas en Drive.

OPERACIONES DEL PBD
Al crear una nueva fusión de tablas, el programa nos solicita la hoja
de datos que podrá estar almacenada en la computadora, en línea, o
bien, deberá ser creada desde cero. En este caso particular los datos
ya se encuentran en línea (opción Spreadsheets).

OPERACIONES DEL PBD
Cuando los datos están en línea deben ser seleccionados y
posteriormente autorizados para poder dar inicio al proceso de
fusión de los datos.

OPERACIONES DEL PBD
Solo si los datos importados son correctos, se visualizarán
satisfactoriamente y se podrá continuar con el siguiente paso.

OPERACIONES DEL PBD
El título del gráfico, autor, enlaces relacionados (si posee) y
descripción son también importantes de definir previa generación de
la visualización.

OPERACIONES DEL PBD
Finalmente, la visualización admite diversas posibilidades: mapa,
gráficos, resumen, etc. Las más utilizadas son las dos primeras.

OPERACIONES DEL PBD
Visualización
mediante un
MAPAMAPA

OPERACIONES DEL PBD
Visualización
mediante un
gráfico de
COLUMNAS
(todos los(todos los
países en
todos los
años)

OPERACIONES DEL PBD
Visualización mediante un
gráfico CIRCULAR (todos los
países en un año en particular)

OPERACIONES DEL PBD
Visualización
mediante un gráfico
CARDS (útil para
pocos datos porque
permite concentrar enpermite concentrar en
una sola vista toda la
información de la que
se dispone )

VISUALIZACIÓN CON GOOGLE FUSION
TABLES
OPERACIONES DEL PBD
EMBEBER GRÁFICOS EN UN SITIO WEB
Posibilita insertar uno o más gráficos generados en la
aplicación Google Fusion Tables en un sitio web.
Para ello se debe:
• Hacer públicas la/s tabla/s generada/s en esta aplicación
(no se puede compartir lo que no está permitido)
• Obtener el código de inserción provisto por cada tipo de
gráfico (solo tiene sentido si la/s tabla/s son pública/s)…

TABLES
OPERACIONES DEL PBD
HACER PÚBLICAS LAS TABLAS EN DRIVE
Permite el posterior acceso a las mismas desde la Web…

TABLES
OPERACIONES DEL PBD
OBTENER EL CÓDIGO DE INSERCIÓN DE CADA GRÁFICO
Permite insertar un gráfico como parte de los contenidos de un
sitio ya existente…

FIN DE PRESENTACIÓN
Gracias por su atención…
Elaborado por Prof. Viviana M. Ponce
vmponce@unsl.edu.ar
Fac. de Cs. Humanas- UNSL

Clase 4 tecno i- periodismo 2015

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (18)

Similar a Clase 4 tecno i- periodismo 2015

Similar a Clase 4 tecno i- periodismo 2015 (20)

Último

Último (20)

Clase 4 tecno i- periodismo 2015