Extracción y visualización de open data desde la 
nube utilizando R Project 
Deybi Morales León 
Usuarios R Nicaragua 
https://www.facebook.com/groups/usuariosrnicaragua/
¿Qué es R? 
Es un lenguaje y entorno de programación 
estadística 
www.r-project.org www.rstudio.com
Paquetes 
R contiene 5778 paquetes para trabajar todas las áreas de 
estadísticas y su utilización en la mayoría de las ciencias. 
--Alta calidad gráfica (3D, estáticos, dinámicos, mapas, etc) 
--Creación de informes con LaTeX y html. 
--Extracción de bases de datos desde las nubes. 
--Interacción con otros programas (Excel, matlab, python, 
eviews, etc)
Filosofía y práctica que persigue que determinados tipos de datos estén disponibles 
de forma libre para todo el mundo, sin restricciones de derechos de autor, de 
patentes o de otros mecanismos de control. 
Disponibilidad por el internet 
Datos económicos 
-Crecimientos del PIB 
-Deuda externa 
-Balanza comercial -etc. 
Datos financieros 
-Tasas de interés 
-Precios de las acciones 
-Índices bursátiles, -etc. 
Datos ambientales 
-Emisiones de CO2 
-etc. 
Datos Sociales 
-Tasa de natalidad 
-Tasa de mortalidad 
-Índices bursátiles, -etc. 
Utilización de API para 
Facebook y Twitter
Paquetes disponibles para extracción de la nube
zipcode U.S. ZIP Code database for geocoding 
fImport Rmetrics - Economic and Financial Data Import 
rWBclimate 
A package for accessing World Bank climate data 
WDI 
World Development Indicators (World Bank) 
ggmap 
A package for spatial visualization with Google Maps 
and OpenStreetMap 
googlePublicData 
An R library to build Google's Public Data Explorer 
DSPL Metadata files 
weatherData 
Get Weather Data from the Web 
emdatr 
Global Disaster Losses from the EMDAT database 
Using R 
ergmharris 
Local Health Department network data set 
fImport Rmetrics - Economic and Financial Data Import 
geomapdata Data for topographic and Geologic Mapping 
gpk 100 Data Sets for Statistics Education 
GCD Global Charcoal Database 
govStatJPN functions to get public survey data in Japan 
fueleconomy EPA fuel economy data 
vegdata Functions to access vegetation databases (Turboveg) and prepare vegetation data especially its taxonomy 
for analysis
fExtremes Rmetrics - Extreme Financial Market 
Data 
fImport Rmetrics - Economic and Financial Data Import 
fueleconomy EPA fuel economy data 
GCD Global Charcoal Database 
geomapdata Data for topographic and Geologic Mapping 
govStatJPN functions to get public 
survey data in Japan 
gpk 100 Data Sets for Statistics Education 
zipcode U.S. ZIP Code database for 
geocoding 
ustyc Fetch US Treasury yield curve data 
UScancer Create US cancer datasets from 
SEER, IARC, and US Census data
Paquetes gráficos
ggplot2 An implementation of the Grammar of Graphics 
lattice Lattice Graphics
Ejemplos
Abonados a internet por cada 100 
personas 
Primero instalar el paquete WDI, este es para el Banco Mundial 
install.packages(“WDI”) 
library(WDI) 
Identificar el indicador buscado, con una palabra como en google 
indicadores<-WDIsearch(“internet”) 
View(indicadores)
usuarios.internet<-WDI(country="all", indicator=indicadores[10,1], start=2012, end=2012) 
Activar ggplot2 
library(ggplot2) 
qplot(data=usuarios.internet[100:258,], x=iso2c, y=IT.NET.USER.P2, 
main="2012 Usuarios de internet", xlab="", ylab="Usuarios por cada 100") + 
geom_text(aes(label=country), size=4, angle=45, hjust=1, vjust=1, color="black") + 
geom_point(aes(size=IT.NET.USER.P2), colour="blue", alpha=0.9)
¿Dónde mis hijos tendrán mayores probabilidades de vida? 
library(WDI) 
indicadores<-WDIsearch("life") 
View(indicadores) 
library(maps) 
library(RColorBrewer) 
library("ggplot2") 
library("plyr") 
library("scales") 
library("rgeos") 
library("ggmap") 
library("mapproj") 
library("maptools")
data(wrld_simpl) 
world_ggmap <- fortify(wrld_simpl, region = "ISO2") 
head(world_ggmap) 
indicadores<-WDIsearch(“life”) 
View(indicadores) 
Años.vida<-WDI(country="all", indicator=indicadores[4,1], start=2012, end=2012) 
ggplot(Años.vida, aes(map_id = iso2c)) + 
geom_map(aes(fill=SP.DYN.LE00.IN), map = world_ggmap, color="black") + 
expand_limits(x = world_ggmap$long, y = world_ggmap$lat) + 
xlab(NULL) + ylab(NULL) + ylim(c(-60, 80)) + 
scale_fill_gradient(low="white", high="blue",name="Años" ) + 
ggtitle("Esperanza de vida al nacer (Datos: 2012)")
Precios de acciones: El pajarito azul en problemas 
install.packages("quantmod") 
library("quantmod") 
getSymbols("TWTR",src="yahoo") 
barChart(TWTR) 
View(TWTR) 
Es necesario identificar el ticket de la acción, en este caso de 
ejemplo TWTR pertenece a Twitter.
Gracias

R project nube (1)

  • 1.
    Extracción y visualizaciónde open data desde la nube utilizando R Project Deybi Morales León Usuarios R Nicaragua https://www.facebook.com/groups/usuariosrnicaragua/
  • 2.
    ¿Qué es R? Es un lenguaje y entorno de programación estadística www.r-project.org www.rstudio.com
  • 3.
    Paquetes R contiene5778 paquetes para trabajar todas las áreas de estadísticas y su utilización en la mayoría de las ciencias. --Alta calidad gráfica (3D, estáticos, dinámicos, mapas, etc) --Creación de informes con LaTeX y html. --Extracción de bases de datos desde las nubes. --Interacción con otros programas (Excel, matlab, python, eviews, etc)
  • 4.
    Filosofía y prácticaque persigue que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, de patentes o de otros mecanismos de control. Disponibilidad por el internet Datos económicos -Crecimientos del PIB -Deuda externa -Balanza comercial -etc. Datos financieros -Tasas de interés -Precios de las acciones -Índices bursátiles, -etc. Datos ambientales -Emisiones de CO2 -etc. Datos Sociales -Tasa de natalidad -Tasa de mortalidad -Índices bursátiles, -etc. Utilización de API para Facebook y Twitter
  • 6.
    Paquetes disponibles paraextracción de la nube
  • 7.
    zipcode U.S. ZIPCode database for geocoding fImport Rmetrics - Economic and Financial Data Import rWBclimate A package for accessing World Bank climate data WDI World Development Indicators (World Bank) ggmap A package for spatial visualization with Google Maps and OpenStreetMap googlePublicData An R library to build Google's Public Data Explorer DSPL Metadata files weatherData Get Weather Data from the Web emdatr Global Disaster Losses from the EMDAT database Using R ergmharris Local Health Department network data set fImport Rmetrics - Economic and Financial Data Import geomapdata Data for topographic and Geologic Mapping gpk 100 Data Sets for Statistics Education GCD Global Charcoal Database govStatJPN functions to get public survey data in Japan fueleconomy EPA fuel economy data vegdata Functions to access vegetation databases (Turboveg) and prepare vegetation data especially its taxonomy for analysis
  • 8.
    fExtremes Rmetrics -Extreme Financial Market Data fImport Rmetrics - Economic and Financial Data Import fueleconomy EPA fuel economy data GCD Global Charcoal Database geomapdata Data for topographic and Geologic Mapping govStatJPN functions to get public survey data in Japan gpk 100 Data Sets for Statistics Education zipcode U.S. ZIP Code database for geocoding ustyc Fetch US Treasury yield curve data UScancer Create US cancer datasets from SEER, IARC, and US Census data
  • 9.
  • 10.
    ggplot2 An implementationof the Grammar of Graphics lattice Lattice Graphics
  • 11.
  • 12.
    Abonados a internetpor cada 100 personas Primero instalar el paquete WDI, este es para el Banco Mundial install.packages(“WDI”) library(WDI) Identificar el indicador buscado, con una palabra como en google indicadores<-WDIsearch(“internet”) View(indicadores)
  • 13.
    usuarios.internet<-WDI(country="all", indicator=indicadores[10,1], start=2012,end=2012) Activar ggplot2 library(ggplot2) qplot(data=usuarios.internet[100:258,], x=iso2c, y=IT.NET.USER.P2, main="2012 Usuarios de internet", xlab="", ylab="Usuarios por cada 100") + geom_text(aes(label=country), size=4, angle=45, hjust=1, vjust=1, color="black") + geom_point(aes(size=IT.NET.USER.P2), colour="blue", alpha=0.9)
  • 15.
    ¿Dónde mis hijostendrán mayores probabilidades de vida? library(WDI) indicadores<-WDIsearch("life") View(indicadores) library(maps) library(RColorBrewer) library("ggplot2") library("plyr") library("scales") library("rgeos") library("ggmap") library("mapproj") library("maptools")
  • 16.
    data(wrld_simpl) world_ggmap <-fortify(wrld_simpl, region = "ISO2") head(world_ggmap) indicadores<-WDIsearch(“life”) View(indicadores) Años.vida<-WDI(country="all", indicator=indicadores[4,1], start=2012, end=2012) ggplot(Años.vida, aes(map_id = iso2c)) + geom_map(aes(fill=SP.DYN.LE00.IN), map = world_ggmap, color="black") + expand_limits(x = world_ggmap$long, y = world_ggmap$lat) + xlab(NULL) + ylab(NULL) + ylim(c(-60, 80)) + scale_fill_gradient(low="white", high="blue",name="Años" ) + ggtitle("Esperanza de vida al nacer (Datos: 2012)")
  • 18.
    Precios de acciones:El pajarito azul en problemas install.packages("quantmod") library("quantmod") getSymbols("TWTR",src="yahoo") barChart(TWTR) View(TWTR) Es necesario identificar el ticket de la acción, en este caso de ejemplo TWTR pertenece a Twitter.
  • 20.