SlideShare una empresa de Scribd logo
1 de 7
1
Master en Business Intelligence y Big Data
Paralelismo y Big Data
EOI Escuela de Organización Industrial http://www.eoi.es
Material de Carlos Martin De los Santos Ng
Pregunta 1
1. Partiendo de la discografía de Pink Floyd:
Año de publicación, Titulo, EEUU, UK
1967, The Piper at the Gates of Dawn,131,6
1968, A Saucerful of Secrets,999,9
1969, Music from the Film More,153,9
1969, Ummagumma,74,5
1970, Atom Heart Mother,55,1
1972, Obscured by Clouds, 46,6
1973, The Dark Side of the Moon, 1,1
1975, Wish you Were Here, 1,1
1977, Animals, 3,2
1979, The Wall, 1,3
1983, The Final Cut, 6,1
1987, A Momentary Lapse of Reason,3,3
1994, The Division Bell, 1,1
2014, The Endless River, 3, 1
Indicar los comandos empleados para resolver las siguientes preguntas
1. Crear un fichero llamado discos.txt
2
Master en Business Intelligence y Big Data
Paralelismo y Big Data
EOI Escuela de Organización Industrial http://www.eoi.es
Material de Carlos Martin De los Santos Ng
2. Arrancar HDFS, Yarn y el job history
HDFS
YARN
JOB HISTORY
3. Subir el fichero a HDFS dentro de la carpeta
/user/bigdata/discos.txt
1.
3
Master en Business Intelligence y Big Data
Paralelismo y Big Data
EOI Escuela de Organización Industrial http://www.eoi.es
Material de Carlos Martin De los Santos Ng
4. Ejecutar la instrucción ls sobre Hadoop para
indicar el tamaño del fichero
El tamaño es 425
4
Master en Business Intelligence y Big Data
Paralelismo y Big Data
EOI Escuela de Organización Industrial http://www.eoi.es
Material de Carlos Martin De los Santos Ng
5. Arrancar pig en modo servidor (ejecutar sólo
pig y si se quiere eliminar trazas de log) y
ejecutar el siguiente comando: cat
/user/bigdata/discos.txt para confirmar que los
primeros puntos han funcionado correctamente
y el fichero está subido a HDFS
6. Cargar el fichero de hdfs en una variable
llamada discos
5
Master en Business Intelligence y Big Data
Paralelismo y Big Data
EOI Escuela de Organización Industrial http://www.eoi.es
Material de Carlos Martin De los Santos Ng
7. Calcular los discos que estuvieron en los 10
primeros lugares en EEUU o UK
6
Master en Business Intelligence y Big Data
Paralelismo y Big Data
EOI Escuela de Organización Industrial http://www.eoi.es
Material de Carlos Martin De los Santos Ng
8. Obtener la máxima y mínima posición que
ocuparon los discos de Pink Floyd en EEUU y en
UK
grunt> c = GROUP discos ALL;
grunt> maxkey= FOREACH c GENERATE MAX(discos.eeuu);
Resultado: (999)
Mínima posición que ocuparon los discos de Pink Floyd en
EEUU
grunt> c = GROUP discos ALL;
grunt> maxkey= FOREACH c GENERATE MIN(discos.eeuu);
Result ado: (1)
Máxima posición que ocuparon los discos de Pink Floyd en
UK
grunt> maxkey2= FOREACH c GENERATE MAX(discos.uk);
7
Master en Business Intelligence y Big Data
Paralelismo y Big Data
EOI Escuela de Organización Industrial http://www.eoi.es
Material de Carlos Martin De los Santos Ng
grunt> dump maxkey2;

Más contenido relacionado

Destacado

Destacado (10)

CV Photos 1
CV Photos 1CV Photos 1
CV Photos 1
 
EdgeFinder
EdgeFinderEdgeFinder
EdgeFinder
 
Ulasan jurnal m20132001996-roslyza md salleh
Ulasan jurnal m20132001996-roslyza md sallehUlasan jurnal m20132001996-roslyza md salleh
Ulasan jurnal m20132001996-roslyza md salleh
 
Ssmac15
Ssmac15Ssmac15
Ssmac15
 
Hi Im 02
Hi Im 02Hi Im 02
Hi Im 02
 
APE INDOOR PAUD TK,PRODUKSI MAINAN EDUKATIF,MAINAN KAYU,SARANA APE PAUD TK,MA...
APE INDOOR PAUD TK,PRODUKSI MAINAN EDUKATIF,MAINAN KAYU,SARANA APE PAUD TK,MA...APE INDOOR PAUD TK,PRODUKSI MAINAN EDUKATIF,MAINAN KAYU,SARANA APE PAUD TK,MA...
APE INDOOR PAUD TK,PRODUKSI MAINAN EDUKATIF,MAINAN KAYU,SARANA APE PAUD TK,MA...
 
Tableau 8.3 server configuration
Tableau 8.3 server configurationTableau 8.3 server configuration
Tableau 8.3 server configuration
 
L. Penner - reference letter
L. Penner - reference letterL. Penner - reference letter
L. Penner - reference letter
 
ijasah_transkip
ijasah_transkipijasah_transkip
ijasah_transkip
 
To un 2015 sosiologi a
To un 2015 sosiologi aTo un 2015 sosiologi a
To un 2015 sosiologi a
 

Similar a Master en Big Data y BI: Análisis de la discografía de Pink Floyd

Dispositivos de almacenamiento
Dispositivos de almacenamientoDispositivos de almacenamiento
Dispositivos de almacenamientoRonny Ure
 
Las 10 Mejores Empresas De Renta De Equipos De Audio En Distrito Federal Estado
Las 10 Mejores Empresas De Renta De Equipos De Audio En Distrito Federal EstadoLas 10 Mejores Empresas De Renta De Equipos De Audio En Distrito Federal Estado
Las 10 Mejores Empresas De Renta De Equipos De Audio En Distrito Federal Estadobrassway8
 
Dispositivos de almacenamiento
Dispositivos de almacenamientoDispositivos de almacenamiento
Dispositivos de almacenamientoclarivelth
 
Dispositivos de almacenamiento
Dispositivos de almacenamientoDispositivos de almacenamiento
Dispositivos de almacenamientoana guerrero
 

Similar a Master en Big Data y BI: Análisis de la discografía de Pink Floyd (8)

floppy (2).pdf
floppy (2).pdffloppy (2).pdf
floppy (2).pdf
 
El Floppy
El FloppyEl Floppy
El Floppy
 
Hennerlint
HennerlintHennerlint
Hennerlint
 
Dispositivos de almacenamiento
Dispositivos de almacenamientoDispositivos de almacenamiento
Dispositivos de almacenamiento
 
Las 10 Mejores Empresas De Renta De Equipos De Audio En Distrito Federal Estado
Las 10 Mejores Empresas De Renta De Equipos De Audio En Distrito Federal EstadoLas 10 Mejores Empresas De Renta De Equipos De Audio En Distrito Federal Estado
Las 10 Mejores Empresas De Renta De Equipos De Audio En Distrito Federal Estado
 
Práctica de comandos
Práctica de comandosPráctica de comandos
Práctica de comandos
 
Dispositivos de almacenamiento
Dispositivos de almacenamientoDispositivos de almacenamiento
Dispositivos de almacenamiento
 
Dispositivos de almacenamiento
Dispositivos de almacenamientoDispositivos de almacenamiento
Dispositivos de almacenamiento
 

Master en Big Data y BI: Análisis de la discografía de Pink Floyd

  • 1. 1 Master en Business Intelligence y Big Data Paralelismo y Big Data EOI Escuela de Organización Industrial http://www.eoi.es Material de Carlos Martin De los Santos Ng Pregunta 1 1. Partiendo de la discografía de Pink Floyd: Año de publicación, Titulo, EEUU, UK 1967, The Piper at the Gates of Dawn,131,6 1968, A Saucerful of Secrets,999,9 1969, Music from the Film More,153,9 1969, Ummagumma,74,5 1970, Atom Heart Mother,55,1 1972, Obscured by Clouds, 46,6 1973, The Dark Side of the Moon, 1,1 1975, Wish you Were Here, 1,1 1977, Animals, 3,2 1979, The Wall, 1,3 1983, The Final Cut, 6,1 1987, A Momentary Lapse of Reason,3,3 1994, The Division Bell, 1,1 2014, The Endless River, 3, 1 Indicar los comandos empleados para resolver las siguientes preguntas 1. Crear un fichero llamado discos.txt
  • 2. 2 Master en Business Intelligence y Big Data Paralelismo y Big Data EOI Escuela de Organización Industrial http://www.eoi.es Material de Carlos Martin De los Santos Ng 2. Arrancar HDFS, Yarn y el job history HDFS YARN JOB HISTORY 3. Subir el fichero a HDFS dentro de la carpeta /user/bigdata/discos.txt 1.
  • 3. 3 Master en Business Intelligence y Big Data Paralelismo y Big Data EOI Escuela de Organización Industrial http://www.eoi.es Material de Carlos Martin De los Santos Ng 4. Ejecutar la instrucción ls sobre Hadoop para indicar el tamaño del fichero El tamaño es 425
  • 4. 4 Master en Business Intelligence y Big Data Paralelismo y Big Data EOI Escuela de Organización Industrial http://www.eoi.es Material de Carlos Martin De los Santos Ng 5. Arrancar pig en modo servidor (ejecutar sólo pig y si se quiere eliminar trazas de log) y ejecutar el siguiente comando: cat /user/bigdata/discos.txt para confirmar que los primeros puntos han funcionado correctamente y el fichero está subido a HDFS 6. Cargar el fichero de hdfs en una variable llamada discos
  • 5. 5 Master en Business Intelligence y Big Data Paralelismo y Big Data EOI Escuela de Organización Industrial http://www.eoi.es Material de Carlos Martin De los Santos Ng 7. Calcular los discos que estuvieron en los 10 primeros lugares en EEUU o UK
  • 6. 6 Master en Business Intelligence y Big Data Paralelismo y Big Data EOI Escuela de Organización Industrial http://www.eoi.es Material de Carlos Martin De los Santos Ng 8. Obtener la máxima y mínima posición que ocuparon los discos de Pink Floyd en EEUU y en UK grunt> c = GROUP discos ALL; grunt> maxkey= FOREACH c GENERATE MAX(discos.eeuu); Resultado: (999) Mínima posición que ocuparon los discos de Pink Floyd en EEUU grunt> c = GROUP discos ALL; grunt> maxkey= FOREACH c GENERATE MIN(discos.eeuu); Result ado: (1) Máxima posición que ocuparon los discos de Pink Floyd en UK grunt> maxkey2= FOREACH c GENERATE MAX(discos.uk);
  • 7. 7 Master en Business Intelligence y Big Data Paralelismo y Big Data EOI Escuela de Organización Industrial http://www.eoi.es Material de Carlos Martin De los Santos Ng grunt> dump maxkey2;