SlideShare una empresa de Scribd logo
1 de 2
Descargar para leer sin conexión
Línea de
pensamiento
Elegimos la
tabla de donde
están los
datos...
...y con ellos...
...elegimos las
columnas que
vamos a
utilizar...
...y con ellos...
...filtramos
aquellos valores
que nos
interesan...
...y con ellos...
...creamos
nuevas
columnas...
...y con ellos...
...agrupamos
según nuestros
intereses...
...y con ellos...
resumimos los
datos
Código
Nombre
dataframe o
datatable
%>%
select(Nombres
Columnas)
%>%
filter(Nombre
Columnas y
Condición)
%>%
mutate(Nombre
nuevo campo =
Cálculo del
campo)
%>%
group_by(Nombre
Columnas por
cuyos valores se
quiere agrupar)
%>%
summarise(Nombre de las
cabecerasque se
mostrarán=Función quese
aplicará)
Ejemplo
Infoadex
%>%
select(MARCA_DIRECTA,INS,INV_EST
_IAD_EUROS,OCUPACION)
%>%
filter(INV_EST_IAD_EUROS>100)
%>%
mutate(COSTExINSERCION=
(INV_EST_IAD_EUROS/INS))
%>%
group_by(MARCA_DIRECTA)
%>%
summarise(Media_Inversion=mean(I
NV_EST_IAD_EUROS),Maximo_Coste
Insercion=max(COSTExINSERCION))
Manejodedatoscon
CheatSheet
byPedroHerreroPetisco
dplyr
Funciones más usadas para:
mutate summarise
first
• Primer valor de un vector
last
• Último valor de un vector
nth
• N-esimo valor de un vector
n()
• Valores de un vector
n_distinct
• Valores distintos de un sector
Funciones
de R base
Funciones
de dplyr
row_number
• Numera las filas
dense_rank
• Ranking de la variable
lead
• Copia los valores de una columna en la nueva moviéndolos una fila hacia arriba
lag
• Copia los valores de una columna en la nueva moviéndolos una fila hacia abajo
Operadores aritméticos
• + Suma; - Resta; *  Multiplicación; ^  Exponenciación; /  División; %% Resto
Operadores de comparación
• ==  Igual; !=Distinto; >  Mayor que; <  Menor que; >=  Mayor o igual; <=  Menor o igual
Operadores lógicos
• &  Y; |  O; !  No
mean
• Media
median
• Mediana
var
• Varianza
sd
• Desviación típica
sum
• Suma de los valores de un vector
max
• Valor máximo de un vector
min
• Valor mínimo de un vector
select
contains
• Selecciona las columnas que contiene una cadena de caracteres
ends_with
• Selecciona las columnas que terminan con una cadena de caracteres
starts_with
• Selecciona las columnas que empiezan con una cadena de caracteres
Ejemplo de uso
mutate
• Datos %>% mutate(PosicionMasUno=lag(Posicion)))
select
• Datos %>% select(contains(“Cabecera”))
summarise
• Datos %>% summarise(median(Cabecera))
Otros comandos del paquete dplyr:
distinct()
• Elimina las filas duplicadas
slice(a:b)
• Elije filas entre a y b
sample_n(n)
• Extrae una muestra aleatoria de n filas
Select(Columna_n;everything())
• Reordena las columnas
Datos%>%distinct()
• Si se quieren quitar las duplicaciones en base a una columna poner Datos%>%distinct(NombreColumna)
Datos%>%slice(10:20)
• Selecciona las filas de la 10 a la 20
Datos%>%sample_n(4)
• Extrae 4 filas aleatoriamente
Datos%>%select(Columna_n,Columna_d,everything())
• Ordena las columnas poniendo primero la Columna_n, después la Columna_d y después el resto de columnas
Manejodedatoscon
CheatSheet
byPedroHerreroPetisco
dplyr

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Java loops
Java loopsJava loops
Java loops
 
Cs8494 software engineering
Cs8494 software engineeringCs8494 software engineering
Cs8494 software engineering
 
11. Java Objects and classes
11. Java  Objects and classes11. Java  Objects and classes
11. Java Objects and classes
 
Lecture 3 RE NFA DFA
Lecture 3   RE NFA DFA Lecture 3   RE NFA DFA
Lecture 3 RE NFA DFA
 
Bayes network
Bayes networkBayes network
Bayes network
 
JVM
JVMJVM
JVM
 
Introduction to Genetic Algorithm
Introduction to Genetic Algorithm Introduction to Genetic Algorithm
Introduction to Genetic Algorithm
 
Type Systems
Type SystemsType Systems
Type Systems
 
Storage classes
Storage classesStorage classes
Storage classes
 
Packages in java
Packages in javaPackages in java
Packages in java
 
1.8. equivalence of finite automaton and regular expressions
1.8. equivalence of finite automaton and regular expressions1.8. equivalence of finite automaton and regular expressions
1.8. equivalence of finite automaton and regular expressions
 
cs8251 unit 1 ppt
cs8251 unit 1 pptcs8251 unit 1 ppt
cs8251 unit 1 ppt
 
02 Machine Learning - Introduction probability
02 Machine Learning - Introduction probability02 Machine Learning - Introduction probability
02 Machine Learning - Introduction probability
 
Stack and heap
Stack and heapStack and heap
Stack and heap
 
Graphics programming in Java
Graphics programming in JavaGraphics programming in Java
Graphics programming in Java
 
Java-java virtual machine
Java-java virtual machineJava-java virtual machine
Java-java virtual machine
 
358 33 powerpoint-slides_1-introduction-c_chapter-1
358 33 powerpoint-slides_1-introduction-c_chapter-1358 33 powerpoint-slides_1-introduction-c_chapter-1
358 33 powerpoint-slides_1-introduction-c_chapter-1
 
Constructors in java
Constructors in javaConstructors in java
Constructors in java
 
Fundamentals of Programming Constructs.pptx
Fundamentals of  Programming Constructs.pptxFundamentals of  Programming Constructs.pptx
Fundamentals of Programming Constructs.pptx
 
Genetic algorithm
Genetic algorithmGenetic algorithm
Genetic algorithm
 

Similar a CheatSheet manejo de datos con dplyr en R

Funciones de numeros complejos
Funciones de numeros complejosFunciones de numeros complejos
Funciones de numeros complejosSandritat
 
Manual Matlab 2008
Manual Matlab 2008Manual Matlab 2008
Manual Matlab 2008AxL Sanchez
 
Bases De Datos My Sql
Bases De Datos My SqlBases De Datos My Sql
Bases De Datos My SqlArnulfo Gomez
 
012 capitulo 12 eda
012 capitulo 12   eda012 capitulo 12   eda
012 capitulo 12 edaMayra JY
 
Excel Estadistico-Funciones estadisticas
Excel Estadistico-Funciones estadisticasExcel Estadistico-Funciones estadisticas
Excel Estadistico-Funciones estadisticasjulianfabricio
 
Tt es dec03_paula1
Tt es dec03_paula1Tt es dec03_paula1
Tt es dec03_paula1Ruralticnova
 
Tt es dec03_paula1
Tt es dec03_paula1Tt es dec03_paula1
Tt es dec03_paula1Ruralticnova
 
Comandos en consola de mysql desde el portal
Comandos en consola de mysql desde el portalComandos en consola de mysql desde el portal
Comandos en consola de mysql desde el portaleavila5
 
Material Clase BDD: Diseño de una Base de Datos
Material Clase BDD: Diseño de una Base de DatosMaterial Clase BDD: Diseño de una Base de Datos
Material Clase BDD: Diseño de una Base de Datosliras loca
 

Similar a CheatSheet manejo de datos con dplyr en R (20)

Funciones de numeros complejos
Funciones de numeros complejosFunciones de numeros complejos
Funciones de numeros complejos
 
Examen Parcial 2
Examen Parcial 2Examen Parcial 2
Examen Parcial 2
 
C
CC
C
 
C (2)
C (2)C (2)
C (2)
 
Manual Matlab 2008
Manual Matlab 2008Manual Matlab 2008
Manual Matlab 2008
 
Bases De Datos My Sql
Bases De Datos My SqlBases De Datos My Sql
Bases De Datos My Sql
 
Arreglos Java
Arreglos JavaArreglos Java
Arreglos Java
 
Unidad III
Unidad IIIUnidad III
Unidad III
 
012 capitulo 12 eda
012 capitulo 12   eda012 capitulo 12   eda
012 capitulo 12 eda
 
Comandos mysql
Comandos mysqlComandos mysql
Comandos mysql
 
Excel Estadistico-Funciones estadisticas
Excel Estadistico-Funciones estadisticasExcel Estadistico-Funciones estadisticas
Excel Estadistico-Funciones estadisticas
 
Aplicaciones informaticas
Aplicaciones  informaticasAplicaciones  informaticas
Aplicaciones informaticas
 
Informatica
InformaticaInformatica
Informatica
 
Tt es dec03_paula1
Tt es dec03_paula1Tt es dec03_paula1
Tt es dec03_paula1
 
Tt es dec03_paula1
Tt es dec03_paula1Tt es dec03_paula1
Tt es dec03_paula1
 
EXCEL
EXCELEXCEL
EXCEL
 
Comandos en consola de mysql desde el portal
Comandos en consola de mysql desde el portalComandos en consola de mysql desde el portal
Comandos en consola de mysql desde el portal
 
comandos-mysql.pdf
comandos-mysql.pdfcomandos-mysql.pdf
comandos-mysql.pdf
 
Material Clase BDD: Diseño de una Base de Datos
Material Clase BDD: Diseño de una Base de DatosMaterial Clase BDD: Diseño de una Base de Datos
Material Clase BDD: Diseño de una Base de Datos
 
Funcionesdeexcel
Funcionesdeexcel Funcionesdeexcel
Funcionesdeexcel
 

Último

bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docxmarthaarroyo16
 
CAPACITACION_higiene_industrial (1).ppt...
CAPACITACION_higiene_industrial (1).ppt...CAPACITACION_higiene_industrial (1).ppt...
CAPACITACION_higiene_industrial (1).ppt...jhoecabanillas12
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptxSergiothaine2
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfEDUARDO MAMANI MAMANI
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptxccordovato
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 

Último (17)

bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
 
CAPACITACION_higiene_industrial (1).ppt...
CAPACITACION_higiene_industrial (1).ppt...CAPACITACION_higiene_industrial (1).ppt...
CAPACITACION_higiene_industrial (1).ppt...
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptx
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 

CheatSheet manejo de datos con dplyr en R

  • 1. Línea de pensamiento Elegimos la tabla de donde están los datos... ...y con ellos... ...elegimos las columnas que vamos a utilizar... ...y con ellos... ...filtramos aquellos valores que nos interesan... ...y con ellos... ...creamos nuevas columnas... ...y con ellos... ...agrupamos según nuestros intereses... ...y con ellos... resumimos los datos Código Nombre dataframe o datatable %>% select(Nombres Columnas) %>% filter(Nombre Columnas y Condición) %>% mutate(Nombre nuevo campo = Cálculo del campo) %>% group_by(Nombre Columnas por cuyos valores se quiere agrupar) %>% summarise(Nombre de las cabecerasque se mostrarán=Función quese aplicará) Ejemplo Infoadex %>% select(MARCA_DIRECTA,INS,INV_EST _IAD_EUROS,OCUPACION) %>% filter(INV_EST_IAD_EUROS>100) %>% mutate(COSTExINSERCION= (INV_EST_IAD_EUROS/INS)) %>% group_by(MARCA_DIRECTA) %>% summarise(Media_Inversion=mean(I NV_EST_IAD_EUROS),Maximo_Coste Insercion=max(COSTExINSERCION)) Manejodedatoscon CheatSheet byPedroHerreroPetisco dplyr
  • 2. Funciones más usadas para: mutate summarise first • Primer valor de un vector last • Último valor de un vector nth • N-esimo valor de un vector n() • Valores de un vector n_distinct • Valores distintos de un sector Funciones de R base Funciones de dplyr row_number • Numera las filas dense_rank • Ranking de la variable lead • Copia los valores de una columna en la nueva moviéndolos una fila hacia arriba lag • Copia los valores de una columna en la nueva moviéndolos una fila hacia abajo Operadores aritméticos • + Suma; - Resta; *  Multiplicación; ^  Exponenciación; /  División; %% Resto Operadores de comparación • ==  Igual; !=Distinto; >  Mayor que; <  Menor que; >=  Mayor o igual; <=  Menor o igual Operadores lógicos • &  Y; |  O; !  No mean • Media median • Mediana var • Varianza sd • Desviación típica sum • Suma de los valores de un vector max • Valor máximo de un vector min • Valor mínimo de un vector select contains • Selecciona las columnas que contiene una cadena de caracteres ends_with • Selecciona las columnas que terminan con una cadena de caracteres starts_with • Selecciona las columnas que empiezan con una cadena de caracteres Ejemplo de uso mutate • Datos %>% mutate(PosicionMasUno=lag(Posicion))) select • Datos %>% select(contains(“Cabecera”)) summarise • Datos %>% summarise(median(Cabecera)) Otros comandos del paquete dplyr: distinct() • Elimina las filas duplicadas slice(a:b) • Elije filas entre a y b sample_n(n) • Extrae una muestra aleatoria de n filas Select(Columna_n;everything()) • Reordena las columnas Datos%>%distinct() • Si se quieren quitar las duplicaciones en base a una columna poner Datos%>%distinct(NombreColumna) Datos%>%slice(10:20) • Selecciona las filas de la 10 a la 20 Datos%>%sample_n(4) • Extrae 4 filas aleatoriamente Datos%>%select(Columna_n,Columna_d,everything()) • Ordena las columnas poniendo primero la Columna_n, después la Columna_d y después el resto de columnas Manejodedatoscon CheatSheet byPedroHerreroPetisco dplyr