SlideShare una empresa de Scribd logo
1 de 37
Descargar para leer sin conexión
Semana 1: Estadı́stica computacional
Mg. Carlos de Oro Aguado
cdeoroaguado@uninorte.edu.co
Universidad del Norte
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 1 / 37
Parcelación Horarios
Horarios de Clases
Estadı́stica computacional
Viernes: 3:30pm a 7:30pm.
Campus Principal: SDU8, Bloque K 5to piso
Sabado: 8:30am a 12:30pm.
Campus Principal: SDU8, Bloque K 5to piso
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 2 / 37
Parcelación Horarios
Porcentaje y semana de evaluación
Primer Parcial (23 de septiembre): 15%.
Segundo Parcial (21 de octubre): 15%.
Talleres o actividades o quices: 30%.
Trabajo Final: 40%.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 3 / 37
Parcelación Lineamientos del trabajo
1) Archivo pdf o html con el nombre ”TrabajoFinalGrupoX”
1) Tı́tulo
2) Contexto disciplinar
No tiene que ser un marco teórico con referencias.
Marco conceptual (definiciones y conceptos relacionados a las variables medidas)
Al menos un artı́culo cientı́fico indexado que exponga métodos estadı́sticos en el tema
disciplinar escogido.
3) Planteamiento de hipótesis
Deben plantearse al menos cuatro pruebas de hipótesis de análisis bivariado.
4) Métodos y Resultados
Descripción del método de recolección (encuesta, experimento, fuente secundaria, etc.)
Descripción de la muestra con las pruebas de bondad de ajuste que comprueben la
normalidad de los datos o no.
En cada resultado debe mencionarse la prueba estadı́stica empleada y su interpretación
(conclusión de la prueba + estadı́stico de prueba + p-valor), ası́ como la gráfica
descriptiva correspondiente (si aplica) debidamente etiquetada y citada en el texto.
5) Discusión
Contraste de resultados con el contexto disciplinar.
6) Conclusiones y Recomendaciones
Resumen de la discusión, resultados principales.
Recomendaciones para próximos estudios relacionados
Evaluación de la muestra
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 4 / 37
Parcelación Lineamientos del trabajo
1) Base de datos utilizada
2) R markdown con los comandos utilizados para el análisis
Presentar la preparación de los datos para el análisis (ETL) con los códigos utilizados
debidamente comentados.
Presentar el análisis exploratorio de los datos previo a las pruebas de hipótesis con los
códigos utilizados debidamente comentados.
Presentar los códigos utilizados debidamente comentados para comprobar cada
hipótesis.
3) Criterios de evaluación
1) Trabajo en grupo (50%)
a) Archivo pdf o html: [Elementos requeridos (5%), Ortografı́a (5%) Relación de gráficas
y tablas al tema (5%), Etiquetas y numeración de Tablas y Gráficas (5%),
Interpretación adecuada de resultados (30%), Precisión del contenido (5%), Normas
APA (5%)]
b) R Markdown con los comandos utilizados para el análisis: [Seguimiento de
lineamientos (10%),Códigos comentados (10%)]
c) Entrega a tiempo de los archivos correspondientes en la asignación (20%): [Pdf o
html, R Markdown,Base de datos]
2) Sustentación individual (50%)
Cada uno debe estar enterado de todos los componentes del trabajo.
Se harán preguntas frente al R Markdown sobre qué hace algunas partes de los códigos
que presenten.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 5 / 37
Parcelación Programación del curso
Temas a tratar
Introducción al lenguaje de programación en R (Temas
selectos de R, manipulación y agrupación de datos,
vizualización).
Análisis exploratorio de datos, variables aleatorias,
simulación.
Estadı́stica inferencial (Distribuciones muestrales,
intervalos de confianza).
Estadı́stica no paramétrica.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 6 / 37
Parcelación Bibliografı́a
Diapositivas de clase del profesor
Givens, G. and Hoeting, J. Computational Statistics. Wiley.
2013
Bloomfield, V. Using R for Numerical Analysis in Science and
Engineering. 2014
Chambers, J. Software for Data Analysis: Programming with R.
2008
Davison, A. and Hinkley, D. Bootstrap Methods and their
Application. 1997
Robert, C. and Casella, G. Introducing Monte Carlo Methods
with R. 2010
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 7 / 37
R y RStudio Libros
La pagina https://bookdown.org/ es un formato de libro que
puede ser creado directamente desde Rstudio.
La pagina https://www.r-bloggers.com/ nos va mostrando los
avances de proyectos que se han venido ejecutando en R.
La pagina https://www.rstudio.com/resources/cheatsheets/
nos muestra los atajos claves para un mejor desarrollo del análisis de
datos
La pagina https://stackoverflow.com/questions puedes hacer
preguntas y encontrar respuesta de personas que ya realizaron
preguntas
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 8 / 37
R y RStudio Instalación
Pasos para instalar RStudio
1 https://www.r-project.org/. version 4.0.2
2 https://www.rstudio.com/
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 9 / 37
R y RStudio ¿R?¿RStudio?
¿Qué es R?
Sistema para computación estadı́stica
y gráfica
Lenguaje de programación
Orientado a objetos
Software libre
Ampliamente utilizado
Ambiente
Datos
Funciones
Objetos
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 10 / 37
R y RStudio ¿R?¿RStudio?
¿Qué es RStudio?
Sistema para computación estadı́stica y gráfica. Además, es un entorno de desarrollo
integrado
Consola
Editor de código fuente, con evaluación directa de código
Historial
Gráficas
Administrador de espacio de trabajo
Administrador de paquetes
Consultor de ayuda
Software libre
Sistemas operativos
Desktop o Server
Windows
GNU Linux
Mac OS X
Algunos atajos de paquetes
https://rstudio.com/resources/cheatsheets/
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 11 / 37
R y RStudio RStudio
Paneles de RStudio
1 Scripts, R Markdown,
visualizador de marcos
de datos y listas.
2 Consola de R, terminal
del sistema, consola de R
Markdown.
3 Ambiente de trabajo,
historial, conexiones.
4 Explorador de archivos,
visualizador de gráficas,
administración de
paquetes, servidor de
ayuda y visor.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 12 / 37
R y RStudio RStudio
La consola. Prompt
Medio de comunicación con R.
Los simbolos son:
> Listo para evaluar un
comando o expresión.
+ Comando no
completado.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 13 / 37
R y RStudio RStudio
La consola. Salida o output
Texto: impresión de vectores,
matrices, marcos de datos y
listas. Resúmenes.
Error: ocurre cuando no hay
forma de que una función
continúe.
Warning: muestra problemas
potenciales, como cuando algunos
elementos de una función no son
válidos. No detiene la ejecución
de una función.
Message: salidas informativas.
No detienen la ejecución de una
función.
Sin salida: creación de objetos,
impresión de gráficas, escritura en
disco.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 14 / 37
R y RStudio Instalación
Instalación de paquetes
Tenemos dos formas para instalar paquetes
Desde la consola con el comando:
> install .packages(”tidyverse”)
> install .packages(c(”gapminder”,”nycflight13”,”Lahman”))
Instalar desde administrador de paquetes.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 15 / 37
R y RStudio Operaciones
Operaciones aritmeticas
R es una calculadora. Se escribe la expresión a evaluar luego Enter.
Operador Operación
+ Suma
− Resta
∗ Multiplicación
/ División
∧ Potencia
%% Modulo
Ejemplo
2 + 2
5 ∗ 4
(5 + 5)/2
28%%6
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 16 / 37
R y RStudio Objeto
Objeto
Todo lo que existe en el ambiente es
un objeto. Los objetos están carac-
terizados por su nombre y su valor o
contenido.
Atributos intrı́nsecos:
Modo:
numeric (numérico)
complex (complejo)
logical (lógico)
character (caracter)
list (lista)
function (función)
expression (expresión)
longitud
class
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 17 / 37
R y RStudio Objeto
Creación de objeto
Objetos: nombres asignados a val-
ores.
El sı́mbolo para asignar nombres
a valores es el sı́mbolo = o la
flecha: < − o − >.
R distingue entre mayúsculas y
minúsculas.
Los objetos se pueden
sobreescribir.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 18 / 37
R y RStudio Objeto
Regla
El primer caracter de un nombre
no puede ser un número.
El nombre no puede usar los
sı́mbolos especiales:−, ∗ /, ∧, !,
$, @
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 19 / 37
R y RStudio Objeto
Objetos especiales
Existen objetos declarados con valores
o funciones especı́ficas. Algunos de
estos objetos pueden ser sobreescritos,
se recomienda evitar esto.
NULL: Valor nulo.
NA: Valor ausente.
TRUE o T: Valor verdadero.
FALSE o F: Valor falso.
pi: Número pi.
letters o LETTERS: vector del
abecedario.
month.abb o month.name:
vectores de los meses.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 20 / 37
R y RStudio Introducción a funciones
Algunas funciones estadı́sticas
Función Descripción
mean(x, trim=0, na.rm=FALSE) promedio de números
sd(x) desviación estándar
median(x) mediana
quantile(x, probs) cuantiles
range(x) rango
sum(x) suma
min(x) mı́nimo
max(x) máximo
scale(x, center=TRUE, scale=TRUE) estandarizado
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 21 / 37
R y RStudio Introducción a funciones
Algunas funciones numéricas
Función Descripción
abs(x) Valor absoluto
sqrt(x) raiz cuadrada
ceiling(x) entero superior
floor(x) entero inferior
round(x, digits=n) redondeo
cos(x), sin(x), tan(x) coseno, seno, tangente
log(x) logaritmo natural
log10(x) logaritmo base 10
exp(x) exponencial
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 22 / 37
R y RStudio Introducción a funciones
Ejemplo 1
1 Se define la variable errores < − c(1.9, −2.6, 4.0, −9.5, −3.4, 7.3). Calcula
la suma de los valores absolutos redondeados de los errores de formación.
2
vec1 <− c(1.5, 2.5, 8.4, 3.7, 6.3)
vec2 <− rev(vec1)
# Encuentre el error
mean(abs(vec1), abs(vec2))
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 23 / 37
R y RStudio Vectores
Vectores
Conjunto ordenado de valores, pueden ser numéricos, alfabéticos o lógicos.
Se pueden crear con la función para concatenar valores c(), tomando como
argumentos los elementos que tendrá el vector.
La función c() puede utilizar como argumento otro vector y el resultado
será un vector.
Ejemplo 2
Ganancias de póker de lunes a viernes.
poker vector < − c(140, -50, 20, -120, 240)
Ganancias de la ruleta de lunes a viernes.
roulette vector < − c(-24, -50, 100, -350, 10)
La variable de dı́as de la semana.
days vector < − c(”Monday”, ”Tuesday”, ”Wednesday”, ”Thursday”,
”Friday”)
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 24 / 37
R y RStudio Indice
Indice
Para acceder a elementos particulares de un vector utilice los corchetes y la
posición del elemento del vector. El valorı́ndice también puede ser un vector.
Si desea eliminar del vector uno o varios valores especı́ficos utilice el
operador - antes del valor ı́ndice.
En vectores con nombres se puede indicar el elemento mediante el nombre,
escrito entre comillas dentro de los corchetes, p.ej.: x[”a”].
Ejemplo 3
Asigna los resultados de póker del miércoles a la variable
poker wednesday
Asigna los resultados de póker del martes, miércoles y jueves a la
variable poker midweek
Asigna a roulette selection vector los resultados de la ruleta desde el
martes hasta el viernes; haz uso de :.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 25 / 37
R y RStudio Subconjunto de vectores
Enteros positivos
El vector de enteros positivos devuelven elementos en las posiciones especificadas.
Ejemplo 4
x < − c(2.1,4.2,3.3,5.4)
x[c(3,1)]
order(x)
x[order(x)]
x[c(2.1,2.9)]
Enteros negativos
El vector de enteros negativos omiten elementos en las posiciones especificadas.
Ejemplo 5
x < − c(2.1,4.2,3.3,5.4)
x[-c(3,1)]
x[c(-1,2)]
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 26 / 37
R y RStudio Subconjunto de vectores
Vectores lógicos
El vector lógico devuelven elementos en las posiciones especificadas sea verdaderas.
Ejemplo 6
x < − c(2.1,4.2,3.3,5.4)
x[c(TRUE,FALSE)]
x[c(TRUE,FALSE,NA,FALSE)]
x[c(TRUE,NA)]
x[x > 3]
Vector de caracteres
si el vector tiene nombre, también puede utilizar vectores de caracteres para devolver
elementos con nombres coincidentes.
Ejemplo 7
y < − setNames(x,letters[1:4])
y[c(”a”,”b”,”d”)]
x[y[c(”a”,”a”,”a”)]
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 27 / 37
R y RStudio Nombres
Orden y nombre
Se pueden ordenar los elementos de un vector con la función sort().
Se pueden asignar nombres a los elementos de un vector con la función
names().
Ejemplo 8
Ordena el vector poker vector
Asigna los dı́as como nombres de poker vector
Asigna los dı́as como nombres de roulette vector usando la variable
days vector
Asigna a total diario cuánto has ganado/perdido en cada dı́a
Calcula los totales de la ruleta y el póker, y despues calcula el total de
la semana y asignalo a total week
Calcula el promedio de los resultados del poker de los dı́as Lunes,
Martes y Miercoles
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 28 / 37
R y RStudio Nombres
Operaciones lógicas
El resultado solo puede ser TRUE o FALSE. Se utilizan para comprobar la relación entre
un valor y otro.
Operador Operación
== Igual que
< Menor que
<= Menor o igual que
> Mayor que
>= Mayor o igual que
! = distinto de
!x no es x
x|y x o y
x&y x y y
Ejemplo 9
2 == 2
”a” <= ”b” ,”Hello” > ”Goodbye”, TRUE < FALSE
5 + 3 == 8 & 4 == 8/2
¿Qué dı́as has ganado dinero con el póker? Seleccionelos
¿Qué dı́as has perdido dinero con la ruleta? Seleccionelos
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 29 / 37
R y RStudio Generación de vectores
Generación de vectores
Se pueden generar vectores con secuencia aritmetica con las funciones seq() y rep().
seq() genera secuencias numéricas regulares. rep() replica los valores en un vector.
Funciones generadoras de números aleatorios que siguen una distribución particular.
Tienen la estructura rdist, donde r indica que genera números aleatorios (random) y
dist la distribución de probabilidad. Por ejemplo:
rnorm: Distribución normal.
rchisq: Distribución χ2.
rpois: Distribución Poisson.
Ejemplo 10
seq(1, 10)
seq(1, 10, by = 2)
rep(1:4, 2)
rep(c(”x”, ”y”, ”z”), 3)
rnorm(n,mean=mu,sd=sigma)
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 30 / 37
R y RStudio Matrices
Matrices
Son arreglos con dos dimensiones, filas y columnas.
La función para crear matrices es matrix().
Solo pueden estar compuestos por un tipo de datos.
El número de filas y columnas se puede obtener con la función dim().
Los nombres de filas y columnas se pueden definir con la función dimnames().
Ejemplo 11
A < − matrix(1:9, nrow = 3,byrow=TRUE)
dim(A)
B < − matrix(c(1,2,3,-1,2,-5,8,3,2), nrow = 3,byrow=TRUE)
dim(B)
D < − matrix(c(1,2,3,-1,2,-5,8,3,2), nrow = 3,byrow=TRUE)
dim(D)
3*D, 2*A+D, A+D
t(A), t(B), t(A)+3*t(D), AD, AC
det(A), si es distinto de cero calcula la inversa. Use ginv() de la libreria MASS
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 31 / 37
R y RStudio Matrices
Tarea: Ejercicio 1. Franquicia de Star Wars
Analizarás las cifras de taquilla de la franquicia de Star Wars. En el editor se definen tres
vectores de las 3 primeras peliculas de Star Wars, las componentes indica el ingreso de las
taquillas de EEUU y por fuera de EEUU.
new hope < − c(460.998,314.4)
empire strikes < − c(290.475,247,900)
return jedi < − c(309.306,165.8)
Responda
1 Construye una matriz llamada star wars matrix de 3 × 3 que combine los 3 vectores.
2 Renombra las filas (”US”,”non-US”) y columas(”A New Hope”, ”The empire Strikes
Back”,”Return of the Jedi”). Use rownames y colnames
3 Calcule las cifras de la taquilla mundial de las tres pelı́culas y póngalas en el vector
llamado worldwide vector
4 Añade worldwide vector como una nueva columna a la matriz star wars matrix y al
resultado le asignas el nombre all wars matrix.
5 Selecciona los ingresos no estadosunidenses de las peliculas y almacenalas como
non us all. Además, calcule el promedio
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 32 / 37
R y RStudio Factores
Factores
Son vectores que corresponden a variables categóricas. Incluye los niveles o categorı́as
que presenta la variable.
Se pueden especificar etiquetas para los niveles.También, si el factor es ordenado,
cuando la variable es categórica ordinal.
Ejemplo 12
sex vector < − c(”Male”,”female”,”female”,”Male”,”Male”). Convertir a factor
y asignelo a factor sex vector
temperature vector < − c(”High”, ”Low”, ”High”,”Low”, ”Medium”).
Convertir a factor, ordenalo y asignelo a factor temperature vector
Realiza un resumen de la variable sex vector y factor sex vector
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 33 / 37
R y RStudio Marco de datos (data frame)
Marco de datos
Son vectores (columnas) de la misma longitud de estructura tabular con filas y columnas,
dos dimensiones.
Las columnas pueden tener distintos modos pero los elementos de una columna solo tendrán
un modo. Si un vector es de longitud menor a otro, este será reciclado hasta alcanzar la
longitud del vector con mayor longitud.
Ejemplo 13
Escriba mtcars
Use las funciones head(), tail(), str(), summary()
¿Cuál es el error de mtcars[mtcars$cyl<= 5]?
¿Cuál es el error de mtcars[mtcars$cyl== 5 | 6,]?
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 34 / 37
R y RStudio Marco de datos (data frame)
Tarea: Ejercicio 2 del sistema solar
Sistema solar:
name < − c(”Mercury”, ”Venus”, ”Earth”, ”Mars”, ”Jupiter”, ”Saturn”, ”Uranus”,
”Neptune”)
type < − c(”Terrestrial planet”, ”Terrestrial planet”, ”Terrestrial planet”, ”Terrestrial
planet”, ”Gas giant”, ”Gas giant”, ”Gas giant”, ”Gas giant”)
diameter < − c(0.382, 0.949, 1, 0.532, 11.209, 9.449, 4.007, 3.883)
rotation < − c(58.64, -243.02, 1, 1.03, 0.41, 0.43, -0.72, 0.67)
rings < − c(FALSE, FALSE, FALSE, FALSE, TRUE, TRUE, TRUE, TRUE)
Crea el marco de datos (data.frame), asignelo a planets df y usa str() para ver la
estructura.
Selecciona el diámetro del planeta Mercurio y todos los datos del planeta Marte.
Seleccione e imprima los 5 primeros valores del ”diámetro” de planets df.
Escriba 3 formas de seleccionar la variable rings de planets df y asignelo a rings vector.
Selecciona todos los planetas que tienen anillos. Use rings vector
Utilice subset() en planets df para seleccionar los planetas que tienen un diámetro
menor que la Tierra. Como la variable diámetro es una medida relativa del diámetro
del planeta con respecto al de la Tierra, su condición es diámetro < 1.
Ordena de menor a mayor todos los planetas por el diametro.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 35 / 37
R y RStudio Lista
Lista
Una lista funciona de la misma manera que el subconjunto de un vector. Una lista en
R permite reunir una variedad de objetos bajo un mismo nombre (es decir, el nombre
de la lista) de forma ordenada. Estos objetos pueden ser matrices, vectores, marcos
de datos, incluso otras listas, etc. Ni siquiera es necesario que estos objetos estén
relacionados entre sı́ de alguna manera.
Es necesario usar [[]] para acceder a los subconjuntos dentro de ella.
Ejemplo 13
my vector < − 1:10
my matrix < − matrix(1:9, ncol = 3)
my df < − mtcars[1:10,]
my list < − list(my vector,my matrix,my df)
my list < − list(vec=my vector,mat=my matrix,df=my df)
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 36 / 37
R y RStudio Lista
Tarea: Ejercicio 3. Cine
Siendo un gran aficionado al cine, decides empezar a almacenar información sobre buenas
pelı́culas, con la ayuda de listas.
Crea el código en el editor y asignala a sp man no way home list; contiene tres elementos
moviename: una cadena de caracteres con el tı́tulo de la pelı́cula (almacenada en mov)
actors: un vector con los nombres de los actores principales (almacenado en act). Solo
5 actores
reviews: un marco de datos que contiene algunas crı́ticas (almacenado en rev). Solo 3
columnas (scores, sources, comments) y 3 filas
No olvides nombrar los componentes de la lista como corresponde (los nombres son movie-
name, actors y reviews).
Seleccione de sp man no way home list el vector que representa a los actores.
Simplemente imprime este vector.
Selecciona de sp man no way home list el segundo elemento del vector que representa
a los actores. Haz una impresión como la anterior.
Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 37 / 37

Más contenido relacionado

Similar a Sem_1_Est_Comp.pdf

Unidad 1 algoritmos y programas
Unidad 1 algoritmos y programasUnidad 1 algoritmos y programas
Unidad 1 algoritmos y programasRoberth Camana
 
ESTADISTICA-PROYECTO FINAL.pdf
ESTADISTICA-PROYECTO FINAL.pdfESTADISTICA-PROYECTO FINAL.pdf
ESTADISTICA-PROYECTO FINAL.pdfDavidUmboFernandez
 
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...JAVIER SOLIS NOYOLA
 
Rc jose franqueller_garcia
Rc jose franqueller_garciaRc jose franqueller_garcia
Rc jose franqueller_garciafrankgatom
 
Análisis de datos con R - Techcivica
Análisis de datos con R - TechcivicaAnálisis de datos con R - Techcivica
Análisis de datos con R - TechcivicaSocialTIC
 
Curso R avanzado - Anaytic Ideas Services
Curso R avanzado - Anaytic Ideas ServicesCurso R avanzado - Anaytic Ideas Services
Curso R avanzado - Anaytic Ideas ServicesAnalytic Ideas Services
 
UTPL-PROGRAMACIÓN AVANZADA-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-PROGRAMACIÓN AVANZADA-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)UTPL-PROGRAMACIÓN AVANZADA-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-PROGRAMACIÓN AVANZADA-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)Videoconferencias UTPL
 
Gestión y Análisis de Datos para las Ciencias Económicas con Python y R
Gestión y Análisis de Datos para las Ciencias Económicas con Python y RGestión y Análisis de Datos para las Ciencias Económicas con Python y R
Gestión y Análisis de Datos para las Ciencias Económicas con Python y RFrancisco Palm
 
R Services con SQL Server
R Services con SQL ServerR Services con SQL Server
R Services con SQL ServerdbLearner
 
Ponencia en el Congreso Internacional de Ingenieria UCV 2010
Ponencia en el Congreso Internacional de Ingenieria UCV 2010Ponencia en el Congreso Internacional de Ingenieria UCV 2010
Ponencia en el Congreso Internacional de Ingenieria UCV 2010Janett Julca Flores
 
Abstracción y Encapsulación de en la programación Orientada a objetos
Abstracción y Encapsulación de en la programación Orientada a objetosAbstracción y Encapsulación de en la programación Orientada a objetos
Abstracción y Encapsulación de en la programación Orientada a objetosJoseEstebanTelloEstr
 
Encuadre de Estructura de Datos
Encuadre de Estructura de DatosEncuadre de Estructura de Datos
Encuadre de Estructura de Datosrezzaca
 
Tema 1 2_poo
Tema 1 2_pooTema 1 2_poo
Tema 1 2_poodemon_628
 
IC - Estructuras de Secuencia - Ejercicios
IC - Estructuras de Secuencia - EjerciciosIC - Estructuras de Secuencia - Ejercicios
IC - Estructuras de Secuencia - Ejercicioscbertolotti
 

Similar a Sem_1_Est_Comp.pdf (20)

clases de herramientas lorenita
clases de herramientas lorenitaclases de herramientas lorenita
clases de herramientas lorenita
 
Unidad 1 algoritmos y programas
Unidad 1 algoritmos y programasUnidad 1 algoritmos y programas
Unidad 1 algoritmos y programas
 
ESTADISTICA-PROYECTO FINAL.pdf
ESTADISTICA-PROYECTO FINAL.pdfESTADISTICA-PROYECTO FINAL.pdf
ESTADISTICA-PROYECTO FINAL.pdf
 
Visualfoxpro
VisualfoxproVisualfoxpro
Visualfoxpro
 
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
 
Encuadre Del Curso Intersemestral 2009-5
Encuadre Del Curso Intersemestral 2009-5Encuadre Del Curso Intersemestral 2009-5
Encuadre Del Curso Intersemestral 2009-5
 
Rc jose franqueller_garcia
Rc jose franqueller_garciaRc jose franqueller_garcia
Rc jose franqueller_garcia
 
Análisis de datos con R - Techcivica
Análisis de datos con R - TechcivicaAnálisis de datos con R - Techcivica
Análisis de datos con R - Techcivica
 
R Introducción
R IntroducciónR Introducción
R Introducción
 
Curso R avanzado - Anaytic Ideas Services
Curso R avanzado - Anaytic Ideas ServicesCurso R avanzado - Anaytic Ideas Services
Curso R avanzado - Anaytic Ideas Services
 
UTPL-PROGRAMACIÓN AVANZADA-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-PROGRAMACIÓN AVANZADA-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)UTPL-PROGRAMACIÓN AVANZADA-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-PROGRAMACIÓN AVANZADA-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
 
Articulo en r
Articulo en rArticulo en r
Articulo en r
 
Gestión y Análisis de Datos para las Ciencias Económicas con Python y R
Gestión y Análisis de Datos para las Ciencias Económicas con Python y RGestión y Análisis de Datos para las Ciencias Económicas con Python y R
Gestión y Análisis de Datos para las Ciencias Económicas con Python y R
 
R Services con SQL Server
R Services con SQL ServerR Services con SQL Server
R Services con SQL Server
 
Ponencia en el Congreso Internacional de Ingenieria UCV 2010
Ponencia en el Congreso Internacional de Ingenieria UCV 2010Ponencia en el Congreso Internacional de Ingenieria UCV 2010
Ponencia en el Congreso Internacional de Ingenieria UCV 2010
 
Abstracción y Encapsulación de en la programación Orientada a objetos
Abstracción y Encapsulación de en la programación Orientada a objetosAbstracción y Encapsulación de en la programación Orientada a objetos
Abstracción y Encapsulación de en la programación Orientada a objetos
 
Encuadre de Estructura de Datos
Encuadre de Estructura de DatosEncuadre de Estructura de Datos
Encuadre de Estructura de Datos
 
Tema 1 2_poo
Tema 1 2_pooTema 1 2_poo
Tema 1 2_poo
 
Rc luis araque
Rc luis araqueRc luis araque
Rc luis araque
 
IC - Estructuras de Secuencia - Ejercicios
IC - Estructuras de Secuencia - EjerciciosIC - Estructuras de Secuencia - Ejercicios
IC - Estructuras de Secuencia - Ejercicios
 

Último

LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...JAVIER SOLIS NOYOLA
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALEDUCCUniversidadCatl
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxYeseniaRivera50
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas123yudy
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptxJunkotantik
 
Análisis de la Implementación de los Servicios Locales de Educación Pública p...
Análisis de la Implementación de los Servicios Locales de Educación Pública p...Análisis de la Implementación de los Servicios Locales de Educación Pública p...
Análisis de la Implementación de los Servicios Locales de Educación Pública p...Baker Publishing Company
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxMartín Ramírez
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfDannyTola1
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIAAbelardoVelaAlbrecht1
 

Último (20)

TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
 
Earth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversaryEarth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversary
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptx
 
Análisis de la Implementación de los Servicios Locales de Educación Pública p...
Análisis de la Implementación de los Servicios Locales de Educación Pública p...Análisis de la Implementación de los Servicios Locales de Educación Pública p...
Análisis de la Implementación de los Servicios Locales de Educación Pública p...
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdf
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
 

Sem_1_Est_Comp.pdf

  • 1. Semana 1: Estadı́stica computacional Mg. Carlos de Oro Aguado cdeoroaguado@uninorte.edu.co Universidad del Norte Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 1 / 37
  • 2. Parcelación Horarios Horarios de Clases Estadı́stica computacional Viernes: 3:30pm a 7:30pm. Campus Principal: SDU8, Bloque K 5to piso Sabado: 8:30am a 12:30pm. Campus Principal: SDU8, Bloque K 5to piso Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 2 / 37
  • 3. Parcelación Horarios Porcentaje y semana de evaluación Primer Parcial (23 de septiembre): 15%. Segundo Parcial (21 de octubre): 15%. Talleres o actividades o quices: 30%. Trabajo Final: 40%. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 3 / 37
  • 4. Parcelación Lineamientos del trabajo 1) Archivo pdf o html con el nombre ”TrabajoFinalGrupoX” 1) Tı́tulo 2) Contexto disciplinar No tiene que ser un marco teórico con referencias. Marco conceptual (definiciones y conceptos relacionados a las variables medidas) Al menos un artı́culo cientı́fico indexado que exponga métodos estadı́sticos en el tema disciplinar escogido. 3) Planteamiento de hipótesis Deben plantearse al menos cuatro pruebas de hipótesis de análisis bivariado. 4) Métodos y Resultados Descripción del método de recolección (encuesta, experimento, fuente secundaria, etc.) Descripción de la muestra con las pruebas de bondad de ajuste que comprueben la normalidad de los datos o no. En cada resultado debe mencionarse la prueba estadı́stica empleada y su interpretación (conclusión de la prueba + estadı́stico de prueba + p-valor), ası́ como la gráfica descriptiva correspondiente (si aplica) debidamente etiquetada y citada en el texto. 5) Discusión Contraste de resultados con el contexto disciplinar. 6) Conclusiones y Recomendaciones Resumen de la discusión, resultados principales. Recomendaciones para próximos estudios relacionados Evaluación de la muestra Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 4 / 37
  • 5. Parcelación Lineamientos del trabajo 1) Base de datos utilizada 2) R markdown con los comandos utilizados para el análisis Presentar la preparación de los datos para el análisis (ETL) con los códigos utilizados debidamente comentados. Presentar el análisis exploratorio de los datos previo a las pruebas de hipótesis con los códigos utilizados debidamente comentados. Presentar los códigos utilizados debidamente comentados para comprobar cada hipótesis. 3) Criterios de evaluación 1) Trabajo en grupo (50%) a) Archivo pdf o html: [Elementos requeridos (5%), Ortografı́a (5%) Relación de gráficas y tablas al tema (5%), Etiquetas y numeración de Tablas y Gráficas (5%), Interpretación adecuada de resultados (30%), Precisión del contenido (5%), Normas APA (5%)] b) R Markdown con los comandos utilizados para el análisis: [Seguimiento de lineamientos (10%),Códigos comentados (10%)] c) Entrega a tiempo de los archivos correspondientes en la asignación (20%): [Pdf o html, R Markdown,Base de datos] 2) Sustentación individual (50%) Cada uno debe estar enterado de todos los componentes del trabajo. Se harán preguntas frente al R Markdown sobre qué hace algunas partes de los códigos que presenten. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 5 / 37
  • 6. Parcelación Programación del curso Temas a tratar Introducción al lenguaje de programación en R (Temas selectos de R, manipulación y agrupación de datos, vizualización). Análisis exploratorio de datos, variables aleatorias, simulación. Estadı́stica inferencial (Distribuciones muestrales, intervalos de confianza). Estadı́stica no paramétrica. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 6 / 37
  • 7. Parcelación Bibliografı́a Diapositivas de clase del profesor Givens, G. and Hoeting, J. Computational Statistics. Wiley. 2013 Bloomfield, V. Using R for Numerical Analysis in Science and Engineering. 2014 Chambers, J. Software for Data Analysis: Programming with R. 2008 Davison, A. and Hinkley, D. Bootstrap Methods and their Application. 1997 Robert, C. and Casella, G. Introducing Monte Carlo Methods with R. 2010 Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 7 / 37
  • 8. R y RStudio Libros La pagina https://bookdown.org/ es un formato de libro que puede ser creado directamente desde Rstudio. La pagina https://www.r-bloggers.com/ nos va mostrando los avances de proyectos que se han venido ejecutando en R. La pagina https://www.rstudio.com/resources/cheatsheets/ nos muestra los atajos claves para un mejor desarrollo del análisis de datos La pagina https://stackoverflow.com/questions puedes hacer preguntas y encontrar respuesta de personas que ya realizaron preguntas Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 8 / 37
  • 9. R y RStudio Instalación Pasos para instalar RStudio 1 https://www.r-project.org/. version 4.0.2 2 https://www.rstudio.com/ Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 9 / 37
  • 10. R y RStudio ¿R?¿RStudio? ¿Qué es R? Sistema para computación estadı́stica y gráfica Lenguaje de programación Orientado a objetos Software libre Ampliamente utilizado Ambiente Datos Funciones Objetos Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 10 / 37
  • 11. R y RStudio ¿R?¿RStudio? ¿Qué es RStudio? Sistema para computación estadı́stica y gráfica. Además, es un entorno de desarrollo integrado Consola Editor de código fuente, con evaluación directa de código Historial Gráficas Administrador de espacio de trabajo Administrador de paquetes Consultor de ayuda Software libre Sistemas operativos Desktop o Server Windows GNU Linux Mac OS X Algunos atajos de paquetes https://rstudio.com/resources/cheatsheets/ Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 11 / 37
  • 12. R y RStudio RStudio Paneles de RStudio 1 Scripts, R Markdown, visualizador de marcos de datos y listas. 2 Consola de R, terminal del sistema, consola de R Markdown. 3 Ambiente de trabajo, historial, conexiones. 4 Explorador de archivos, visualizador de gráficas, administración de paquetes, servidor de ayuda y visor. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 12 / 37
  • 13. R y RStudio RStudio La consola. Prompt Medio de comunicación con R. Los simbolos son: > Listo para evaluar un comando o expresión. + Comando no completado. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 13 / 37
  • 14. R y RStudio RStudio La consola. Salida o output Texto: impresión de vectores, matrices, marcos de datos y listas. Resúmenes. Error: ocurre cuando no hay forma de que una función continúe. Warning: muestra problemas potenciales, como cuando algunos elementos de una función no son válidos. No detiene la ejecución de una función. Message: salidas informativas. No detienen la ejecución de una función. Sin salida: creación de objetos, impresión de gráficas, escritura en disco. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 14 / 37
  • 15. R y RStudio Instalación Instalación de paquetes Tenemos dos formas para instalar paquetes Desde la consola con el comando: > install .packages(”tidyverse”) > install .packages(c(”gapminder”,”nycflight13”,”Lahman”)) Instalar desde administrador de paquetes. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 15 / 37
  • 16. R y RStudio Operaciones Operaciones aritmeticas R es una calculadora. Se escribe la expresión a evaluar luego Enter. Operador Operación + Suma − Resta ∗ Multiplicación / División ∧ Potencia %% Modulo Ejemplo 2 + 2 5 ∗ 4 (5 + 5)/2 28%%6 Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 16 / 37
  • 17. R y RStudio Objeto Objeto Todo lo que existe en el ambiente es un objeto. Los objetos están carac- terizados por su nombre y su valor o contenido. Atributos intrı́nsecos: Modo: numeric (numérico) complex (complejo) logical (lógico) character (caracter) list (lista) function (función) expression (expresión) longitud class Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 17 / 37
  • 18. R y RStudio Objeto Creación de objeto Objetos: nombres asignados a val- ores. El sı́mbolo para asignar nombres a valores es el sı́mbolo = o la flecha: < − o − >. R distingue entre mayúsculas y minúsculas. Los objetos se pueden sobreescribir. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 18 / 37
  • 19. R y RStudio Objeto Regla El primer caracter de un nombre no puede ser un número. El nombre no puede usar los sı́mbolos especiales:−, ∗ /, ∧, !, $, @ Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 19 / 37
  • 20. R y RStudio Objeto Objetos especiales Existen objetos declarados con valores o funciones especı́ficas. Algunos de estos objetos pueden ser sobreescritos, se recomienda evitar esto. NULL: Valor nulo. NA: Valor ausente. TRUE o T: Valor verdadero. FALSE o F: Valor falso. pi: Número pi. letters o LETTERS: vector del abecedario. month.abb o month.name: vectores de los meses. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 20 / 37
  • 21. R y RStudio Introducción a funciones Algunas funciones estadı́sticas Función Descripción mean(x, trim=0, na.rm=FALSE) promedio de números sd(x) desviación estándar median(x) mediana quantile(x, probs) cuantiles range(x) rango sum(x) suma min(x) mı́nimo max(x) máximo scale(x, center=TRUE, scale=TRUE) estandarizado Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 21 / 37
  • 22. R y RStudio Introducción a funciones Algunas funciones numéricas Función Descripción abs(x) Valor absoluto sqrt(x) raiz cuadrada ceiling(x) entero superior floor(x) entero inferior round(x, digits=n) redondeo cos(x), sin(x), tan(x) coseno, seno, tangente log(x) logaritmo natural log10(x) logaritmo base 10 exp(x) exponencial Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 22 / 37
  • 23. R y RStudio Introducción a funciones Ejemplo 1 1 Se define la variable errores < − c(1.9, −2.6, 4.0, −9.5, −3.4, 7.3). Calcula la suma de los valores absolutos redondeados de los errores de formación. 2 vec1 <− c(1.5, 2.5, 8.4, 3.7, 6.3) vec2 <− rev(vec1) # Encuentre el error mean(abs(vec1), abs(vec2)) Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 23 / 37
  • 24. R y RStudio Vectores Vectores Conjunto ordenado de valores, pueden ser numéricos, alfabéticos o lógicos. Se pueden crear con la función para concatenar valores c(), tomando como argumentos los elementos que tendrá el vector. La función c() puede utilizar como argumento otro vector y el resultado será un vector. Ejemplo 2 Ganancias de póker de lunes a viernes. poker vector < − c(140, -50, 20, -120, 240) Ganancias de la ruleta de lunes a viernes. roulette vector < − c(-24, -50, 100, -350, 10) La variable de dı́as de la semana. days vector < − c(”Monday”, ”Tuesday”, ”Wednesday”, ”Thursday”, ”Friday”) Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 24 / 37
  • 25. R y RStudio Indice Indice Para acceder a elementos particulares de un vector utilice los corchetes y la posición del elemento del vector. El valorı́ndice también puede ser un vector. Si desea eliminar del vector uno o varios valores especı́ficos utilice el operador - antes del valor ı́ndice. En vectores con nombres se puede indicar el elemento mediante el nombre, escrito entre comillas dentro de los corchetes, p.ej.: x[”a”]. Ejemplo 3 Asigna los resultados de póker del miércoles a la variable poker wednesday Asigna los resultados de póker del martes, miércoles y jueves a la variable poker midweek Asigna a roulette selection vector los resultados de la ruleta desde el martes hasta el viernes; haz uso de :. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 25 / 37
  • 26. R y RStudio Subconjunto de vectores Enteros positivos El vector de enteros positivos devuelven elementos en las posiciones especificadas. Ejemplo 4 x < − c(2.1,4.2,3.3,5.4) x[c(3,1)] order(x) x[order(x)] x[c(2.1,2.9)] Enteros negativos El vector de enteros negativos omiten elementos en las posiciones especificadas. Ejemplo 5 x < − c(2.1,4.2,3.3,5.4) x[-c(3,1)] x[c(-1,2)] Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 26 / 37
  • 27. R y RStudio Subconjunto de vectores Vectores lógicos El vector lógico devuelven elementos en las posiciones especificadas sea verdaderas. Ejemplo 6 x < − c(2.1,4.2,3.3,5.4) x[c(TRUE,FALSE)] x[c(TRUE,FALSE,NA,FALSE)] x[c(TRUE,NA)] x[x > 3] Vector de caracteres si el vector tiene nombre, también puede utilizar vectores de caracteres para devolver elementos con nombres coincidentes. Ejemplo 7 y < − setNames(x,letters[1:4]) y[c(”a”,”b”,”d”)] x[y[c(”a”,”a”,”a”)] Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 27 / 37
  • 28. R y RStudio Nombres Orden y nombre Se pueden ordenar los elementos de un vector con la función sort(). Se pueden asignar nombres a los elementos de un vector con la función names(). Ejemplo 8 Ordena el vector poker vector Asigna los dı́as como nombres de poker vector Asigna los dı́as como nombres de roulette vector usando la variable days vector Asigna a total diario cuánto has ganado/perdido en cada dı́a Calcula los totales de la ruleta y el póker, y despues calcula el total de la semana y asignalo a total week Calcula el promedio de los resultados del poker de los dı́as Lunes, Martes y Miercoles Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 28 / 37
  • 29. R y RStudio Nombres Operaciones lógicas El resultado solo puede ser TRUE o FALSE. Se utilizan para comprobar la relación entre un valor y otro. Operador Operación == Igual que < Menor que <= Menor o igual que > Mayor que >= Mayor o igual que ! = distinto de !x no es x x|y x o y x&y x y y Ejemplo 9 2 == 2 ”a” <= ”b” ,”Hello” > ”Goodbye”, TRUE < FALSE 5 + 3 == 8 & 4 == 8/2 ¿Qué dı́as has ganado dinero con el póker? Seleccionelos ¿Qué dı́as has perdido dinero con la ruleta? Seleccionelos Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 29 / 37
  • 30. R y RStudio Generación de vectores Generación de vectores Se pueden generar vectores con secuencia aritmetica con las funciones seq() y rep(). seq() genera secuencias numéricas regulares. rep() replica los valores en un vector. Funciones generadoras de números aleatorios que siguen una distribución particular. Tienen la estructura rdist, donde r indica que genera números aleatorios (random) y dist la distribución de probabilidad. Por ejemplo: rnorm: Distribución normal. rchisq: Distribución χ2. rpois: Distribución Poisson. Ejemplo 10 seq(1, 10) seq(1, 10, by = 2) rep(1:4, 2) rep(c(”x”, ”y”, ”z”), 3) rnorm(n,mean=mu,sd=sigma) Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 30 / 37
  • 31. R y RStudio Matrices Matrices Son arreglos con dos dimensiones, filas y columnas. La función para crear matrices es matrix(). Solo pueden estar compuestos por un tipo de datos. El número de filas y columnas se puede obtener con la función dim(). Los nombres de filas y columnas se pueden definir con la función dimnames(). Ejemplo 11 A < − matrix(1:9, nrow = 3,byrow=TRUE) dim(A) B < − matrix(c(1,2,3,-1,2,-5,8,3,2), nrow = 3,byrow=TRUE) dim(B) D < − matrix(c(1,2,3,-1,2,-5,8,3,2), nrow = 3,byrow=TRUE) dim(D) 3*D, 2*A+D, A+D t(A), t(B), t(A)+3*t(D), AD, AC det(A), si es distinto de cero calcula la inversa. Use ginv() de la libreria MASS Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 31 / 37
  • 32. R y RStudio Matrices Tarea: Ejercicio 1. Franquicia de Star Wars Analizarás las cifras de taquilla de la franquicia de Star Wars. En el editor se definen tres vectores de las 3 primeras peliculas de Star Wars, las componentes indica el ingreso de las taquillas de EEUU y por fuera de EEUU. new hope < − c(460.998,314.4) empire strikes < − c(290.475,247,900) return jedi < − c(309.306,165.8) Responda 1 Construye una matriz llamada star wars matrix de 3 × 3 que combine los 3 vectores. 2 Renombra las filas (”US”,”non-US”) y columas(”A New Hope”, ”The empire Strikes Back”,”Return of the Jedi”). Use rownames y colnames 3 Calcule las cifras de la taquilla mundial de las tres pelı́culas y póngalas en el vector llamado worldwide vector 4 Añade worldwide vector como una nueva columna a la matriz star wars matrix y al resultado le asignas el nombre all wars matrix. 5 Selecciona los ingresos no estadosunidenses de las peliculas y almacenalas como non us all. Además, calcule el promedio Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 32 / 37
  • 33. R y RStudio Factores Factores Son vectores que corresponden a variables categóricas. Incluye los niveles o categorı́as que presenta la variable. Se pueden especificar etiquetas para los niveles.También, si el factor es ordenado, cuando la variable es categórica ordinal. Ejemplo 12 sex vector < − c(”Male”,”female”,”female”,”Male”,”Male”). Convertir a factor y asignelo a factor sex vector temperature vector < − c(”High”, ”Low”, ”High”,”Low”, ”Medium”). Convertir a factor, ordenalo y asignelo a factor temperature vector Realiza un resumen de la variable sex vector y factor sex vector Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 33 / 37
  • 34. R y RStudio Marco de datos (data frame) Marco de datos Son vectores (columnas) de la misma longitud de estructura tabular con filas y columnas, dos dimensiones. Las columnas pueden tener distintos modos pero los elementos de una columna solo tendrán un modo. Si un vector es de longitud menor a otro, este será reciclado hasta alcanzar la longitud del vector con mayor longitud. Ejemplo 13 Escriba mtcars Use las funciones head(), tail(), str(), summary() ¿Cuál es el error de mtcars[mtcars$cyl<= 5]? ¿Cuál es el error de mtcars[mtcars$cyl== 5 | 6,]? Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 34 / 37
  • 35. R y RStudio Marco de datos (data frame) Tarea: Ejercicio 2 del sistema solar Sistema solar: name < − c(”Mercury”, ”Venus”, ”Earth”, ”Mars”, ”Jupiter”, ”Saturn”, ”Uranus”, ”Neptune”) type < − c(”Terrestrial planet”, ”Terrestrial planet”, ”Terrestrial planet”, ”Terrestrial planet”, ”Gas giant”, ”Gas giant”, ”Gas giant”, ”Gas giant”) diameter < − c(0.382, 0.949, 1, 0.532, 11.209, 9.449, 4.007, 3.883) rotation < − c(58.64, -243.02, 1, 1.03, 0.41, 0.43, -0.72, 0.67) rings < − c(FALSE, FALSE, FALSE, FALSE, TRUE, TRUE, TRUE, TRUE) Crea el marco de datos (data.frame), asignelo a planets df y usa str() para ver la estructura. Selecciona el diámetro del planeta Mercurio y todos los datos del planeta Marte. Seleccione e imprima los 5 primeros valores del ”diámetro” de planets df. Escriba 3 formas de seleccionar la variable rings de planets df y asignelo a rings vector. Selecciona todos los planetas que tienen anillos. Use rings vector Utilice subset() en planets df para seleccionar los planetas que tienen un diámetro menor que la Tierra. Como la variable diámetro es una medida relativa del diámetro del planeta con respecto al de la Tierra, su condición es diámetro < 1. Ordena de menor a mayor todos los planetas por el diametro. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 35 / 37
  • 36. R y RStudio Lista Lista Una lista funciona de la misma manera que el subconjunto de un vector. Una lista en R permite reunir una variedad de objetos bajo un mismo nombre (es decir, el nombre de la lista) de forma ordenada. Estos objetos pueden ser matrices, vectores, marcos de datos, incluso otras listas, etc. Ni siquiera es necesario que estos objetos estén relacionados entre sı́ de alguna manera. Es necesario usar [[]] para acceder a los subconjuntos dentro de ella. Ejemplo 13 my vector < − 1:10 my matrix < − matrix(1:9, ncol = 3) my df < − mtcars[1:10,] my list < − list(my vector,my matrix,my df) my list < − list(vec=my vector,mat=my matrix,df=my df) Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 36 / 37
  • 37. R y RStudio Lista Tarea: Ejercicio 3. Cine Siendo un gran aficionado al cine, decides empezar a almacenar información sobre buenas pelı́culas, con la ayuda de listas. Crea el código en el editor y asignala a sp man no way home list; contiene tres elementos moviename: una cadena de caracteres con el tı́tulo de la pelı́cula (almacenada en mov) actors: un vector con los nombres de los actores principales (almacenado en act). Solo 5 actores reviews: un marco de datos que contiene algunas crı́ticas (almacenado en rev). Solo 3 columnas (scores, sources, comments) y 3 filas No olvides nombrar los componentes de la lista como corresponde (los nombres son movie- name, actors y reviews). Seleccione de sp man no way home list el vector que representa a los actores. Simplemente imprime este vector. Selecciona de sp man no way home list el segundo elemento del vector que representa a los actores. Haz una impresión como la anterior. Mg. Carlos de Oro Aguado (UniNorte) cdeoroaguado@uninorte.edu.co 37 / 37