R – Ambiente de programación para
análisis de datos
data scientist lab
Ing. Giovanni Barrero Ortiz
• R, también conocido como “GNU S”, es un entorno y un
lenguaje de programación para el cálculo estadístico y la
generación de gráficos. R implementa un dialecto del
premiado lenguaje S, desarrollado en los Laboratorios Bell
por John Chambers et al. Provee un acceso relativamente
sencillo a una amplia variedad de técnicas estadísticas y
gráficas y ofrece un lenguaje de programación completo,
bien desarrollado, con el que añadir nuevas técnicas
mediante la definición de funciones.
• Entre otras características, dispone de almacenamiento y
manipulación efectiva de datos; operadores para cálculo
sobre variables indexadas (arrays) y en particular matrices;
una amplia, coherente e integrada colección de
herramientas y posibilidades gráficas para análisis de datos.
• R es un entorno en el que se han implementado muchas
técnicas estadísticas, tanto clásicas como modernas.
Algunas están incluidas en el entorno base de R y otras se
acompañan en forma de bibliotecas (packages, disponibles
en http://www.r-project.org). Actualmente, R y S son los
dos lenguajes más utilizados en investigación en estadística.
• Mostrar ayuda
Generación aleatoria de vectores
• Genera 2 vectores aleatorios normales de coordenadas x, y
• Ver objetos en el workspace
• Remueve objetos que no se necesitan mas
• Inicializa x = (1,2,,,,,,,20)
• Un vector de desviaciones estandar
• Crea dataframe de 2 columnas x , y
• Regresión lineal simple , con análisis, con y a la izquierda de la tilde se modela y dependiendo de x.
• Como ya se conoce la desviación estándar se puede hacer una regresión
• Hace las columnas en el dataframe visibles como variables
• Hace una función de regresión local no paramétrica
• lines(x, lrf$y) : Agrega la línea de la regresión
• abline(0, 1, lty=3): la línea de regresión verdadera.
• abline(coef(fm)): línea de regresión sin ponderar
• abline(coef(fm1), col = "red"): línea de regresión ponderada
• detach(): remueve el dataframe del path de búsqueda
• Diagnostico de regresión estándar para ver Heteroscedasticidad
• Limpieza
• Obtiene el data path del archivo
• Muestra el archivo
• Lee el archivo
de datos como
un data frame ,
y lo muestra.
• Hay 5
experimentos ,
columna EXPT.
• Con 20
ejecuciones
cada uno.
• Y la ultima
columna es la
velocidad de la
luz.
• Cambia EXPT y corre en factores
• Hace el data frame visible en la posición 3
• Compara los 5 experimentos.
• X es un vector de 50 , con valores en pi –pi<x<=pi. Y es el mismo
• F es una matriz cuadrada con filas y columnas indexada por x ,y con valores cos(y)=(1 + x2).
• Salva parametros de ploteo y configura region de ploteo cuadrada.
• Crea un mapa de contorno de f,
• Fa es la parte asimétrica de f. T es la transpuesta.
• Muestra contorno
• Plot de imágenes de alta densidad
• limpia
Asignación de Vectores
• Aritméticacompleja
• Dibujando argumentos complejos significa dibujar partes reales vs imaginarias. Puede ser uncirculo.
• limpia
• Se sale del programa r.
• Que objetos hay en el contexto.
• Operaciones aritmeticas
• Crea un vector y lo muestra
• Crea vector
• Crea vector con incrementos
• Acceder a valores del vector
• Suma de vectores
• Operaciones con vectores
• Vectores no numéricos
• matrices
• Acceder a elementos de matriz
• Multiplicaciónde 2 matrices
• La transpuesta
• Creación de un data frame con 3 vectores
• Acceder a datos dentro del frame
• Adición de nuevas variables
• Entrada de dataframe con estilo excel
• Cambio de nombre de columna dando doble click
• Sets de datos que ya vienen con la herramienta
• Accediendo solo a una variable
• Graficode la variable volumen
• Estadística descriptiva
• Distribuciones de probabilidad
• Ejemplo de demo(graphics)
• Grabar grafico en pdf
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r
Lenguaje r

Lenguaje r