1. ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO
FACULTADCIENCIAS
ESCUELA DE FÍSICA Y MATEMÁTICA
Lenguajes de Programación Orientados a la
Estadística R.
Nombre: Almache Mayra
Carrera: Estadística e Informática
Fecha: 20/01/2015
2. INTRODUCCIÓN
El presente trabajo vamos a analizar el
lenguaje de programación orientados a la
Estadística r que es un conjunto de
programas integrados para manejo de
datos, simulaciones, cálculos y realización
de gráficos.
Cuando usamos una computadora,
estamos intentado resolver un problema.
Puede ser un problema de negocios, que
involucra ganancias y perdidas; un
problema científico que emplea modelos
3. OBJETIVOS
GENERAL:
El objetivo fundamental, que tenemos como
estudiantes es ser capaces de manipular y generar
datos con facilidad y usar adecuadamente R para
efectuar análisis de datos y generación de gráficos.
ESPECÍFICOS:
• Conocer una breve historia del Lenguaje r, así
como sus principales características.
• Observar y comprender el funcionamiento de sus
códigos para la realización de ejercicios.
4. LENGUAJE DE PROGRAMACIÓN R
R es un lenguaje de programación
especialmente orientado al análisis estadístico y
a la representación gráfica de los resultados
obtenidos.
Es un proyecto GNU. Los usuarios son libres
de modificarlo y extenderlo
Se trata de un lenguaje basado en comandos,
en lugar de pinchar y arrastrar iconos o menús
con el ratón se escriben comandos o
instrucciones que son ejecutados.
Una sucesión de instrucciones o comandos de
R que implementa un flujo de trabajo para
realizar una tarea se denomina script o guión
R.
5. HISTORIA.
Fue desarrollado inicialmente
por Robert Gentleman y Ross
Ihaka del Departamento de
Estadística de la Universidad
de Auckland en 1993.
Su desarrollo actual es
responsabilidad del R
Development Core Team.
HITOS EN EL
DESARROLLO DE
R
Versión 0.16: Es la última
versión alfa desarrollada
esencialmente por Ihaka y
Gentleman, que incluye gran
parte de las características
descritas en el "White Book".
Versión 0.49 (23 de abril de
1997): Es la versión más
antigua de la que se conserva
el código (que todavía compila
en algunas plataformas UNIX).
Poco después aparecieron las
versiones alfa para Windows y
Mac OS.
6. .
HITOS EN EL
DESARROLLO DE R
Versión 0.60 (5 de diciembre de
1997): R se integra oficialmente
en el Proyecto GNU. El código se
versiona a través de CVS.
Versión 1.0.0 (29 de febrero de
2000): Los desarrolladores lo
consideran suficientemente
estable para su uso en
producción.
Versión 1.4.0: Se introducen los
métodos S4 y aparece la primera
versión para Mac OS X.
Versión 2.0.0 (4 de octubre de
2004): Introduce el lazy loading,
que permite una carga rápida de
datos con un coste de memoria
mínimo.
HITOS EN EL
DESARROLLO DE R
Versión 2.1.0: Aparece el
soporte para UTF-8 y
comienzan los esfuerzos de
internacionalización para
distintos idiomas.
Versión 2.9.0: El paquete
'Matrix' se incluye en la
distribución básica de R.
Versión 2.11.0 (22 de abril de
2010): Soporte para sistemas
Windows de 64 bits.
Versión 2.13.0 (14 de abril de
2011): Añadida una nueva
función al compilador que permite
acelerar las funciones
convirtiéndolas a byte-code.
7. ¿En qué me puede ayudar R?
R al estar orientado
a las estadísticas,
proporciona un
amplio abanico de
herramientas.
Capacidad gráfica,
que permite generar
gráficos con alta
calidad, con sólo
utilizar las funciones
de graficación.
R también puede
usarse como
herramienta de cálculo
numérico y a la vez
ser útil para la minería
de datos.
R es un lenguaje
interpretado, el
usuario normalmente
accede por líneas de
comandos o consola.
Se trata de un
lenguaje de
programación, lo que
permite que permite
extender sus propias
funciones.
8. EJEMPLOS
Si queremos hacer un Hola mundo podemos hacerlo
de la siguiente manera:
Sumemos 2 números:
Vamos a crear una colección:
Vamos a calcular el cuadrado de cada elemento:
9. Ahora vamos a calcular la media, la varianza.
Además, R puede integrarse con distintas bases de datos y
existen bibliotecas que facilitan su utilización desde
lenguajes de programación interpretados como Perl, Python
y Ruby. Y por supuesto existen proyectos que permiten
utilizar R desde Java o .net.
Cuenta con un poderoso entorno de desarrollo llamado R
studio que se puede descargar de forma gratuita.
10. Los datos pueden
almacenarse en variables que
se identifican con un nombre.
Almacena datos en una
variable se utiliza el operador
de asignación <-
mi.variable.numerica <- 3.524
mi.variable.caracter <- "control"
mi.variable.booleana <- TRUE
R soporta como tipo de datos
básicos valores numéricos,
caracteres, cadenas de
caracteres y valores
booleanos.
Se diferencia entre
mayúsculas y minúsculas. Los
nombres de las variables
deben ser informativos
utilizando por convenio el,
para separar distintas
palabras.
VARIABLES Y TIPOS
DE DATOS EN R.
11. .
VECTORES
Es una
concatenación de
una colección de
datos del mismo
tipo. Cada dato
recibe un índice
según el orden
en el que se
concatenó
(comenzando por
1).
Para crear un
vector usamos la
función c(), un
vector que
consista en una
serie de número
consecutivos se
utiliza el
operador.
Por ejemplo:
12. .
Podemos
acceder a un
dato utilizando
su índice. Para
acceder a un
subconjunto de
datos de un
vector podemos
utilizar otro
vector con los
índices
correspondientes
Por último,
podemos
acceder a un
subconjunto de
datos de un
vector utilizando
un vector lógico.
En este caso, se
devolverán los
datos que
corresponden a
TRUE en el
vector lógico
correspondiente
Por ejemplo:
13. MATRICES
Es una colección de
datos del mismo tipo que
tiene dos dimensiones.
Para crear una matriz
usamos la función matrix.
Los elementos se
proporcionan en un
vector y se colocan por
columnas.
M <- matrix(1:10, nrow = 2, ncol = 5)
M
Si queremos que se rellene
por filas es necesario
especificar el argumento
byrow = TRUE:
M <- matrix(1:10, nrow = 2, ncol = 5,
byrow=TRUE)
M
14. • Podemos asignar nombres a las filas y las columnas de una matriz:
rownames(M) <- c("fila1", "fila2")
colnames(M) <- c("columna1", "columna2", "columna3", "columna4",
"columna5")
M
La función dim
devuelve las
dimensiones de
una matriz:
dim(M)
La función nrow
devuelve el
número de filas:
nrow(M)
La función ncol
devuelve el
número de
columnas:
ncol(M)
15. .
• Podemos seleccionar un elemento por el
nombre de su fila y su columna:
M[1,2]
M["fila2","columna2"]
• Podemos extraer filas y columnas enteras
como vectores de matrices utilizando sólo
el primer o segundo índice
respectivamente y dejando el segundo en
blanco:
M[1,]
M[,"columna3"]
17. POR EJEMPLO:
a <- 4
b <- 3
suma <- a + b
diferencia <- a – b
producto <- a * b
división <- a / b
potencia <- a ^ b
18. Operaciones de comparación en R.
Mayor que:
>
Mayor o
igual que:
>=
Menor que:
<
Menor o
igual que:
<=
Igual a: ==
Distinto de:
!=
19. Estas operaciones devuelven un valor lógico
TRUE o FALSE.
POR EJEMPLO:
a > 5
b >= 3
a < b
a <= 10
a == 5
b != a
20. Operaciones Lógicas en R.
POR EJEMPLO:
(a > 5) && (b > 2)
(a > 5) || (b > 2)
!(a > 5)
Conjunción
(y): && o &
Disyunción
(o): || o |
Negación
(no): !
21. CONCLUSIONES
Como puede verse, existen lenguajes
específicos para cada tarea diferente. Y en
este caso este lenguaje r nos permite
realizar cálculos estadísticos que nos
pueden ayudar mucho en nuestra vida
estudiantil.
De este modo, una computadora podrá
resolver un problema si alguien desarrolla
un programa que contenga las
instrucciones adecuadas que permitan
transformar los datos.