2. INDICE
Introducción
Como bajar R
Manuales de R
Librerías
Inicio de Sesión en R
Como bajar librerías
GUI’s Rcomander
SciViewsR
3. Un poco de Historia
R es una implementación open-source del
lenguaje S (Bell Labs -principios de los 90), que
también es la base del sistema S-Plus (entorno
comercial).
R y S-Plus aún comparten una gran mayoría de
código e instrucciones, pero probablemente serán
dos entornos independientes en un futuro a
medio plazo.
Las funciones de R se agrupan en paquetes
(packages, libraries), los que contienen las
funciones más habituales se incluyen por defecto
en la distribución de R, y el resto se encuentran
disponibles en la Comprehensive R Archive
Network (CRAN) http://cran.r-project.org
4. El entorno R
Suite integrada para la manipulación de datos,
cálculo y procedimientos gráficos.
Los principales aspectos que ofrece son:
Facilidad para el manejo y el almacenamiento de
datos.
Un conjunto de operadores para cálculo con arrays
y matrices.
Una colección extensa e integrada de herramientas
intermedias para el análisis de datos.
Multitud de facilidades gráficas.
Un lenguaje de programación simple y efectivo que
incluye las estructuras de control clásicas, funciones
recursivas y facilidades para el input y output de
datos y resultados.
5. El entorno R
R es un entorno altamente dinámico, y a
menudo se concibe como un vehículo para
desarrollar (nuevos) métodos interactivos
de análisis de datos
Ventaja: incorporación constante de nuevos
métodos.
Inconveniente: por su dinamismo, a menudo
código antiguo de R se queda desfasado y no
funciona con las nuevas versiones del entorno.
16. El sistema de librerías
Una librería o paquete es un conjunto de
funciones sobre una temática común. El sistema
R-base trae las librerías diseñadas por el núcleo
central de desarrolladores (core). Sin embargo, el
modelo descentralizado de producción de R
conlleva que muchas funciones interesantes no se
instalen con el paquete básico sino que estén
contenidas en paquetes o librerías externas que
hay que instalar por separado. Aunque son
descargables desde muchos sitios de internet, se
recomienda su descarga desde el repositorio
Comprehensive R Archive Network (CRAN) porque
se garantiza que su funcionamiento ha sido
revisado y aprobado por el núcleo de
desarrolladores.
22. Inicio de Sesión
Tras arrancar el programa, aparece una ventana titulada R
Console que indica la versión de R y cómo obtener información
de la licencia de uso.
23. Ventana de ordenes
Archivo Operaciones básicas con los
ficheros.
Editar Típico menú con opciones de edición
(copiar, pegar, ...).
Misc Opciones avanzadas.
Paquetes Permite gestionar los paquetes
adicionales de R.
Ayuda Información abundante sobre R.
28. Como bajar Librerías
Paquetes Instalar paquetes a partir de archivos zip locales
Se busca el directorio desde se guarda el archivo Abrir
29. Como cargar Librerías
o Una vez instalada la librería hay que
cargarla.
o Paquetes Cargar paquete (s)
30. Notas:
Cada 3 meses aparece una nueva
versión de R Reinstalarlo cada 6
meses
Hay librerías que funcionan a partir
de una determinada versión de R
38. Ayuda R
? mean
help.search("mean") Busca en los
paquetes donde aparece la palabra
mean
apropos("mean") Funciones
donde aparece la palabra mean
40. GUI's
El hecho que R no tenga los menús para
seleccionar funciones como tienen
algunos otros sistemas de análisis
estadístico puede hacer que resulte
complejo su uso al principio.
Se han desarrollado varios GUI (Graphical
User Interface) que ayudan al principio a
irse familiarizandose con el lenguaje, aún
a costa de perder flexibilidad
41. GUI's
Algunos de ellos son los siguientes:
Rcomander: Se instala a través de la librería
Rcmdr
SciViewsR: Disponible desde el 2 de abril de
2005 . Esta interfaz grafica de R se asemeja a
la que utiliza el programa SAS que divide la
ventana en 3 secciones
Una para edición de sintaxis
Una para visualizar resultados
Una tercera para navegar por los objetos y
funciones).
42. SciViewsR
Requiere los siguientes pasos previos:
El programa R instalado y funcionando, el Rgui debe
estar en modo sdi (Edit/Gui preferences/sdi, y
salvar) hay que cerrar y volver a abrir el programa
para que se apliquen los cambios.
Descargar e instalar sciViews-R_0.7-3Setup.exe ,
aceptando los iconos en el escritorio y en el menu
de inicio.
Una vez instalado tenemos que entrar en la carpeta
donde se ha instalado SciViews y modificar las
propiedades del acceso directo a sciViews-R
(boton derecho del mouse/propiedades/ en donde
dice destino debe quedar reflejado el camino a
Rgui.exe y las opciones que se describen abajo así:
"C:Archivos de programaRrw2010patbinRgui.exe" --sdi RSciViews.RData
http://www.sciviews.org/SciViews-R/index.html
45. Librería Rcmdr
Ejecutar R
En el menú Paquetes, pinchar en
Seleccionar espejo CRAN.
En el cuadro de dialogo, escoger
Austria y pulsar en Aceptar
En el menú Paquetes, pinchar en
Instalar paquetes
Escoger Rcmdr y aceptar
46. Librería Rcmdr
En el menú Paquetes, pinchar en
Cargar paquetes y seleccionar
Rcmdr
También poniendo en la línea de
comandos library(Rcmdr)
48. R Commander
Barra de Menús, con desplegables
Muestran las órdenes de R correspondientes a las opciones de los
menús escogidas por el usuario. Además, tales instrucciones se pueden
modificar, y ejecutar mediante el botón Ejecutar.
Contiene aquellas salidas de las órdenes ejecutadas que
se muestran en formato de texto.
Datos activos, Modelo Activo, Visualizar datos, Editar datos
49. Barra de menús
Fichero: Hay opciones para cargar o grabar instrucciones,
resultados o el entorno de trabajo.
Editar: Típico menú de edición. Permite seleccionar, cortar,
copiar, pegar y buscar.
Datos: Permite la gestión de los datos por analizar. R mantiene
distintos conjuntos de datos dentro del entorno de trabajo.
Estadísticas Recoge los diferentes métodos de análisis que se
pueden aplicar al conjunto de datos activo.
Modelos Un conjunto de datos puede tener asociados varios modelos
estadísticos. Este menú sirve para la gestión de los mismos.
Distribuciones Para trabajar con funciones de distribución de
probabilidad: cuantiles, probabilidades y gráficas
asociadas a las distribuciones normal, t, Chi^2, F,
binomial. . .
50. Ficheros .R
Es simplemente un fichero de texto que contiene órdenes. Es
posible escribir órdenes directamente en la ventana.
Sin embargo, es más sencillo permitir que el programa le ayude a
construir un guión aprovechando que la realización de una acción
desde un cuadro de diálogo añade la orden a la ventana de
guiones.
En ésta puede ser modificada para su posterior ejecución. Para
ello, ha de seleccionar con el ratón la orden u órdenes y después
ha de pinchar el botón derecho del ratón en Ejecutar.
52. Ventana de instrucciones
En el cuadro de diálogo de un procedimiento determinado,
pulse en el botón Ayuda para saber qué opciones del
lenguaje R están disponibles (si hay alguna) para ese
procedimiento.
Si desea información completa sobre el lenguaje de
órdenes, consulte el manual de referencia incluido con la
documentación de R.
54. Ventana de resultados
Una vez que se solicita un análisis con los datos, los resultados
obtenidos se muestran en la ventana inferior.
El texto en rojo son las órdenes correspondientes que aparecen
en la ventana de instrucciones.
El texto en azul es el resultado de cada orden.
Los contenidos de la ventana de resultados son texto puro, que
puede ser copiado a cualquier editor de texto para su
procesamiento.
55. Ventana de resultados
Podemos usar las ventanas de instrucciones y resultados a
manera de calculadora. El lenguaje R permite las
operaciones aritméticas básicas, la definición de variables
y funciones y dispone de una colección muy extensa de
funciones ya definidas. En el siguiente, definimos la
función varianza:
muestra <- c(1,3,5,7,33)
mean(muestra)
varianza <- function(x) {mean(x^2) - mean(x)^2}
varianza (muestra)
57. Manejo de datos
Aprenderemos a manejar los conjuntos de datos y a leer y
almacenar en un fichero los datos necesarios para realizar un
análisis. Estas tareas se realizan a través del menú Datos.
Nuevos datos Para introducir nuevos datos por el teclado.
Importar datos Para leer datos contenidos en un fichero.
Datos en paquetes R contiene una colección de datos de ejemplo.
Datos activos Aquí se gestiona el conjunto de datos activo.
Modificar variables de los datos activos Para realizar
trasformaciones en los datos.
61. Manejo de datos
Si pinchas en Datos Puedes seleccionar los datos que te interesen
UN pasa a ser la base de datos activa
62. Manejo de datos
Barra de elementos activo
Datos Nombre del conjunto de datos activo, es decir,el que se toma por omisión
a la hora de ejecutar una orden.
Editar datos Hace aparecer una cuadrícula donde es posible modificar el contenido
del conjunto actual de datos.
Visualizar datos Muestra el contenido del conjunto actual de datos.
Modelo Para un mismo conjunto de datos se pueden crear diferentes modelos
de análisis (de regresión lineal, de componentes principales...).
Este menú permite escoger el modelo activo, es decir, aquel considerado por
omisión cuando se ejecuta una orden.
65. Manejo de datos
Para introducir los datos simplemente se coloca el cursor en la celda correspondiente a
cada individuo y variable. Para moverse de una celda a otra se puede utilizar el ratón, o
las teclas del cursor y retorno para el desplazamiento vertical, o las teclas del cursor y
tabulador para el desplazamiento horizontal.
Al introducir los datos, se observa que R da por omisión nombre a las variables (var1,
var2, ...)y define sus características. En principio, una variable puede ser numérica
(numeric) o de caracteres (character). Si se desea cambiar el nombre o definir el tipo
de variable hay que pulsar en la cabecera de la columna correspondiente.
Llamaremos factores a las variables de caracteres. Nos servirán para representar
variables cualitativas, es decir, aquéllas cuyo valores toman un número finito de
modalidades.
67. Manejo de datos
Observamos que no tenemos nombre de variable porque se lo hemos
indicado así, ya que el fichero no disponía. Y que solo tiene una variable
74. Manejo de datos
Recodificar variable Crea una nueva variable a partir de una ya xistente.
Sirve para agrupar datos cuantitativos en intervalos.
75. Manejo de datos
Segmentar variable numérica Simplifica la agrupación de datos
cuantitativos en intervalos, aunque por ello es menos flexible que
Recode variable.
81. Análisis descriptivo
Las medidas mediante comandos
Mean
mean(Basededatos$NombreVariable)
Mediana:
median(Basededatos$NombreVariable)
Media recortada:
mean(Basededatos$NombreVariable, trim=0.05)
Amplitud:
diff(range(Basededatos$NombreVariable))
Recorrido intercuartílico:
IQR(Basededatos$NombreVariable)
Coeficiente de variación:
CV<-sd(Basededatos$NombreVariable) / mean (Basededatos$NombreVariable)