2. ¿QUÉ ES R PARA ESTADÍSTICA?
El paquete R es una colección de programas libres diseñada para el
análisis estadístico de datos, que permite desde los análisis descriptivos
más sencillos (como tablas de frecuencias simples) a procedimientos
inferenciales más complejos (como el análisis de varianza o el análisis de
componentes principales).
R realiza tres funciones esenciales:
Leer datos
Especificar el tipo de análisis que se quiere realizar con esos datos
Mostrar los resultados obtenidos tras los análisis. La interpretación de
los resultados es tarea del investigador.
3. R, también conocido como ”GNU S”, es un entorno y un lenguaje para
el cálculo estadístico y la generación de gráficos. R implementa un
dialecto del premiado lenguaje S, desarrollado en los Laboratorios Bell
por John Chambers et al.
Para los no iniciados diremos que R provee un acceso relativamente
sencillo a una amplia variedad de técnicas estadísticas y graficas.
Para los usuarios avanzados se ofrece un lenguaje de programación
completo con el que añadir nuevas técnicas mediante la definición de
funciones.
4. INSTALACIÓN Y OBTENCIÓN DEL PROGRAMA
Depende del sistema operativo, pero todo se puede encontrar en
http://cran.es.r-project.org/bin
Windows: se puede obtener un ejecutable desde
http://cran.es.r-project.org/bin/windows/base por ejemplo,
http://cran.es.r-project.org/bin/windows/base/R-2.4.1-win32.exe
Al ejecutar el archivo se instalará el sistema base y los paquetes
recomendados.
GNU/Linux: (dos opciones)
Obtener el R-x.y.z.tar.gz y compilar desde las fuentes.
También bajar los paquetes adicionales y instalarlos. (Buena
forma de comprobar que el sistema tiene development tools).
Obtener binarios (ej., *.deb para Debian, *.rpm para RedHat,
SuSE, Mandrake).
5. INTERFAZ GRÁFICA (R-COMMANDER)
R-Commander es una Interfaz Gráfica de Usuario (GUI en inglés), creada
por John Fox, que permite acceder a muchas capacidades del entorno
estadístico R sin que el usuario tenga que conocer el lenguaje de
comandos propio de este entorno. Al arrancar R-Commander, se nos
presentan dos ventanas:
La Ventana de la Consola de R: donde podemos ejecutar comandos
de R, para lo cual necesitamos conocer el lenguaje R y su sintaxis.
La Ventana de R-Commander: nos evita precisamente tener
que usar dicho lenguaje de comandos, al menos para las
tareas que se encuentran implementadas dentro de dicho
entorno.
7. PARTES DE R-COMMANDER
Barra de menú:
En la Barra de Menú encontramos los siguientes menús desplegables:
La opción Fichero tiene diferentes opciones tales como abrir archivo
de instrucciones, guardar instrucciones, etc.
El menú Editar tiene las opciones básicas de cortar, copiar, pegar,
limpiar ventana que pueden ser utilizada cuando se esté trabajando en
la ventana de instrucciones.
El menú Datos contiene las instrucciones más utilizadas para el
manejo de datos, se puede crear nuevos conjuntos de datos, cargar
algún conjunto ya existente, importar datos desde diferentes fuentes,
tales como Excel, SPSS, STATA… etc. Permite también modificar
variables de conjuntos de datos.
8. El menú Estadísticos, contiene diferentes funciones asociadas a la
operación de los conjuntos de datos, resúmenes estadísticos, análisis
dimensionales, etc.
El menú Gráficas, contiene un listado de los gráficos que se pueden
realizar en R, las opciones se habilitan dependiendo de el conjunto de
datos que se este trabajando.
El menú Modelo, contiene una diversidad de opciones para realizar
test de hipótesis, diagnósticos numéricos, definir intervalos de
confianza, etc.
El menú Distribuciones, está dividido en operaciones para
Distribuciones continuas y operaciones para Distribuciones discretas,
cada una posee una diversidad de análisis aplicables específicamente a
cada tipo de distribución.
Entre otros.
9. Barra de manipulación de conjunto de datos:
Conjunto de datos, al dar click sobre este botón, muestra todos los
conjuntos disponibles y permite seleccionar con cuál se desea trabajar.
Una vez seleccionado el conjunto, el nombre de este se visualiza al lado
de la viñeta “Conjunto de datos”
Ventana de instrucciones
Se puede acceder a muchas ´ordenes desde los menús y los cuadros de
dialogo. No obstante, algunas ´ordenes y opciones sólo están disponibles
mediante el uso del lenguaje R. Además, se pueden grabar los guiones en
un fichero de texto (habitualmente con extensión .R) con lo que podrá
repetir los análisis en otro momento o ejecutarlos en un trabajo
automatizado.
10. Barra de Menús
Barra de Manipulación
de Conjuntos de Datos
Ventana de
Instrucciones
Ventana de
Resultados
Ventana de
Mensajes
11. MANEJO DE DATOS EN R-COMMANDER
Estas tareas se realizan a través del menú Datos, cuyas opciones
mostramos someramente a continuación:
Nuevos datos: Para introducir nuevos datos por el teclado. Requiere
dar un nombre a los datos nuevos, que no puede contener espacios ni
caracteres especiales.
Importar datos: Para leer datos contenidos en un fichero. Soporta
varios formatos: texto puro, SPSS, Minitab. . .
Datos en paquetes R: contiene una colección de datos de ejemplo,
por si queremos ejercitarnos con el programa pero no disponemos de
datos propios adecuados.
Datos activos: Aquí se gestiona el conjunto de datos activo.
Seleccionar los datos activos: Elegir el conjunto de datos activo
entre los que hay disponibles en ese momento en la sesión.
Entre otras opciones.
12. Creación de un conjunto de datos nuevo:
Esta opción es conveniente cuando el conjunto de datos es pequeño. Para
conjuntos de datos mayores, es más cómodo crear un fichero de datos por
otros medios (por ejemplo, desde una hoja de calculo o una base de datos) y
luego importarlo.
Lo primero que hay que tener en cuenta y no olvidar es que los conjuntos de
datos (data set, data frame) están organizados de forma matricial, donde las filas
se refieren a los casos (individuos, unidades u observaciones) de la muestra y
las columnas a las variables. Para introducir nuevos datos ha de escogerse al
opción Nuevos datos del menú Datos. Se nos pide entonces un nombre para el
conjunto de datos (pues pueden manejarse varios simultáneamente).
13. Para introducir los datos simplemente se coloca el cursor en la celda
correspondiente a cada individuo y variable. Para moverse de una celda a
otra se puede utilizar el ratón, o las teclas del cursor y retorno para el
desplazamiento vertical, o las teclas del cursor y tabulador para el
desplazamiento horizontal. Al introducir los datos, se observa que R da
por omisión nombre a las variables (var1, var2, ...) y define sus
características. En principio, una variable puede ser numérica (numeric) o
de caracteres (character). Si se desea cambiar el nombre o definir el tipo de
variable hay que pulsar en la cabecera de la columna correspondiente.
14. Otra manera para introducir datos en R-Commander es exportar los
datos desde otro fichero, utilizando programas como SPSS, Excel, entre
otros.
Exportar datos desde Excel:
Supongamos que hemos creado los datos con EXCEL (o
equivalente), y que los hemos guardado desde EXCEL. Para
que R (y cualquier otro paquete estadístico) pueda utilizar los
datos, éstos deben introducirse de modo que
cada variable figure en una columna, y
cada fila represente un caso.
Asimismo, es conveniente que cada
columna esté encabezada con el nombre
de la variable.
15. Para cargar un archivo de datos en formato de Excel se utiliza el menú
Datos, la opción Importar datos y luego desde conjunto de datos Excel,
Access o dBase. R coloca como valor inicial Datos ese será el nombre con
el que se va a poder accesar a la tabla de datos que se cargue, se puede
modificar y colocar un nombre personalizado. En la pantalla que aparece
se debe buscar el archivo que se quiere cargar, las extensiones de los
archivos de Excel de las versiones anteriores a Office 2007 y 2010 son
XLS y de estas últimas 2 la extensión es XLSX, R muestra los archivos
con extensión XLS, si el archivo que se va a cargar es una versión de 2007
0 2010 para poder verlos se debe digitar en la parte “Nombre”: *.xlsx y
luego presionar la tecla Enter o Intro. Buscar el archivo a cargar y darle
un clic para seleccionarlo, luego dar clic en el botón Abrir. Si el archivo
de Excel tiene más de una hoja mostrará una ventana en la que se
debe seleccionar en la que se encuentran los datos a cargar.
16. OBJETOS DE R-COMMANDER
Casi todo en R es un objeto, incluyendo funciones y estructuras de datos.
Para saber los objetos que tenemos en el espacio de trabajo
utilizaremos los ().
Escribir el nombre de un objeto muestra su contenido: mean.
Para guardar el contenido del espacio de trabajo se pueden utilizar
las funciones save.image() y save(<objetos>,file="nombre.RData")
Para acceder a objetos de la carpeta de trabajo (o del camino que
especifiquemos) se pueden adjuntar:
> attach("misdatos.RData")
> ls(pos=2) # segunda posición en la ‘‘search list’’
17. Atributos de los objetos de R-Commander:
Modo: Tipo básico en un vector o array: lógico, entero, real, carácter,...
mode
Tipo: de los vectores o arrays: double,... typeof
Nombres: etiquetas de los elementos individuales de un vector o lista:
names
Dimensiones: de los arrays (alguna puede ser cero): dim
Dimnames: nombres de las dimensiones de los arrays: dimnames
Clase: vector alfanumérico con la lista de las clases del objeto: class
Otros: atributos de una serie temporal.
18. Tipos de objetos:
Vector (numérico, carácter, lógico)
Matrices y arrays (numérico, carácter, lógico)
Factores (nominales y ordinales)
Listas
Hojas de datos (data. Frame)
Expresiones
Funciones
19. GRÁFICAS EN R-COMMANDER
Un Histograma coloca las clases de una distribución
de frecuencia en el eje horizontal y las frecuencias en
el eje vertical. Este grafico revela detalles y patrones que
no se pueden discernir fácilmente de los datos originales.
Un diagrama de barras muestra cantidades o porcentajes
para dos o mas valores sobre el eje
vertical. Consiste en dos ejes
perpendiculares y una barra o
rectángulo para cada valor de la
variable.
20. Un diagrama circular es de especial utilidad para
mostrar proporciones relativas de una variable, se crea
marcando una porción del circulo correspondiente a
cada categoría de la variable.
Polígono de frecuencias. Son dos ejes perpendiculares, de los cuales
el horizontal representa los valores de la
variable y en el vertical las frecuencias.
21. USOS DE R-COMMANDER
En R-Commander se pueden elaborar diversos ejercicios aplicando una
serie de Datos Estadísticos (utilizando Estadística Descriptiva e
Inferencial) citando como ejemplos:
Medidas de Tendencia Central (Media, Mediana, Moda)
Distribución de Frecuencias
Medidas de Posición no Central (Decil, Cuartil, Percentil)
Medidas de Dispersión (Desviación Típica, Varianza, Coeficiente de
Variabilidad)
Probabilidades.
Correlación y Regresión Lineal
Variable Aleatoria Discreta (Bidimensional)
Y otras muchas mas aplicaciones de acuerdo a nuestras necesidades de
investigación.