El documento describe el software R Commander, una interfaz gráfica de usuario creada por John Fox para facilitar el análisis e interpretación de datos en R. R Commander proporciona menús y herramientas para la gestión y análisis de datos, incluyendo opciones para abrir y guardar archivos, importar datos de otros programas, realizar estadísticas, gráficos y modelos, y ejecutar pruebas de hipótesis. El documento incluye ejemplos del uso de R Commander para cargar datos, calcular estadísticas descriptivas
Es la solución para administraciones agropecuarias que permite automatizar sus circuitos de información.
El diseño del software facilita la integración de los procesos de compra, producción, venta, fondos y contabilidad e impuestos.
Es la solución para administraciones agropecuarias que permite automatizar sus circuitos de información.
El diseño del software facilita la integración de los procesos de compra, producción, venta, fondos y contabilidad e impuestos.
3. R - Commander es una interfaz
gráfica de usuario creada por
John Fox, nos ayuda con el
análisis e interpretación de los
datos que son muy necesarios en
los
procesos
para
el
mejoramiento de algún producto
o servicio .
Una vez que R se está
ejecutando bastará con teclear la
instrucción library(Rcmdr) en la
consola de R para acceder al R –
Commander. Se mostrará la
ventana
Fig 1 :Ventana principal R-Commander
3
4. Fichero: Permite abrir ficheros con instrucciones a ejecutar, o para guardar datos, resultados,
sintaxis, etc.
Editar: Opciones para cortar, pegar, borrar, etc.
Datos: Utilidades para la gestión de datos (creación de datos, importación desde otros
programas, recodificación de variables, etc.).
Estadísticos: Ejecución de procedimientos propiamente estadísticos.
Gráficas: Barras, sectores y puntos.
Modelos: Definición y uso de modelos específicos para el análisis de datos.
Distribuciones: Probabilidades, cuantiles y gráficos de las distribuciones de probabilidad más
habituales (Normal, t de Student, F de Fisher, binomial, etc.)
Herramientas: Carga de librerías y definición del entorno.
4
5. A continuación se explicarán los formas básicas para abrir una base con R-Commander
1.- Nuevo conjunto de datos
Este comando permite crear a mano y activar un conjunto de datos. Una vez asignado un nombre a los
datos se abrirá una tabla vacía, que el usuario tendrá que rellenar con sus propios datos.
5
6. 2.- Cargar conjunto de datos
Esta opción permite abrir un conjunto de datos ya existente, por ejemplo
un fichero con el formato nativo de R (.rda).
3.- Importar datos
R-Commander no solo permiten crear y trabajar sobre datos con formato
nativo, sino que permiten también utilizar ficheros provenientes de otros
programas. Los formatos de fichero soportados por R-Commander son :
texto puro (en fichero, portapapeles o dirección URL).
SPSS.
Minitab
STATA
Excel
Access.
Como ejemplo, abramos el conjunto de datos sida.xlsx creado en Excel,
siguiendo las instrucciones.
6
10. En el contraste de hipótesis es preciso establecer procedimientos para aceptar o
rechazar hipótesis estadísticas emitidas acerca de un parámetro u otra característica
de la población. Vamos a ver como se realiza esto con ayuda del R – Commander a
través de un ejemplo.
Prueba de hipótesis para la media de una distribución normal
Un agricultor quiere utilizar una forma nueva de fertilizante líquido para su cultivo de
trigo. Se sabe que el rendimiento de una variedad de trigo, muy usada en la
zona, utilizando un fertilizante granulado tradicional sigue una distribución normal de
media de 2 t/ha y una desviación estándar de 0,2 t/ha. Se cuenta con los datos de
rendimiento de 25 parcelas experimentales en las cuales se sembró la variedad de
trigo y se aplicó el nuevo fertilizante ¿ Hay fuertes evidencias para decir que el nuevo
fertilizante mejora el rendimiento con respecto al fertilizante tradicional?. Considere un
nivel de significación del 5%.
Los rendimientos obtenidos (t/ha) fueron:
2,87 3,03 2,90 2,80 3,09
2,75 2,72 2,94 2,98 2,54
2,84 2,74 2,68 2,97 3,13
2,85 2,74 2,94 3,09 2,85
3,03 3,01 2,70 2,89 2,98
10
11. Solución:
En este caso, todos los datos corresponden solo a valores de rendimiento con
el uso del nuevo fertilizante, por lo que el conjunto de datos que necesitamos
para trabajar contendrán una única variable (rendimiento) y 25 observaciones.
1.- Utilizando la primera forma de ingreso de datos vamos a introducirlos.
11
13. 2.- Nivel de significancia
α = 0.05
3.- Criterio
Rechazar H0 si p-valor < α
4.- Cálculos
Elegimos la opción del menú: Estadísticos – Medias – Test t para una muestra
A continuación :
- Debemos elegir una sola variable seleccionamos ( rendimiento).
- Indicamos cual es la hipótesis alternativa (bilateral, unilateral a derecha y
unilateral a izquierda )En nuestro caso elegimos la tercera opción .
- Especificamos el valor hipotético con el que estamos comparando la media,
en nuestro caso 2.
- Por último especificamos el nivel de confianza (0.95).
- Hacemos clic en aceptar
- Los resultados se muestran en la ventana de resultados.
13
14. Análisis:
- Primero nos recuerda que estamos analizando la variable trigor$rendimiento.
- El estadístico de contraste es t = 29.7498, los grados de libertad df = 24 y p-value < 2.2e-16
Decisión
Ya que p-valor < α rechazamos H0 podemos concluir que el nuevo fertilizante mejora el rendimiento
con respecto al fertilizante tradicional
14
15. Datos Emparejados.
Para comparar dos materiales A y B para suela de zapatos deportivos, se eligen 10 niños
al azar, y a cada uno se le proporciona un par de zapatos, uno con la suela del material A
y el otro con la suela del material B. A fin de eliminar en lo posible la influencia de que un
material vaya al pie derecho o al izquierdo, la asignación de orden dentro de cada par se
hace al azar. AL cabo de 3 meses se mide una característica en cada zapato que refleja
su comportamiento ante el uso, que se interpreta con que si la característica medida tiene
mayor valor es porque ese tipo de material ofrece mejor calidad. Así resulta:
15
16. Considerando los datos de los desgastes en 10 pares de zapatos según el material A y B ,
efectuamos la comparación .
16
19. El intervalo de confianza (nivel del 95%) para la diferencia de medias en el Material A y
en el B es (-0,687; -0,133), lo que indica que el valor de la característica de uso (por
tanto la satisfacción) es mayor con el Material B que con el A. Desde la visión de
contraste de hipótesis, el reducido valor del p-valor: 0,009, indica que la hipótesis de
igualdad de medias se rechazaría con un nivel de significación del 5%, frente a la
hipótesis de que los dos materiales son igualmente satisfactorios.
Los siguientes datos corresponden al rendimiento por hectárea de cierta nueva variedad
de trigo, medido en 9 lotes experimentales: 3,35; 3,92; 4,26; 3,36; 3,72; 4,19, 3,42; 4,38;
4,5.
Construya un intervalo de confianza al 90% de confianza para el rendimiento promedio
de la nueva variedad de trigo si suponemos que el rendimiento por hectárea se
distribuye aproximadamente normal.
En el lenguaje R procedemos como sigue:
1.- En la ventana de instrucciones ingresamos los datos.
T<-c(3.35,3.92,4.26,3.36,3.72,4.19,3.42,4.38,4.5)
2.- Para la construcción del intervalo de confianza digitamos la siguiente instrucción
t.test(T,conf.level=0.90)
3.- Pulsamos Ejecutar.
19
21. El intervalo de confianza pedido es [3.6175; 4.1825]. Note que la salida entrega
además la media con valor 3,9 y por defecto, el test de hipótesis H0 : µ=0 en
contra de la hipótesis alternativa H1 : µ≠0 . Se rechaza la hipótesis nula ya que
el valor de la prueba es p-value = 5.681e-09.
21