SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
Manual de R-commander en Prueba de Hipotesis
1. ESCUALE SUPERIOR POLITECNICA DE
CHIMBORAZO
Manual R-Commander en Prueba de Hipótesis
FIE-EIE
Asignatura:
Probabilidad y Estadística
Nombre:
Fernán Silva E. (446)
Curso:
4to “A”
Periodo Académico:
Septiembre 2013 - Febrero 2014
2. INTRODUCCION
• R-Commander es una Interfaz Gráfica de Usuario, creada por
John Fox, que permite acceder a muchas capacidades del
entorno estadístico R sin que el usuario tenga que conocer el
lenguaje de comandos propio de este entorno. Al arrancar RCommander, se nos presentan la siguiente ventana:
3. • La ventana corresponde al entorno de R-commander, que nos
evita precisamente tener que usar dicho lenguaje de comandos,
al menos para las tareas que se encuentran implementadas
dentro de dicho entorno.
4. El acceso a las funciones implementadas en R-commander es muy simple
y se realiza utilizando el ratón para seleccionar, dentro del menú situado
en la primera línea de la ventana, la opción a la que queramos acceder. Las
opciones son:
• Fichero: para abrir ficheros con instrucciones a ejecutar, o para guardar
datos, resultados, sintaxis, etc.
• Editar: las típicas opciones para cortar, pegar, borrar, etc.
• Datos: Utilidades para la gestión de datos (creación de datos,
importación desde otros programas, recodificación de variables, etc.)
• Estadísticos: ejecución de procedimientos propiamente estadísticos
• Graficas: gráficos
• Modelos: definición y uso de modelos específicos para el análisis de
datos.
• Distribuciones: probabilidades, cuantiles y gráficos de las distribuciones
de probabilidad más habituales (Normal, t de Student, F de Fisher,
binomial, etc.)
• Herramientas: carga de librerías y definición del entorno.
• Ayuda: ayuda sobre R-commander.
5. Prueba de hipotesis
Otra manera de hacer inferencia es haciendo una afirmación
acerca del valor que el parámetro de la población bajo estudio
puede tomar. Esta afirmación puede estar basada en alguna
creencia o experiencia pasada que será contrastada con la
evidencia que nosotros obtengamos a través de la información
contenida en la muestra. Esto es a lo que llamamos Prueba de
Hipótesis
Una prueba de hipótesis comprende cuatro componentes
principales:
• Hipótesis Nula
• Hipótesis Alternativa
• Estadística de Prueba
• Región de Rechazo
6. La Hipótesis Nula, denotada como H0 siempre especifica un solo
valor del parámetro de la población si la hipótesis es simple o un
conjunto de valores si es compuesta (es lo que queremos
desacreditar) .
La Hipótesis Alternativa, denotada como H1 es la que responde
nuestra pregunta, la que se establece en base a la evidencia que
tenemos. Puede tener cuatro formas:
7. CONTRASTE SOBRE LA MEDIA DE UNA POBLACIÓN
Debemos importar los datos desde un fichero para manejar la
variable en cuestión. A continuación elegimos la opción del
menú Estadísticos→Medias→Test t para una muestra.
Aparecerá la siguiente ventana,
fijémonos con detalle en ella:
8. • Nos pide en primer lugar que elijamos una (sólo una) variable,
que debe ser aquella cuya media estemos analizando.
• Nos pide que indiquemos cuál es la hipótesis alternativa.
• Nos pide que especifiquemos el valor del valor hipotético con el
que estamos comparando la media.
• Nos pide, por último, que especifiquemos un nivel de confianza.
En realidad este nivel de confianza no lo es para el contraste, que
se resolverá a través del p-valor, sino para el intervalo de
confianza asociado al problema.
9. CONTRASTE PARA LA DIFERENCIA DE MEDIAS DE
POBLACIONES INDEPENDIENTES
Lo primero que tenemos que hacer para importar los datos, que se
encuentran en un fichero de tipo texto es ver cómo están
almacenados: si lo abrimos, por ejemplo, con el bloc de notas,
vemos que están separados por tabulaciones y que los nombres de
las variables están en la primera fila. La figura muestra la ventana
con la que importamos los datos, mientras que la parte de la
derecha muestra cómo se ven con el bloc de notas.
10. Fijémonos que los datos de las dos muestras aparecen en dos
columnas paralelas. Esa es una forma no demasiado correcta de
especificarlas, ya que parece que cada dato de una de las muestras
está relacionado con otro dato de la otra muestra y, en realidad, las
muestras son independientes (de hecho podrían tener distinto
tamaño muestral). Por este motivo, tenemos que preparar los datos
para que R-Commander entienda que se trata de dos muestras
independientes. Lo que tenemos que hacer es juntar o apilar las
dos muestras en una sola columna, indicando en una segunda
columna si el dato es de una muestra u otra.
Esta operación se realiza mediante la opción Datos → Conjunto de
datos activo → Apilar variables del conjunto de datos activo.
11. Ahora ya tenemos los datos preparados para ser analizados.
Elegimos la opción Estadísticos → Medias → Test t para muestras
independientes. Esta opción abre la ventana de entradas que
aparece en la figura. En ella podemos ver que tenemos que
especificar el factor que separa las dos muestras, la variable que
estamos analizando, la hipótesis alternativa, el nivel de confianza
requerido y si podemos suponer varianzas iguales.
12. CONTRASTE PARA LA PROPORCIÓN EN UNA POBLACIÓN
Si tenemos los datos en un archivo, los cargamos y seleccionamos la
opción del menú Estadísticos → Proporciones → Test de
proporciones para una muestra. Por ejemplo, los datos del
problema están en el fichero prop.rda. Los cargamos y
seleccionamos la opción del menú. La ventana de entrada
emergente aparece en la Figura 7.6 a la izquierda. En ella tenemos
que especificar:
a) El valor hipotético en la hipótesis nula.
b) El sentido de la hipótesis alternativa.
c) Un nivel de confianza para el intervalo de confianza resultante.
d) El tipo de prueba. Po demos elegir entre la prueba χ2 con o sin
corrección por continuidad o la prueba binomial exacta.
13.
14. CONTRASTE PARA LA DIFERENCIA DE PROPORCIONES
Al igual que en el ejemplo anterior, podríamos tener los datos en un
archivo y tratarlos directamente desde ahí 4, mediante la opción
Estadísticos → Proporciones → Test de proporciones para dos
muestras. Sin embargo, tan sólo es necesario conocer el número de
éxitos y fracasos en cada una de las dos muestras, utilizando la
opción Estadísticos → Proporciones → IPSUR Enter table for
independent samples . En la ventana emergente tenemos que
especificar:
•
•
•
•
•
Número de éxitos y fracasos en la primera muestra.
Número de éxitos y fracasos en la segunda muestra.
Un nivel de significación para el intervalo de confianza.
El sentido de la hipótesis alternativa.
El tipo de test.
15.
16. CONTRASTE PARA LA COMPARACIÓN DE VARIANZA
Necesitamos que los datos se encuentren apilados en una única
variable y que una segunda variable tipo factor distinga de qué
muestra pro cede cada dato. Eso ya lo hicimos anteriormente.
Elegimos la opción Estadísticos → Varianzas → Test F para dos
varianzas. En la ventana de entradas hay que especificar:
• La variable que define los grupos y la variable explicada .
• La hipótesis alternativa.
• El nivel de confianza para el intervalo de confianza.