ESCUELA SUPEIOR POLITECNICA DE CHIMBORAZO
FACULTAD DE INFORMATICA Y ELECTRONICA

Para la realización de nuestro mini manual empezaremos con una breve
introducción que es hipótesis y que es prueba de hipótesis
Hipótesis: Las hipótesis estadísticas se pueden contrastar con la información
extraída de las muestras y tanto si se aceptan como si se rechazan se puede
cometer un error.
La hipótesis formulada con intención de rechazarla se llama hipótesis nulay
se representa por H0. Rechazar H0 implica aceptar una hipótesis
alternativa (H1).
La situación se puede esquematizar:
H0 cierta
H0 rechazada
Error tipo I (a )
H0 no rechazada Decisión correcta

H0
falsa
H1 cierta
Decisión correcta (*)
Error tipo II (b )

(*) Decisión correcta que se busca
a
=
p(rechazar
b
=
p(aceptar
Potencia =1-b = p(rechazar H0|H0 falsa)

H0|H0
H0|H0

cierta)
falsa)

PRUEBA DE HIPOTESIS: Es un procedimiento basado en la evidencia muestral y
la teoría de probabilidad el cual se lo utiliza para determinar si la hipótesis es una
afirmación razonable.
R-COMMANDER
R es un dialecto del lenguaje estadístico S que se distribuye bajo licencia GNU
(Licencia Publica General)
¿QUE HACE R?
A los usuarios (no expertos) les permite realizar una enorme variedad de
análisis estadísticos y un amplio surtido de gráficos sin demasiado esfuerzo.
A los usuarios (expertos) les permite implementar técnicas propias,
adaptadas a sus necesidades personales.

VENTAJAS E INCONVENIENTES DEL R
 Es completamente gratuito
 Está disponible en la red y funciona en casi todos los sistemas operativos
 Permite realizar análisis estadísticos muy sofisticados
 Estimula el pensamiento crítico sobre el análisis a realizar.
 El código es libre y puede ser utilizado por cualquiera
 Permite intercambiar datos con otras utilidades
INCONVENIENTES
 El interfaz gráfico es muy simple e incomodo
 No hay(menús) sino que debemos introducir desde la línea de comandos
 Debemos aprender una nueva formar de pensar sobre los datos y las
estructura

¿DONDE ESTA R?
El repositorio central de R se encuentra en la dirección
http://www.r-project.org/
ESTRUCTURA DEL R
R se estructura en paquetes


Los básicos se instalan con la distribución de R



El resto, realizan tareas implementadas por usuarios de la comunidad
R, se han de instalar individualmente cuando los necesitamos.

INSTALACION DE R
 Nos conectamos a la dirección
http://cran.rstudio.com/
 Una vez elegidas seguimos las instrucciones .En el caso de Windows basta
con dirigirse al directorio base, descargar y ejecutar el fichero.
CARACTERISTICAS DEL ENTORNO DE PROGRAMACION R





Las acciones se realizan mediante ordenes en una línea de comando
R distingue entre mayúsculas y minúsculas
El lenguaje esta basado en funciones
Los argumentos de las funciones aparecen encerrados en paréntesis
COMANDOS VENTANAS Y APLICACIONES DEL SOTFWARE EN LA
PRUEBA DE HIPOTESIS
COMANDOS EN LA PRUEBA DE HIPOTESIS

1. TEST T PARA UNA NUESTRA
Para hacer contrastes de hipótesis, para la media de una variable cuantitativa con
distribución normal
2. TIPO DE CONTRASTE –BILATERAL
(Igualdad), unilaterales (menor o mayor), valor de la media bajo la hipótesis nula
nivel de confianza para el intervalo de estimación.
POR EJEMPLO
Si queremos averiguar si la media el gasto total en el viaje por persona (gastotal) es
mayor que 300, haremos como se muestra en la siguiente figura

PODEMOS INDICAR SU SALIDA
3. TEST T PARA MUESTRAS INDEPENDIENTES
Realiza un contraste de hipótesis de igualdades de medias entre dos muestras: Se
necesita por un lado una variable cuantitativa y por otro lado una variable dicotómica
(cualitativa o factor con dos modalidades) que indique los dos grupo.
POR EJEMPLO
Si el gasto total en el viaje por persona (gastotal), promedio es mayor para las
mujeres, para los hombres con un nivel de confianza del 95% y suponiendo que las
dos muestras tenga la misma varianza.

PODEMOS OBSERVAR SU SALIDA
PRUEBA DE HIPOTESIS E INTERVALO DE CONFIANZA PARA UNA
PROPORCION
Contraste de hipótesis nula de que la proporción de respuesta positiva después del
parto es igual a 0.5: Construya el intervalo de confianza 95% para la proporción
poblacional de respuesta positiva.

RESULTADOS
APLICACIÓN DE LOS INTERVALOS DE CONFIANZA PARA LA PRUEBA DE
HIPOTESIS
Con el conjunto de datos de Pulsos queremos estudiar la altura media de los
hombres, solamente por medio de un intervalo de confianza al nivel de
significación=0.05, o de confianza del 95% y utilizarla para contrastar la hipótesis
de si la altura media de los hombres es de 171cm.vamos a generar un conjunto de
datos con la altura de los hombre.
En el principio debemos filtrar la altura por medio del Género para separar los
hombres de las mujeres con la secuencia
>Datos>Conjunto de datos activos>Filtrar datos
Incluir todas las variables, va a generar un Data.frame con todos, los datos referido
solo con todo los datos referidos solo a Hombres:Gender==’’Male’’
>Estadísticos>medias.>Test para una muestra
Data:Alturahombres$Heigth
T=206.8254, df=56,p-vslur<2.2e-16
Alternative hypothesis:
True mean is not equal to 0
95 percent confidence interval:
70.06908 71.43969
Sample estimates:
Mena of x
70.75439

En el intervalo de confianza para la media de Alturas de hombres (70.06908,
71.43969) consideremos ahora el contraste de hipótesis sobre que la altura media
es 171cm.
Podemos pasar la altura media a pulgadas, que es la información extraída de la
tabla 171/2.54=67.3228 pulgadas
Marcela-Mora
Mini manual r-comander

Mini manual r-comander

  • 1.
    ESCUELA SUPEIOR POLITECNICADE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA Para la realización de nuestro mini manual empezaremos con una breve introducción que es hipótesis y que es prueba de hipótesis Hipótesis: Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. La hipótesis formulada con intención de rechazarla se llama hipótesis nulay se representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1). La situación se puede esquematizar: H0 cierta H0 rechazada Error tipo I (a ) H0 no rechazada Decisión correcta H0 falsa H1 cierta Decisión correcta (*) Error tipo II (b ) (*) Decisión correcta que se busca a = p(rechazar b = p(aceptar Potencia =1-b = p(rechazar H0|H0 falsa) H0|H0 H0|H0 cierta) falsa) PRUEBA DE HIPOTESIS: Es un procedimiento basado en la evidencia muestral y la teoría de probabilidad el cual se lo utiliza para determinar si la hipótesis es una afirmación razonable. R-COMMANDER R es un dialecto del lenguaje estadístico S que se distribuye bajo licencia GNU (Licencia Publica General)
  • 2.
    ¿QUE HACE R? Alos usuarios (no expertos) les permite realizar una enorme variedad de análisis estadísticos y un amplio surtido de gráficos sin demasiado esfuerzo. A los usuarios (expertos) les permite implementar técnicas propias, adaptadas a sus necesidades personales. VENTAJAS E INCONVENIENTES DEL R  Es completamente gratuito  Está disponible en la red y funciona en casi todos los sistemas operativos  Permite realizar análisis estadísticos muy sofisticados  Estimula el pensamiento crítico sobre el análisis a realizar.  El código es libre y puede ser utilizado por cualquiera  Permite intercambiar datos con otras utilidades INCONVENIENTES  El interfaz gráfico es muy simple e incomodo  No hay(menús) sino que debemos introducir desde la línea de comandos  Debemos aprender una nueva formar de pensar sobre los datos y las estructura ¿DONDE ESTA R? El repositorio central de R se encuentra en la dirección http://www.r-project.org/
  • 3.
    ESTRUCTURA DEL R Rse estructura en paquetes  Los básicos se instalan con la distribución de R  El resto, realizan tareas implementadas por usuarios de la comunidad R, se han de instalar individualmente cuando los necesitamos. INSTALACION DE R  Nos conectamos a la dirección http://cran.rstudio.com/
  • 4.
     Una vezelegidas seguimos las instrucciones .En el caso de Windows basta con dirigirse al directorio base, descargar y ejecutar el fichero. CARACTERISTICAS DEL ENTORNO DE PROGRAMACION R     Las acciones se realizan mediante ordenes en una línea de comando R distingue entre mayúsculas y minúsculas El lenguaje esta basado en funciones Los argumentos de las funciones aparecen encerrados en paréntesis COMANDOS VENTANAS Y APLICACIONES DEL SOTFWARE EN LA PRUEBA DE HIPOTESIS COMANDOS EN LA PRUEBA DE HIPOTESIS 1. TEST T PARA UNA NUESTRA Para hacer contrastes de hipótesis, para la media de una variable cuantitativa con distribución normal 2. TIPO DE CONTRASTE –BILATERAL (Igualdad), unilaterales (menor o mayor), valor de la media bajo la hipótesis nula nivel de confianza para el intervalo de estimación. POR EJEMPLO Si queremos averiguar si la media el gasto total en el viaje por persona (gastotal) es mayor que 300, haremos como se muestra en la siguiente figura PODEMOS INDICAR SU SALIDA
  • 5.
    3. TEST TPARA MUESTRAS INDEPENDIENTES Realiza un contraste de hipótesis de igualdades de medias entre dos muestras: Se necesita por un lado una variable cuantitativa y por otro lado una variable dicotómica (cualitativa o factor con dos modalidades) que indique los dos grupo. POR EJEMPLO Si el gasto total en el viaje por persona (gastotal), promedio es mayor para las mujeres, para los hombres con un nivel de confianza del 95% y suponiendo que las dos muestras tenga la misma varianza. PODEMOS OBSERVAR SU SALIDA
  • 6.
    PRUEBA DE HIPOTESISE INTERVALO DE CONFIANZA PARA UNA PROPORCION Contraste de hipótesis nula de que la proporción de respuesta positiva después del parto es igual a 0.5: Construya el intervalo de confianza 95% para la proporción poblacional de respuesta positiva. RESULTADOS
  • 7.
    APLICACIÓN DE LOSINTERVALOS DE CONFIANZA PARA LA PRUEBA DE HIPOTESIS Con el conjunto de datos de Pulsos queremos estudiar la altura media de los hombres, solamente por medio de un intervalo de confianza al nivel de significación=0.05, o de confianza del 95% y utilizarla para contrastar la hipótesis de si la altura media de los hombres es de 171cm.vamos a generar un conjunto de datos con la altura de los hombre. En el principio debemos filtrar la altura por medio del Género para separar los hombres de las mujeres con la secuencia >Datos>Conjunto de datos activos>Filtrar datos Incluir todas las variables, va a generar un Data.frame con todos, los datos referido solo con todo los datos referidos solo a Hombres:Gender==’’Male’’
  • 8.
    >Estadísticos>medias.>Test para unamuestra Data:Alturahombres$Heigth T=206.8254, df=56,p-vslur<2.2e-16 Alternative hypothesis: True mean is not equal to 0 95 percent confidence interval: 70.06908 71.43969 Sample estimates: Mena of x 70.75439 En el intervalo de confianza para la media de Alturas de hombres (70.06908, 71.43969) consideremos ahora el contraste de hipótesis sobre que la altura media es 171cm. Podemos pasar la altura media a pulgadas, que es la información extraída de la tabla 171/2.54=67.3228 pulgadas Marcela-Mora