SlideShare una empresa de Scribd logo
1 de 34
PRUEBAS PARAMÉTRICAS
 Realizar  contrastes de hipótesis sobre la
  media de una y dos poblaciones.
 Realizar contrastes de hipótesis sobre la
  proporción en una y dos poblaciones.
 Realizar   contrastes de hipótesis sobre
  varianzas en dos poblaciones.
Dentro del estudio de la inferencia estadística, se
describe como se puede tomar una muestra aleatoria
y a partir de esta muestra estimar el valor de un
parámetro poblacional en la cual se puede emplear el
método de muestreo y el teorema del valor central lo
que permite explicar como a partir de una muestra se
puede inferir algo acerca de una población, lo cual
nos lleva a definir y elaborar una distribución de
muestreo de medias muestrales que nos permite
explicar el teorema del limite central y utilizar este
teorema para encontrar las probabilidades de
obtener las distintas medias maestrales de una
población.

Pero es necesario tener conocimiento de ciertos
datos de la población como la media, la desviación
estándar o la forma de la población, pero a veces no
se dispone de esta información.
Consideremos el estudio de la media de una
población en la que se dispone de una
muestra aleatoria simple de tamaño n.
Aunque en el caso, poco frecuente, de que
se conozca la varianza de la población se
podría utilizar la distribución Normal, y
cuando el tamaño de la muestra sea grande
(n≥50) la distribución t de student se puede
reemplazar por la N (0, 1), en general se
empleará la propia t de student.
Consideremos el fichero: Datos → Conjunto de
datos en paquete → Leer conjunto de datos
desde paquete adjunto →car→Davis→Aceptar
Este conjunto de datos es una muestra
(n=1000) aleatoria simple de la población
adulta de un municipio de Andaluz. Las
variables con las que vamos a trabajar son:
peso(height), altura(weight), sex(M)
PROBLEMA:
 Se desea probar con un nivel de confianza
 del 95% que el promedio de la altura no es
 significativamente diferente al promedio
 poblacional µ=175.

Solución.
  Ya que n>30 no necesitamos la hipótesis de
  normalidad de los datos. Utilizamos una
  distribución t student, y un contraste
  bilateral.
1.   Planteamiento de la hipótesis
     H1: µ≠175
     H0: µ=175
2.   Nivel de significancia
     α=0,05
3.   Criterio
     Rechazar H0 si p_valor<α
4.   Cálculos
     Elegimos la opción del menú: Estadísticos
     →Medias →Test t para una muestra, con
     esta opción se abre una ventana
   Debemos elegir una sola variable, seleccionamos
    weight (altura)
   Indicamos cuál es la hipótesis alternativa. En nuestro
    caso elegimos la opción de un test bilateral.
   Especificamos el valor hipotético con el que estamos
    comparando la media, en nuestro caso 175.
   Por último especificamos el nivel de confianza.
   Hacemos clic en Aceptar.
   Los resultados se muestran en la ventana de
    resultados.
One Sample t-test
       data: Davis$weight
       t = -102.3067, df = 199, p-value < 2.2e-16
       alternative hypothesis: true mean is not equal to 175
       95 percent confidence interval:
        63.69518 67.90482
       sample estimates:
       mean of x
           65.8

Análisis:
 Primero nos recuerda que estamos analizando la
  variable Davis $weight
 El estadístico de contraste es t=-102.3067, los grados
  de libertad df=199 y el p_valor (tc)<2.2e-16

5. Decisión
  Ya que p_valor<α rechazamos H0, es decir “La altura
  promedio del grupo no es significativamente
  diferente de 175 ”
Sea X1, X2,..., Xn una muestra de tamaño n procedente de una distribución normal
X ≈N(μx,σx) y sea Y1, Y2,..., Ym una muestra de tamaño m de otra población normal Y
≈N(μy,σy) , independiente de la anterior. Para contrastar la igualdad de medias, el
estadístico cambia dependiendo de que se asuman varianzas poblacionales desconocidas
pero iguales o que se asuman desiguales. De forma general ambos casos se pueden
formular de la forma siguiente:
   1. H0 :μx – μy ( = d0 )
             𝑋 −𝑌 −(𝑑 0 )
   2.   𝐸=     𝜎 (𝑋 −𝑌 )
                          ~𝑡 𝑐   si H0 es cierta
        En el caso de varianzas iguales v=n+m-2.
        En el caso de varianzas distintas v, además de depender de n y m, depende de las
        varianzas muestrales: 𝑆 2 =
                                𝑋             (𝑋 𝑖 − 𝑋 )/(𝑛 − 1) y 𝑆 2 =
                                                                     𝑌     (𝑌𝑖 − 𝑌)/(𝑚 − 1)

   3. En función de la hipótesis alternativa H1 y del nivel de significación α que elija el
      investigador, se determina la región crítica o de rechazo. La hipótesis alternativa
        puede ser bilateral (H1: μx – μy ≠ 0), unilateral a la derecha (H1: μx – μy > 0) o
        unilateral a la izquierda (H1: μx – μy < 0) e indica qué cola o colas de la
      distribución de E se eligen. La probabilidad de dicha cola o colas debe ser igual a
      α.
   4. Se calcula el valor de E en la muestra y se rechaza H0 si ese valor pertenece a la
      región crítica. Alternativamente, para el valor de E en la muestra, e, se calcula su
      p-valor y se rechaza si es menor que α.
Consideremos el fichero: Datos → Conjunto de
 datos en paquete → Leer conjunto de datos
 desde                                paquete
 adjunto→car→Leinhardt→Aceptar

 Este conjunto de datos representan información
 sobre la mortalidad infantil en diversos países
 del mundo.

PROBLEMA:
  Se desea probar con un nivel de confianza del
  95% que los promedios entre las variables
  “income” y “oil” son significativamente
  diferentes.
Solución.
  Utilizamos una distribución t student, para la
  diferencia   de    medias    de    poblaciones
  independiente mediante un contrate bilateral.

1.   Planteamiento de la hipótesis
     H1: µoil≠ µincome
     H0: µoil=µincome
2.   Nivel de significancia
     α=0,05
3.   Criterio
     Rechazar H0 si p_valor <α
4.   Cálculos
     Elegimos la opción del menú: Estadísticos
     →Medias         →Test   t    para  muestras
     independientes, con esta opción se abre una
     ventana
Resultados:
      Welch Two Sample t-test

      data: income by oil
      t = 0.1349, df = 12.03, p-value = 0.8949
      alternative hypothesis: true difference in means is not
      equal to 0
      95 percent confidence interval:
       -704.0573 797.0504
      sample estimates:
       mean in group no mean in group yes
            1002.0521        955.5556
Análisis:
 Primero     nos   recuerda    que     estamos
  analizando las variables income y oil
 El estadístico de contraste es t= 0.1349, los
  grados de libertad df=12.03 y el p_valor
  (tc)=0,8949

5. Decisión
  Ya que p_valor>α aceptamos H0, es decir “El
  promedio de la variable oil no es diferente al
  promedio de la variable income ”
En este caso se considera una muestra X1, X2,..., Xn de tamaño n procedente de una
distribución normal N(μx,σx) y una muestra Y1, Y2,..., Yn de tamaño también n, de otra
población normal Y ≈N(μy,σy), no necesariamente independientes. En este caso se
pueden reducir los datos a una sola muestra D1, D2,..., Dn , donde cada Di =Xi - Yi , que
tendrá también distribución normal con media μD = μX−μY .

Este caso es habitual cuando se toman medidas repetidas en los mismos individuos de una
población, por ejemplo, antes y después de someterlos a un tratamiento.

                                                                                         𝐷 −𝑑 0
Para contrastar: H0: μX−μY. ( μD = d0 =0) se utiliza el estadístico de contraste 𝐸 =     𝑆𝐷
                                                                                               𝑛
que sigue una distribución t con n-1 grados de libertad, si H0 es cierta.

De modo que, por ejemplo, para un contraste unilateral a la derecha, se rechaza H0 con
un nivel de significación α si P( tn- 1 >e)< α siendo e el valor de E en la muestra observada.
El encargado de formación de una empresa
pretende mejorar el rendimiento de los
trabajadores. Para comprobar la eficacia realiza
un curso, para ello elige al azar una muestra de
30 trabajadores y para cada uno contabiliza el
tiempo medio (en segundos) que tardan ejecutar
una tarea.

Basándose en los datos de la muestra, ¿puede
concluir el encargado que el curso es efectivo?

Considerar un nivel de significancia del 5%.
La información recabada es la siguiente:
                   ANTES   DESPUES
                     97       96
                     99       98
                    100       99
                     97       94
                    102      100
                    109      100
                     95       92
                     97       95
                    101      100
                     98       98
                    100       94
                     94       93
                     98       92
                     98       98
                    101      100
                    110       99
                    109       95
                     96       92
                    108      101
                    107      102
                     95       93
                     99       97
                    100       94
                    109      106
                     97       94
                    107      104
                     95       90
                     93       92
                    109      104
                    103       97
Solución.
  Utilizamos una distribución t student,         para   datos
  relacionados y un contrate unilateral.

     Denotemos por µDC al promedio de los tiempos medios que
     tardan los trabajadores en realizar la tarea después del
     curso y µAC al mismo promedio antes del curso.

1.    Planteamiento de la hipótesis
      H1: µDC < µAC
      H0: µDC = µAC
2.    Nivel de significancia
      α=0,05
3.    Criterio
      Rechazar H0 si p_valor <α
4.    Cálculos
      Antes de realizar los cálculos, introducimos la
      información recabada por el formador. Para ellos
      seguimos los siguientes pasos.
Elegimos la opción del menú: Estadísticos Datos
→ Nuevo conjunto de datos.
Se muestra una ventana donde nos piden
Introducir el nombre del conjunto de datos:
EJERCICIO



Posteriormente se despliega una ventana
como una hoja de excel: Editor de datos
 Se definen las variables: ANTES, DESPUES y se
  ingresan los datos.
 Antes de realizar el análisis, se cierra la ventana
  del editor de datos, pues por defecto R
  almacena la información.

Cálculos
 Elegimos la opción del menú: Estadísticos
 →Medias →Test t para datos relacionados, con
 esta opción se abre la ventana:
Seleccionamos la primera y segunda variable;
 así como el contraste unilateral.

Resultados:
     Paired t-test

     data: EJERCICIO$DESPUES and EJERCICIO$ANTES
     t = -6.2972, df = 29, p-value = 3.535e-07
     alternative hypothesis: true difference in means is less
     than 0
     95 percent confidence interval:
          -Inf -2.774681
     sample estimates:
     mean of the differences
                   -3.8
Análisis:
 Primero     nos   recuerda    que    estamos
  analizando las variables DESPUES y ANTES.
 El estadístico de contraste es t=-6.2972, los
  grados de libertad df=29 y el p_valor (tc)=
  3.535e-07

5. Decisión
  Ya que p_valor<α rechazamos H0, es decir “El
  curso no disminuye el promedio que tardan
  los trabajadores en realizar la tarea.”
Es una prueba (de significación para análisis no paramétrico) estadística que se utiliza
para evaluar hipótesis correlacionales que relacionan dos variables categóricas. El nivel
de medición de las variables es nominal u ordinal (aplicada a sujetos).

La 2 se calcula utilizando una tabla cruzada de dos dimensiones, cada dimensión
contiene una variable y cada variable se subdivide a la vez en dos o más categorías.

                                                         (f o f e ) 2
El 2 calculado se obtiene con la siguiente fórmula : 2 =
                                                              fe
PROBLEMA:
 Mediante un estudio se desea determinar si
 el voto de apoyo o no al gobierno depende
 del género en más de un 75% de las veces.
 Para lo cual se ha encuestado a 76 personas.
 Los resultados se han ingresado a través del
 editor de r-commander, tal como muestra
 la figura

                              VARIABLES
Solución.
Por ser un estudio de tipo correlacional, la prueba se
realiza con la Chi Cuadrado.

1.   Planteamiento de la hipótesis
     H0: p=0.75
     H1: p>0.75
2.   Nivel de significancia
     α=0,05
3.   Criterio
     Rechazar H0 si p_valor <α
4.   Cálculos
     Elegimos     la   opción    del    menú:   Estadísticos
     →Proporciones →Test de proporciones para una
     muestra, con esta opción se abre una ventana; en la
     seleccionamos la variable sexo, la hipótesis nula
     0,75, el nivel de significancia, la prueba a una cola.
Resultados:
      1-sample proportions test without continuity correction

      data: rbind(.Table), null probability 0.75
      X-squared = 43.8596, df = 1, p-value = 1
      alternative hypothesis: true p is greater than 0.75
      95 percent confidence interval:
       0.332186 1.000000
      sample estimates:
           p
      0.4210526
Análisis:
 Primero nos recuerda que es una test para la
  proporción de una muestra.
 Especifica el valor hipotético en la hipótesis
  nula 0.75
 Proporciona el valor del estadístico chi y el
  p_valor (Xc)= 1

5. Decisión
  Ya que p_valor>α aceptamos H0, es decir “El
  porcentaje de resultados no está por encima
  de 75%”
Se utiliza para analizar (sobre una variable) si dos proporciones de dos grupos difieren
significativamente entre sí.

La variable de los grupos debe ser medida en proporciones o porcentajes. Se aplica la
siguiente fórmula de puntuación z para proporciones:

                                         p1 p 2
                                  z
                                        p1q 1 p 2 q 2
                                        n1     n2
donde:

p1 proporción del primer grupo y n 1 el número de sus elementos
p 2 proporción del segundo grupo y n 2 el número de sus elementos
PROBLEMA:
 Se realizó una prueba de rendimiento a dos
 grupos A y B de 30 y 27 alumnos
 respectivamente.
 Se desea probar que el porcentaje de muy
 buenos del grupo A es significativamente
 superior al porcentaje de muy buenos del
 grupo B.

Solución.
  Utilizamos una prueba de diferencia de
  proporciones para dos muestras.
1.   Planteamiento de la hipótesis
     H1 : π 1 > π 2
     H0 : π 1 = π 2
2.   Nivel de significancia
     α=0,05
3.   Criterio
     Rechazar H0 si p_valor >1.64
4.   Cálculos
     Antes de realizar los cálculos, introducimos
     la información en el editor de r-
     commander.
Elegimos la opción del menú: Estadísticos
→Proporciones →Test de proporciones
para dos muestra, con esta opción se abre
una ventana; en la seleccionamos: grupos
grupo1, variable explicada grupo2; la
hipótesis nula 0,75, el nivel de confianza
y el tipo de prueba (una cola.)
Resultados:

     2-sample test for equality of proportions without
     continuity correction

     data: .Table
     X-squared = 5.5588, df = 1, p-value = 0.009194
     alternative hypothesis: greater
     95 percent confidence interval:
      0.3160998 1.0000000
     sample estimates:
     prop 1 prop 2
       1.0 0.5
Análisis:
 Primero nos recuerda que es una test para la
  proporción de dos muestras.
 Proporciona   el valor de p_valor (Xc)=
  0.009194

5. Decisión
  Ya que p_valor<1.64 rechazamos H0, es decir
  “El promedio de rendimiento del grupo A es
  significativamente diferente al promedio de
  rendimiento del grupo B”

Más contenido relacionado

La actualidad más candente

PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFBPRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFBLola FFB
 
Contraste de hipótesis Bilateral y Unilateral
Contraste de hipótesis Bilateral y UnilateralContraste de hipótesis Bilateral y Unilateral
Contraste de hipótesis Bilateral y Unilateralmiguelpi
 
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...JAVIER SOLIS NOYOLA
 
Contraste de hipotesis para la media
Contraste de hipotesis para la mediaContraste de hipotesis para la media
Contraste de hipotesis para la mediamiguelpi
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisvaro99
 
Hipotesis estadistica
Hipotesis estadisticaHipotesis estadistica
Hipotesis estadisticaketoru52
 
Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4Luis Quiazua
 
Contraste de hipotesis1 tema de clase
Contraste de hipotesis1   tema de claseContraste de hipotesis1   tema de clase
Contraste de hipotesis1 tema de claseeira1779
 

La actualidad más candente (20)

PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFBPRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
 
estadistica
estadisticaestadistica
estadistica
 
Prueba De HipóTesis
Prueba De HipóTesisPrueba De HipóTesis
Prueba De HipóTesis
 
Actividad 5.c respuestas
Actividad 5.c respuestasActividad 5.c respuestas
Actividad 5.c respuestas
 
Contraste de hipótesis Bilateral y Unilateral
Contraste de hipótesis Bilateral y UnilateralContraste de hipótesis Bilateral y Unilateral
Contraste de hipótesis Bilateral y Unilateral
 
Probabilidadades Var Aleatorias
Probabilidadades Var AleatoriasProbabilidadades Var Aleatorias
Probabilidadades Var Aleatorias
 
Capítulo viii
Capítulo viiiCapítulo viii
Capítulo viii
 
Felix castro estadistica ii
Felix castro estadistica iiFelix castro estadistica ii
Felix castro estadistica ii
 
EstimacióN Y Prueba De HipóTesis
EstimacióN Y Prueba De HipóTesisEstimacióN Y Prueba De HipóTesis
EstimacióN Y Prueba De HipóTesis
 
Prueba de Hipótesis
Prueba de HipótesisPrueba de Hipótesis
Prueba de Hipótesis
 
Taller de herramienta 1
Taller de herramienta 1Taller de herramienta 1
Taller de herramienta 1
 
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
 
Pruebas de hipótesis 1
Pruebas de hipótesis 1Pruebas de hipótesis 1
Pruebas de hipótesis 1
 
Contraste de hipotesis para la media
Contraste de hipotesis para la mediaContraste de hipotesis para la media
Contraste de hipotesis para la media
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02Prueba de hipotesis para proporciones Est ind clase02
Prueba de hipotesis para proporciones Est ind clase02
 
Hipotesis estadistica
Hipotesis estadisticaHipotesis estadistica
Hipotesis estadistica
 
Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4Prueba de hipotesis grupo 4
Prueba de hipotesis grupo 4
 
Contraste de hipotesis1 tema de clase
Contraste de hipotesis1   tema de claseContraste de hipotesis1   tema de clase
Contraste de hipotesis1 tema de clase
 
Prueba de hipótesis 2016
Prueba de hipótesis 2016Prueba de hipótesis 2016
Prueba de hipótesis 2016
 

Similar a Contraste de hipótesis

Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianzaKhriiz Rmz
 
Interpretar intervalos
Interpretar intervalosInterpretar intervalos
Interpretar intervalosIsrael Arroyo
 
Estad quimestimacionintconfianza
Estad quimestimacionintconfianzaEstad quimestimacionintconfianza
Estad quimestimacionintconfianzaLúaz Garcia
 
Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadisticahoteles1
 
Trabajo hipotesis
Trabajo hipotesisTrabajo hipotesis
Trabajo hipotesishoteles1
 
INTERVALOS DE CONFIANZA
INTERVALOS DE CONFIANZAINTERVALOS DE CONFIANZA
INTERVALOS DE CONFIANZARoza Meza
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianzaRoza Meza
 
Universidad Tecnológica de Torreón
Universidad Tecnológica de TorreónUniversidad Tecnológica de Torreón
Universidad Tecnológica de TorreónAlejandra Cordero
 
Estimacion. limites o intervalos de confianza para la media y para las propor...
Estimacion. limites o intervalos de confianza para la media y para las propor...Estimacion. limites o intervalos de confianza para la media y para las propor...
Estimacion. limites o intervalos de confianza para la media y para las propor...eraperez
 

Similar a Contraste de hipótesis (20)

Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 
Unidad 5 Inferencia estadística
Unidad 5 Inferencia estadísticaUnidad 5 Inferencia estadística
Unidad 5 Inferencia estadística
 
Interpretar intervalos
Interpretar intervalosInterpretar intervalos
Interpretar intervalos
 
Distribución T de Student
Distribución T de StudentDistribución T de Student
Distribución T de Student
 
Estad quimestimacionintconfianza
Estad quimestimacionintconfianzaEstad quimestimacionintconfianza
Estad quimestimacionintconfianza
 
Estimación estadística
Estimación estadísticaEstimación estadística
Estimación estadística
 
Consulta
ConsultaConsulta
Consulta
 
Semana 3 1_
Semana 3 1_Semana 3 1_
Semana 3 1_
 
Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadistica
 
Unidad5
Unidad5 Unidad5
Unidad5
 
tema 4.pdf
tema 4.pdftema 4.pdf
tema 4.pdf
 
Trabajo hipotesis
Trabajo hipotesisTrabajo hipotesis
Trabajo hipotesis
 
Unidad5 angel wha
Unidad5 angel whaUnidad5 angel wha
Unidad5 angel wha
 
INTERVALOS DE CONFIANZA
INTERVALOS DE CONFIANZAINTERVALOS DE CONFIANZA
INTERVALOS DE CONFIANZA
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 
Universidad Tecnológica de Torreón
Universidad Tecnológica de TorreónUniversidad Tecnológica de Torreón
Universidad Tecnológica de Torreón
 
Tarea 7 mate
Tarea 7 mateTarea 7 mate
Tarea 7 mate
 
PRUEBA DE HIPOTESIS 2.pptx
PRUEBA DE HIPOTESIS  2.pptxPRUEBA DE HIPOTESIS  2.pptx
PRUEBA DE HIPOTESIS 2.pptx
 
Estimacion. limites o intervalos de confianza para la media y para las propor...
Estimacion. limites o intervalos de confianza para la media y para las propor...Estimacion. limites o intervalos de confianza para la media y para las propor...
Estimacion. limites o intervalos de confianza para la media y para las propor...
 
Estimacion
EstimacionEstimacion
Estimacion
 

Más de Silvia Haro

Teoria funciones
Teoria funcionesTeoria funciones
Teoria funcionesSilvia Haro
 
Bloque academico,silvia haro
Bloque  academico,silvia haroBloque  academico,silvia haro
Bloque academico,silvia haroSilvia Haro
 
Fase de planificacion
Fase de planificacionFase de planificacion
Fase de planificacionSilvia Haro
 
FASE DE PLANIFICACIÓN
FASE DE PLANIFICACIÓNFASE DE PLANIFICACIÓN
FASE DE PLANIFICACIÓNSilvia Haro
 
C:\Documents And Settings\Administrador\Mis Documentos\Elpaquetedegalletas
C:\Documents And Settings\Administrador\Mis Documentos\ElpaquetedegalletasC:\Documents And Settings\Administrador\Mis Documentos\Elpaquetedegalletas
C:\Documents And Settings\Administrador\Mis Documentos\ElpaquetedegalletasSilvia Haro
 
C:\Documents And Settings\Administrador\Mis Documentos\MéTodos NuméRicos Intr...
C:\Documents And Settings\Administrador\Mis Documentos\MéTodos NuméRicos Intr...C:\Documents And Settings\Administrador\Mis Documentos\MéTodos NuméRicos Intr...
C:\Documents And Settings\Administrador\Mis Documentos\MéTodos NuméRicos Intr...Silvia Haro
 
Limites, ejercicios
Limites, ejerciciosLimites, ejercicios
Limites, ejerciciosSilvia Haro
 
Cálculo diferencial
Cálculo diferencialCálculo diferencial
Cálculo diferencialSilvia Haro
 

Más de Silvia Haro (14)

Integrales
IntegralesIntegrales
Integrales
 
Integrales
IntegralesIntegrales
Integrales
 
Reglas
ReglasReglas
Reglas
 
Teoria funciones
Teoria funcionesTeoria funciones
Teoria funciones
 
Elmuestreo
ElmuestreoElmuestreo
Elmuestreo
 
Bloque academico,silvia haro
Bloque  academico,silvia haroBloque  academico,silvia haro
Bloque academico,silvia haro
 
Fase de planificacion
Fase de planificacionFase de planificacion
Fase de planificacion
 
FASE DE PLANIFICACIÓN
FASE DE PLANIFICACIÓNFASE DE PLANIFICACIÓN
FASE DE PLANIFICACIÓN
 
Diosmio
DiosmioDiosmio
Diosmio
 
C:\Documents And Settings\Administrador\Mis Documentos\Elpaquetedegalletas
C:\Documents And Settings\Administrador\Mis Documentos\ElpaquetedegalletasC:\Documents And Settings\Administrador\Mis Documentos\Elpaquetedegalletas
C:\Documents And Settings\Administrador\Mis Documentos\Elpaquetedegalletas
 
C:\Documents And Settings\Administrador\Mis Documentos\MéTodos NuméRicos Intr...
C:\Documents And Settings\Administrador\Mis Documentos\MéTodos NuméRicos Intr...C:\Documents And Settings\Administrador\Mis Documentos\MéTodos NuméRicos Intr...
C:\Documents And Settings\Administrador\Mis Documentos\MéTodos NuméRicos Intr...
 
Limites, ejercicios
Limites, ejerciciosLimites, ejercicios
Limites, ejercicios
 
Cálculo diferencial
Cálculo diferencialCálculo diferencial
Cálculo diferencial
 
Limites
LimitesLimites
Limites
 

Contraste de hipótesis

  • 2.  Realizar contrastes de hipótesis sobre la media de una y dos poblaciones.  Realizar contrastes de hipótesis sobre la proporción en una y dos poblaciones.  Realizar contrastes de hipótesis sobre varianzas en dos poblaciones.
  • 3. Dentro del estudio de la inferencia estadística, se describe como se puede tomar una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se puede emplear el método de muestreo y el teorema del valor central lo que permite explicar como a partir de una muestra se puede inferir algo acerca de una población, lo cual nos lleva a definir y elaborar una distribución de muestreo de medias muestrales que nos permite explicar el teorema del limite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias maestrales de una población. Pero es necesario tener conocimiento de ciertos datos de la población como la media, la desviación estándar o la forma de la población, pero a veces no se dispone de esta información.
  • 4. Consideremos el estudio de la media de una población en la que se dispone de una muestra aleatoria simple de tamaño n. Aunque en el caso, poco frecuente, de que se conozca la varianza de la población se podría utilizar la distribución Normal, y cuando el tamaño de la muestra sea grande (n≥50) la distribución t de student se puede reemplazar por la N (0, 1), en general se empleará la propia t de student.
  • 5. Consideremos el fichero: Datos → Conjunto de datos en paquete → Leer conjunto de datos desde paquete adjunto →car→Davis→Aceptar
  • 6. Este conjunto de datos es una muestra (n=1000) aleatoria simple de la población adulta de un municipio de Andaluz. Las variables con las que vamos a trabajar son: peso(height), altura(weight), sex(M)
  • 7. PROBLEMA: Se desea probar con un nivel de confianza del 95% que el promedio de la altura no es significativamente diferente al promedio poblacional µ=175. Solución. Ya que n>30 no necesitamos la hipótesis de normalidad de los datos. Utilizamos una distribución t student, y un contraste bilateral.
  • 8. 1. Planteamiento de la hipótesis H1: µ≠175 H0: µ=175 2. Nivel de significancia α=0,05 3. Criterio Rechazar H0 si p_valor<α 4. Cálculos Elegimos la opción del menú: Estadísticos →Medias →Test t para una muestra, con esta opción se abre una ventana
  • 9. Debemos elegir una sola variable, seleccionamos weight (altura)  Indicamos cuál es la hipótesis alternativa. En nuestro caso elegimos la opción de un test bilateral.  Especificamos el valor hipotético con el que estamos comparando la media, en nuestro caso 175.  Por último especificamos el nivel de confianza.  Hacemos clic en Aceptar.  Los resultados se muestran en la ventana de resultados.
  • 10. One Sample t-test data: Davis$weight t = -102.3067, df = 199, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 175 95 percent confidence interval: 63.69518 67.90482 sample estimates: mean of x 65.8 Análisis:  Primero nos recuerda que estamos analizando la variable Davis $weight  El estadístico de contraste es t=-102.3067, los grados de libertad df=199 y el p_valor (tc)<2.2e-16 5. Decisión Ya que p_valor<α rechazamos H0, es decir “La altura promedio del grupo no es significativamente diferente de 175 ”
  • 11. Sea X1, X2,..., Xn una muestra de tamaño n procedente de una distribución normal X ≈N(μx,σx) y sea Y1, Y2,..., Ym una muestra de tamaño m de otra población normal Y ≈N(μy,σy) , independiente de la anterior. Para contrastar la igualdad de medias, el estadístico cambia dependiendo de que se asuman varianzas poblacionales desconocidas pero iguales o que se asuman desiguales. De forma general ambos casos se pueden formular de la forma siguiente: 1. H0 :μx – μy ( = d0 ) 𝑋 −𝑌 −(𝑑 0 ) 2. 𝐸= 𝜎 (𝑋 −𝑌 ) ~𝑡 𝑐 si H0 es cierta En el caso de varianzas iguales v=n+m-2. En el caso de varianzas distintas v, además de depender de n y m, depende de las varianzas muestrales: 𝑆 2 = 𝑋 (𝑋 𝑖 − 𝑋 )/(𝑛 − 1) y 𝑆 2 = 𝑌 (𝑌𝑖 − 𝑌)/(𝑚 − 1) 3. En función de la hipótesis alternativa H1 y del nivel de significación α que elija el investigador, se determina la región crítica o de rechazo. La hipótesis alternativa puede ser bilateral (H1: μx – μy ≠ 0), unilateral a la derecha (H1: μx – μy > 0) o unilateral a la izquierda (H1: μx – μy < 0) e indica qué cola o colas de la distribución de E se eligen. La probabilidad de dicha cola o colas debe ser igual a α. 4. Se calcula el valor de E en la muestra y se rechaza H0 si ese valor pertenece a la región crítica. Alternativamente, para el valor de E en la muestra, e, se calcula su p-valor y se rechaza si es menor que α.
  • 12. Consideremos el fichero: Datos → Conjunto de datos en paquete → Leer conjunto de datos desde paquete adjunto→car→Leinhardt→Aceptar Este conjunto de datos representan información sobre la mortalidad infantil en diversos países del mundo. PROBLEMA: Se desea probar con un nivel de confianza del 95% que los promedios entre las variables “income” y “oil” son significativamente diferentes.
  • 13. Solución. Utilizamos una distribución t student, para la diferencia de medias de poblaciones independiente mediante un contrate bilateral. 1. Planteamiento de la hipótesis H1: µoil≠ µincome H0: µoil=µincome 2. Nivel de significancia α=0,05 3. Criterio Rechazar H0 si p_valor <α 4. Cálculos Elegimos la opción del menú: Estadísticos →Medias →Test t para muestras independientes, con esta opción se abre una ventana
  • 14. Resultados: Welch Two Sample t-test data: income by oil t = 0.1349, df = 12.03, p-value = 0.8949 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -704.0573 797.0504 sample estimates: mean in group no mean in group yes 1002.0521 955.5556
  • 15. Análisis:  Primero nos recuerda que estamos analizando las variables income y oil  El estadístico de contraste es t= 0.1349, los grados de libertad df=12.03 y el p_valor (tc)=0,8949 5. Decisión Ya que p_valor>α aceptamos H0, es decir “El promedio de la variable oil no es diferente al promedio de la variable income ”
  • 16. En este caso se considera una muestra X1, X2,..., Xn de tamaño n procedente de una distribución normal N(μx,σx) y una muestra Y1, Y2,..., Yn de tamaño también n, de otra población normal Y ≈N(μy,σy), no necesariamente independientes. En este caso se pueden reducir los datos a una sola muestra D1, D2,..., Dn , donde cada Di =Xi - Yi , que tendrá también distribución normal con media μD = μX−μY . Este caso es habitual cuando se toman medidas repetidas en los mismos individuos de una población, por ejemplo, antes y después de someterlos a un tratamiento. 𝐷 −𝑑 0 Para contrastar: H0: μX−μY. ( μD = d0 =0) se utiliza el estadístico de contraste 𝐸 = 𝑆𝐷 𝑛 que sigue una distribución t con n-1 grados de libertad, si H0 es cierta. De modo que, por ejemplo, para un contraste unilateral a la derecha, se rechaza H0 con un nivel de significación α si P( tn- 1 >e)< α siendo e el valor de E en la muestra observada.
  • 17. El encargado de formación de una empresa pretende mejorar el rendimiento de los trabajadores. Para comprobar la eficacia realiza un curso, para ello elige al azar una muestra de 30 trabajadores y para cada uno contabiliza el tiempo medio (en segundos) que tardan ejecutar una tarea. Basándose en los datos de la muestra, ¿puede concluir el encargado que el curso es efectivo? Considerar un nivel de significancia del 5%.
  • 18. La información recabada es la siguiente: ANTES DESPUES 97 96 99 98 100 99 97 94 102 100 109 100 95 92 97 95 101 100 98 98 100 94 94 93 98 92 98 98 101 100 110 99 109 95 96 92 108 101 107 102 95 93 99 97 100 94 109 106 97 94 107 104 95 90 93 92 109 104 103 97
  • 19. Solución. Utilizamos una distribución t student, para datos relacionados y un contrate unilateral. Denotemos por µDC al promedio de los tiempos medios que tardan los trabajadores en realizar la tarea después del curso y µAC al mismo promedio antes del curso. 1. Planteamiento de la hipótesis H1: µDC < µAC H0: µDC = µAC 2. Nivel de significancia α=0,05 3. Criterio Rechazar H0 si p_valor <α 4. Cálculos Antes de realizar los cálculos, introducimos la información recabada por el formador. Para ellos seguimos los siguientes pasos.
  • 20. Elegimos la opción del menú: Estadísticos Datos → Nuevo conjunto de datos. Se muestra una ventana donde nos piden Introducir el nombre del conjunto de datos: EJERCICIO Posteriormente se despliega una ventana como una hoja de excel: Editor de datos
  • 21.  Se definen las variables: ANTES, DESPUES y se ingresan los datos.  Antes de realizar el análisis, se cierra la ventana del editor de datos, pues por defecto R almacena la información. Cálculos Elegimos la opción del menú: Estadísticos →Medias →Test t para datos relacionados, con esta opción se abre la ventana:
  • 22. Seleccionamos la primera y segunda variable; así como el contraste unilateral. Resultados: Paired t-test data: EJERCICIO$DESPUES and EJERCICIO$ANTES t = -6.2972, df = 29, p-value = 3.535e-07 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: -Inf -2.774681 sample estimates: mean of the differences -3.8
  • 23. Análisis:  Primero nos recuerda que estamos analizando las variables DESPUES y ANTES.  El estadístico de contraste es t=-6.2972, los grados de libertad df=29 y el p_valor (tc)= 3.535e-07 5. Decisión Ya que p_valor<α rechazamos H0, es decir “El curso no disminuye el promedio que tardan los trabajadores en realizar la tarea.”
  • 24. Es una prueba (de significación para análisis no paramétrico) estadística que se utiliza para evaluar hipótesis correlacionales que relacionan dos variables categóricas. El nivel de medición de las variables es nominal u ordinal (aplicada a sujetos). La 2 se calcula utilizando una tabla cruzada de dos dimensiones, cada dimensión contiene una variable y cada variable se subdivide a la vez en dos o más categorías. (f o f e ) 2 El 2 calculado se obtiene con la siguiente fórmula : 2 = fe
  • 25. PROBLEMA: Mediante un estudio se desea determinar si el voto de apoyo o no al gobierno depende del género en más de un 75% de las veces. Para lo cual se ha encuestado a 76 personas. Los resultados se han ingresado a través del editor de r-commander, tal como muestra la figura VARIABLES
  • 26. Solución. Por ser un estudio de tipo correlacional, la prueba se realiza con la Chi Cuadrado. 1. Planteamiento de la hipótesis H0: p=0.75 H1: p>0.75 2. Nivel de significancia α=0,05 3. Criterio Rechazar H0 si p_valor <α 4. Cálculos Elegimos la opción del menú: Estadísticos →Proporciones →Test de proporciones para una muestra, con esta opción se abre una ventana; en la seleccionamos la variable sexo, la hipótesis nula 0,75, el nivel de significancia, la prueba a una cola.
  • 27. Resultados: 1-sample proportions test without continuity correction data: rbind(.Table), null probability 0.75 X-squared = 43.8596, df = 1, p-value = 1 alternative hypothesis: true p is greater than 0.75 95 percent confidence interval: 0.332186 1.000000 sample estimates: p 0.4210526
  • 28. Análisis:  Primero nos recuerda que es una test para la proporción de una muestra.  Especifica el valor hipotético en la hipótesis nula 0.75  Proporciona el valor del estadístico chi y el p_valor (Xc)= 1 5. Decisión Ya que p_valor>α aceptamos H0, es decir “El porcentaje de resultados no está por encima de 75%”
  • 29. Se utiliza para analizar (sobre una variable) si dos proporciones de dos grupos difieren significativamente entre sí. La variable de los grupos debe ser medida en proporciones o porcentajes. Se aplica la siguiente fórmula de puntuación z para proporciones: p1 p 2 z p1q 1 p 2 q 2 n1 n2 donde: p1 proporción del primer grupo y n 1 el número de sus elementos p 2 proporción del segundo grupo y n 2 el número de sus elementos
  • 30. PROBLEMA: Se realizó una prueba de rendimiento a dos grupos A y B de 30 y 27 alumnos respectivamente. Se desea probar que el porcentaje de muy buenos del grupo A es significativamente superior al porcentaje de muy buenos del grupo B. Solución. Utilizamos una prueba de diferencia de proporciones para dos muestras.
  • 31. 1. Planteamiento de la hipótesis H1 : π 1 > π 2 H0 : π 1 = π 2 2. Nivel de significancia α=0,05 3. Criterio Rechazar H0 si p_valor >1.64 4. Cálculos Antes de realizar los cálculos, introducimos la información en el editor de r- commander.
  • 32. Elegimos la opción del menú: Estadísticos →Proporciones →Test de proporciones para dos muestra, con esta opción se abre una ventana; en la seleccionamos: grupos grupo1, variable explicada grupo2; la hipótesis nula 0,75, el nivel de confianza y el tipo de prueba (una cola.)
  • 33. Resultados: 2-sample test for equality of proportions without continuity correction data: .Table X-squared = 5.5588, df = 1, p-value = 0.009194 alternative hypothesis: greater 95 percent confidence interval: 0.3160998 1.0000000 sample estimates: prop 1 prop 2 1.0 0.5
  • 34. Análisis:  Primero nos recuerda que es una test para la proporción de dos muestras.  Proporciona el valor de p_valor (Xc)= 0.009194 5. Decisión Ya que p_valor<1.64 rechazamos H0, es decir “El promedio de rendimiento del grupo A es significativamente diferente al promedio de rendimiento del grupo B”